内容摘要:军事装备属性抽取作为构建军用知识库的重要组成部分,具有重要的研究价值和理论意义。针对自由文本中军事装备属性抽取问题,提出了一种面向自由文本的无监督军事装备属性三元组抽取方法。首先利用统计分析的方法对属性三元组在子句中的分布规律进行研究,然后针对分布规律提出一种基于频繁模式挖掘的属性指示词抽取算法,并以抽取出的属性指示词为触发词,结合抽取规则和过滤规则进一步完成三元组的抽取。
关键词:军事装备;抽取;指挥信息系统学院;关键词;计算机应用;分布;研究;解放军;文本;知识库
作者简介:
【机构】 解放军理工大学 指挥信息系统学院仿真与数据中心; 南京 21000;
【摘要】 军事装备属性抽取作为构建军用知识库的重要组成部分,具有重要的研究价值和理论意义。针对自由文本中军事装备属性抽取问题,提出了一种面向自由文本的无监督军事装备属性三元组抽取方法。首先利用统计分析的方法对属性三元组在子句中的分布规律进行研究,然后针对分布规律提出一种基于频繁模式挖掘的属性指示词抽取算法,并以抽取出的属性指示词为触发词,结合抽取规则和过滤规则进一步完成三元组的抽取。实验结果表明该方法能够有效的抽取出军事装备属性三元组,其平均准确率达到了88.1%。
【关键词】 军事装备实体; 属性抽取; 统计分析; 频繁模式挖掘; 基于规则;







