期刊文献+

一种多策略的中文领域本体概念抽取方法 被引量:3

A multi-strategy Chinese domain ontology concept extraction method
下载PDF
导出
摘要 为了提高中文领域本体概念抽取的准确率和召回率,提出一种多策略的中文领域本体概念抽取方法。该方法使用模式匹配法改进原有的单字合并法,经词性过滤和缺陷检测筛选出概念集组成用户词典,并送入概念抽取系统进行二次分词获得候选概念集;利用词频-逆向文本频率(TFIDF)方法和信息熵融合得到TFIDFE方法,计算概念权重以获得领域概念集。实验结果表明,该方法在领域术语抽取的准确率、召回率和F值上均有较好的效果。 In order to improve the precision and recall rate of Chinese domain ontology concept extraction,a multi-strategy Chinese domain ontology concept extraction method is proposed in this paper.In this method,the method of pattern matching is used to improve the original Character Combine Method.A user dictionary is composed after screening concept set with word filter and defect detection,and then fed into the system for the second word segmentation to get candidate concept set.Fused from the TFIDF method and information entropy,the TFIDFE method is used to calculate the concept of weight to obtain the domain concept set.Experimental results show that the proposed method has a good effect on the accuracy,recall and F value of domain term extraction.
出处 《西安邮电大学学报》 2017年第1期94-98,共5页 Journal of Xi’an University of Posts and Telecommunications
基金 陕西省自然科学基金资助项目(2012JM8044) 陕西省教育厅科学研究计划资助项目(12JK0733) 西安邮电大学研究生创新基金资助项目(114-602080055) 陕西省社会科学基金资助项目(2016N008)
关键词 本体学习 概念学习 单字合并法 TFIDFE 信息熵 ontology learning concept learning Character Combine Method(CCM) TFIDF entropy
  • 相关文献

参考文献8

二级参考文献137

共引文献144

同被引文献38

引证文献3

二级引证文献8

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部