期刊文献+

泛化类型的机读词典属性信息抽取

ACQUISITION OF ATTRIBUTE INFORMATION OF MACHINE-READABLE DICTIONARY IN GENERIC TYPE
下载PDF
导出
摘要 为了构建实体关系网络、改进和完善基于概念的信息检索,提出一种不针对特定属性类型的从机读词典中抽取概念实例的属性值信息的方法。首先,通过手工标注和遴选等方式生成初始实体—属性值对集并抽取出粗糙模式实例集;其次,经过对模式实例集的聚类合并和扩充处理得到若干组的模式实例,每一组代表一个属性类型;最后,从词典中抽取出新实体词汇的属性值信息。在模式实例集的处理中引入了同义词扩展和词汇语义相似度计算以提高模式实例的覆盖率。实验中针对《现代汉语规范词典》中的电子领域词汇进行抽取,取得了较好的效果。 This paper presents a method to acquire the attribute value information of conceptual instances from machine-readable dictionary in light to generic attribute types in order to build the network of entity-relationships and to improve and perfect the conceptual-based information retrieval.First,the method generates preliminary entity-attribute value pair sets by means of manual marking and selecting and acquires rough pattern instances set.Secondly,the method obtains several groups of pattern instances by clustering,merging and expanding the pattern instances set,each group represents a type of attribute.Finally,the method acquires the attribute value information of new entity vocabulary from dictionary.When processing pattern instances set the semantic similarity of the vocabulary and synonym extension are introduced to improve the coverage of pattern instances.In experiment the extraction aiming at the vocabulary in electronic field is conducted from the Standard Dictionary of Modern Chinese and the result is good.
出处 《计算机应用与软件》 CSCD 2011年第4期1-3,16,共4页 Computer Applications and Software
基金 国家自然科学基金项目(60873135)
关键词 信息抽取 模式实例 相似度 泛化类型 Information extraction Pattern instance Similarity Generic types
  • 相关文献

参考文献9

  • 1Marti A Hearst. Automatic acquisition of hyponyms from large text corpora. Computer Science Division,1992:539 -542.
  • 2刘迁,焦慧,贾惠波.信息抽取技术的发展现状及构建方法的研究[J].计算机应用研究,2007,24(7):6-9. 被引量:41
  • 3陆汝占.中文检索与汉语语义概念图表示[C].第十届全国计算语言学学术会议文集,2009,山东烟台.
  • 4程晓,郑德权,杨宇航,等.面向版结构化文本的领域本体关系抽取[C]//全国计算语言学学术会议.北京:清华大学出版社,2009:376-381.
  • 5ACE. 2007. The nist ace evaluation website, http://www, hist. gov/ speech/tests/ace/ace07/.
  • 6刘慧.信息检索中用户需求的概念分析研究[D].上海:上海交通大学,2008.
  • 7郭绍虞.同义词词林[M].上海:上海辞书出版社,1982.
  • 8陆汝占,靳光瑾.现代汉语研究的新视角[J].语言文字应用,2004(2):93-98. 被引量:6
  • 9邓擘,郑彦宁.使用种子抽取实体关系模式[J].计算机与数字工程,2009,37(9):110-112. 被引量:1

二级参考文献42

共引文献48

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部