期刊文献+

面向未登录领域词切分的中文分词技术研究 被引量:1

下载PDF
导出
摘要 本文通过研究现有中文分词技术的理论和工具,提出一种面向未登录领域词识别的中文自动分词算法。首先,利用已有的中文自然语言处理技术对中文文本进行自动分词,并用一种改良的串频统计方法自动识别出语料中的未登录领域词汇,从而有效提高了中文分词的准确性。
作者 蔡荣彦
出处 《信息系统工程》 2013年第11期133-136,共4页
基金 国家自然科学基金项目基于语义的Web可用性评估研究(70871115)资助
  • 相关文献

参考文献9

  • 1Agirre E,Ansa O,Hovy E,Martinez D.Enriching very large ontologies using the WWW.In:Staab S,Maedche A,eds.Proc.of the ECAI 2004 Workshop on Ontology Learning.2000.http://ol2000.aifb.unikarlsruhe.de/.
  • 2Xu F,Kurz D,Piskorski J,Schmeier S.A domain adaptive approach to automatic acquisition of domain relevant terms and their relations with bootstrapping.In:Proc.of the LREC 2002.http://www.dfki.uni-sb.de/~feiyu/LREC_TermExtraction_final.pdf.
  • 3Missikoff M,Navigli R,Velardi P.Integrated approach for web ontology learning and engineering.IEEE Computer,2002,35(1 1):60-63.
  • 4Navigli R,Velardi P,Gangemi A.Ontology learning and its application to automated terminology translation.IEEE Intelligent Systems,2003,18(1):22-31.
  • 5Alexander Maedche,Steffen Staab.Discovering conceptual relations from text.
  • 6Ljiljana Stojanovic,Nenad Stojanovic,Raphael Volz.Migrating data-intensive Web Sites into the Semantic Web.
  • 7陈文亮,朱靖波,姚天顺,等.基于Bootstrapping的领域词汇自动获取[C]//语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集,2003:67-72.
  • 8郑家恒,卢娇丽.关键词抽取方法的研究[J].计算机工程,2005,31(18):194-196. 被引量:41
  • 9杜波,田怀凤,王立,陆汝占.基于多策略的专业领域术语抽取器的设计[J].计算机工程,2005,31(14):159-160. 被引量:26

二级参考文献8

共引文献65

同被引文献9

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部