期刊文献+

一种基于合并策略的机构名称切分方法 被引量:2

An Organization Name Segmentation Approach Based on Combination Strategy
下载PDF
导出
摘要 在就业招聘信息搜索系统中,如何正确切分机构名是一个非常重要的问题。在对机构名的组成结构进行了深入研究的基础上,提出了机构名的构成规则,建立了用于机构名切分的专有词典,并定制了一个基于合并策略的未登录词识别方法。本系统与海量分词系统进行了对比实验,实验表明,针对机构名切分这个特定领域,文中系统有更好的切分性能。在封闭测试中未登录词识别的准确率可以达到97.26%,召回率可达96.77%。 Organization name segmentation plays an important role in employment information retrieval system. Based on complete research of the organization name composition, the relevant structural features and domain dictionary were obtained, And also a combination approach is presented for unknown words identification in this paper, Experimental results show that the performance of the new system is better than several state - of- the - art systems in this special area. The experiment achieved 97.26 % precision and 96.77 % recall by close teat.
出处 《计算机技术与发展》 2008年第5期12-14,18,共4页 Computer Technology and Development
关键词 中文分词 机构名切分 1-最短路径算法 未登录词识别 Chinese word segmentation organization name segmentation one- shortest paths algorithm unknown word identifieation
  • 相关文献

参考文献7

  • 1吴栋,滕育平.中文信息检索引擎中的分词与检索技术[J].计算机应用,2004,24(7):128-131. 被引量:48
  • 2Lai B Y, Sun M S. Chinese word segmentation and part - of -speech tagging in one step[ C]//Proceedings of International Conference: Research on Computational Linguistics. Taipei: [s. n.], 1997:229 -236.
  • 3Chert Keh - jiann, Chen Chao- jan. Knowledge extraction for identification of Chinese organization names[C]///In proceeding of the 19th International Conference on Computational Linguistics. Taipei: [s. n.] ,2002.
  • 4Knuth D E, Morris J H, Pratt V R. Fast pattern matching in strings [J]. SIAM Journal on Computing, 1977,6(2) :323 - 350.
  • 5张华平,刘群.基于N-最短路径方法的中文词语粗分模型[J].中文信息学报,2002,16(5):1-7. 被引量:99
  • 6林碧英,赵锐,陈良臣.基于Lucene的全文检索引擎研究与应用[J].计算机技术与发展,2007,17(5):184-186. 被引量:19
  • 7钟良伍.基于中文机构名简称的检索方法研究[D].北京:清华大学信息科学技术学院,2005.

二级参考文献9

共引文献163

同被引文献22

引证文献2

二级引证文献9

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部