期刊文献+

中文分词算法在搜索引擎应用中的研究 被引量:20

Research of Chinese Word Automatic Segmentation used in Search Engine
下载PDF
导出
摘要 在Internet高速发展的信息时代,搜索引擎是人们获得有效信息的强有力手段之一。中文搜索引擎的重点在于中文关键信息提取,其中的难点就是中文自动分词。该文重点讨论中文自动分词算法。算法采用基于自动建立词库的最佳匹配方法来进行中文分词,同时采用基于改进型马尔可夫N元语言模型的统计处理方法来处理分词中出现的歧义问题,从而提高精度。 During the period of rapid progress of Information Infrastructure Superhighway, Search Engine is a powerfultool for deriving valuable information. The core of Chinese Search Engine is the key content extracting, and the bottleneck is Chinese Word Automatic Segmentation.This algorithm uses the optimum matching method which is based onautomatic building dictionary to perform the Chinese word automatic segmentation, then resolves ambiguity with meliorative Markoff statistics process in order to enhance precision.
机构地区 中山大学电子系
出处 《计算机工程与应用》 CSCD 北大核心 2000年第8期80-82,84,共4页 Computer Engineering and Applications
关键词 搜索引擎 中文自动分词 算法 汉字信息处理 Search Engine, Chinese Word Automatic Segmentation, Matching, Markoff process
  • 相关文献

参考文献2

二级参考文献6

  • 1吴竞存,现代汉语句法结构与分析,1992年
  • 2范晓,汉语的短语,1991年
  • 3李临定,现代汉语句型,1986年
  • 4周强,中文信息学报,10卷,4期
  • 5吴军,International Conferrnce on Chinese Computing(ICCC’96),1996年
  • 6张树武,第四届全国人机语音通讯学术会议,1996年

共引文献24

同被引文献153

引证文献20

二级引证文献145

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部