期刊文献+

浅谈中文切词算法 被引量:6

A Tentative Study on Chinese Segmentation Algorithm
下载PDF
导出
摘要 如何高效率的获取满足个性化的需求成为了新时代的一个热门话题,搜索引擎在一定程度上体现了这一点。然而在搜索引擎中,内部分词算法机制是关键环节,它的目的在于选取好的关键字。一个好的分词算法会降低用户搜索信息的时间和难度,大大提高查询信息的效率。然而目前有很多分词算法,它们的性能和效率各不相同,本文的主要研究目的是探讨目前几种比较流行分词器算法的工作机制,根据它们自身的不同特点,在准确率和召回率这两个方面来比较它们的性能,并进一步研究它们是如何处理用户关键字的。 How to efficient access to meet the personalized needs have become a hot topic in the new era, the search engine in a certain extent, a reflection of this. However, in the search engine, the internal segmentation algorithm mechanism is the key link, it is to choose best keywords. A good segmentation algorithm can reduce the time and difficulty for users to search for information, improve the efficiency of query information greatly. However, there are a lot of word segmentation algorithms, their performance and efficiency are different, the main purpose of this study is to investigate the mechanism of several popular word segmentation algorithms, and compare the performance in the precision rate and recall rate based on different characteristics of their own, and further study on how they dispose user key.
作者 黎佳
出处 《软件》 2013年第7期75-76,120,共3页 Software
基金 大学生创新项目:列线寻呼系统
关键词 智能信息处理 网页处理 切词算法 网络爬虫 Intelligent Information Processing Webpage Processing Segmentation algorithm Web Crawler
  • 相关文献

参考文献6

二级参考文献19

  • 1黄昌宁.中文信息处理中的分词问题[J].语言文字应用,1997(1):74-80. 被引量:83
  • 2孙茂松 左正平.汉语真实文本中的交集型切分歧[J].汉语计量与计算研究(Quantitative and Computational Studies on the Chinese Language).香港城市大学语言资讯科学研究中心,1998,:323-338.
  • 3卢开澄.计算机算法导引--设计与实现[M].清华大学出版社,1996..
  • 4宋柔.分词:汉语信息处理的基础工作[J].计算机世界,1997,:48-48.
  • 5Jian-yun Nie,Jianfeng Gao et al.On the Use of Words and N-grams for Chinese Information Retrieval[C].In :IRAL-2000,Fifth International Workshop on Information Retrieval with Asian Languages,Hong Kong, 2000-09.
  • 6Chris Buckley,Janet Walz et al.The Smart/Empire TIPSTER IR System[C].In:TIPSTER Phase III Proceedings, 1999:107-121.
  • 7Chris Buckley,James Allan,Gerard Salton.Automatic Routing and Adhoc Retrieval Using Smart[C].In:TREC2,TREC 2 Proceedings.
  • 8Gao Jianfeng,Joshua Goodman,Li Mingjing et al.Toward a unified approach to statistical language modeling for Chinese[J].ACM Transactions on Asia Language Information Processing,2001.
  • 9贺洪朝.[D].,2002:34~38.
  • 10刘开瑛 等.现代汉语自动分词系统几个问题的讨论[J].计算机开发与应用,1998,.

共引文献18

同被引文献57

引证文献6

二级引证文献11

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部