期刊文献+

中文文本挖掘中的无词典分词的算法及其应用 被引量:26

Arithmetic and Application of No Dictionary Cutting Word in Chinese Text Mining
下载PDF
导出
摘要 对中文文本挖掘中的词汇处理技术进行了较深入的探讨 ,提出了针对汉语语言特点的无词典分词算法。该算法基于“找最长字共现”的原则 ,可以准确地将文本中的词汇切分出来。 The dealing technology of words in Chinese text mining is discussed,and an arithmetic of 'No Dictionary Cutting Word' is brought forward. This arithmetic which is based on finding all maximal frequent sequences in text can cut words accurately.
出处 《吉林工学院学报(自然科学版)》 2002年第1期16-18,共3页 Journal of Jilin Institute of Technology
关键词 文本挖掘 中文分词 无词典分词 text mining cutting Chinese word no dictionary cutting word
  • 相关文献

参考文献7

二级参考文献16

  • 1潘谦红.文本信息检索模型[J].中国计算机报,1998,19.
  • 2潘谦红.全文检索的发展[J].中国计算机报,1998,19.
  • 3黄昌宁 夏莹.语言信息处理专论[M].北京:清华大学出版社,1995..
  • 4黄昌宁,语言信息处理专论,1995年
  • 5Yang Y,Proc of the 14th Intl Conf on Machine Learning ICML 97,1997年,412页
  • 6上海交大远程教育中心,HTML 语言参考 .WWW书籍,1998年
  • 7Zalane O R,Proc of 1998ACM-SIGMOD Conf onManagement of Data.Seattle,1998年,581页
  • 8Wang Ke,Newport Beach,1997年
  • 9Salton G,Commun ACM,1975年,18卷,5期,613页
  • 10胡侃,夏绍玮.基于大型数据仓库的数据采掘:研究综述[J].软件学报,1998,9(1):53-63. 被引量:257

共引文献544

同被引文献203

引证文献26

二级引证文献176

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部