期刊文献+

中文文本挖掘中最长频繁序列的发现算法 被引量:1

Arithmetic of Finding All Maximal Sequences in Chinese Text Mining
下载PDF
导出
摘要  本文对中文文本挖掘中的词汇处理技术进行了较深入的探讨,提出了针对汉语语言特点的发现所有最长频繁序列的算法.该算法基于"找最长字共现"的原则,可以准确地将文本中的词汇切分出来. The dealing technology of word in Chinese text mining was discussed in this article. The arithmetic of finding all maximal frequent sequences in Chinese text was put forward. This arithmetic which can cut words accurately was based on appearing of all maximal frequent sequences in texts at same time.
出处 《中央民族大学学报(自然科学版)》 2004年第1期36-42,共7页 Journal of Minzu University of China(Natural Sciences Edition)
关键词 文本挖掘 最长频繁序列 发现算法 词汇处理 汉语 “找最长字共现” 中文分词 text mining cutting Chinese word frequent sequence
  • 相关文献

参考文献7

二级参考文献16

  • 1潘谦红.文本信息检索模型[J].中国计算机报,1998,19.
  • 2潘谦红.全文检索的发展[J].中国计算机报,1998,19.
  • 3黄昌宁 夏莹.语言信息处理专论[M].北京:清华大学出版社,1995..
  • 4黄昌宁,语言信息处理专论,1995年
  • 5Yang Y,Proc of the 14th Intl Conf on Machine Learning ICML 97,1997年,412页
  • 6上海交大远程教育中心,HTML 语言参考 .WWW书籍,1998年
  • 7Zalane O R,Proc of 1998ACM-SIGMOD Conf onManagement of Data.Seattle,1998年,581页
  • 8Wang Ke,Newport Beach,1997年
  • 9Salton G,Commun ACM,1975年,18卷,5期,613页
  • 10胡侃,夏绍玮.基于大型数据仓库的数据采掘:研究综述[J].软件学报,1998,9(1):53-63. 被引量:256

共引文献544

同被引文献12

引证文献1

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部