期刊文献+

文本挖掘技术研究进展 被引量:58

Survey of Text Mining Technology
下载PDF
导出
摘要 文本挖掘是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程,已经成为数据挖掘中一个日益流行而重要的研究领域。首先给出了文本挖掘的定义和框架,对文本挖掘中预处理、文本摘要、文本分类、聚类、关联分析及可视化技术进行了详尽的分析,并归纳了最新的研究进展。最后指出了文本挖掘在知识发现中的重要意义,展望了文本挖掘在信息技术中的发展前景。 Text Mining, also known as intelligent text analysis, text data mining or Knowledge-Discovery in Text (KDT), is a rapidly emerging field concerned with the extraction of concepts, relations, and implicit knowledge from texts. As most information ( over 80% ) is stored as text, text mining is believed to have a high commercial potential value. Firstly, this review paper discusses the research status of text mining, then it lays out the framework of text mining and analyses techniques of text mining, such as teature selection, automatic abstracting, text categorization, text clustering, text association, data visualization. In the end, it shows the importance of text mining in knowledge disc.overy and highlights the upcoming challenges of text mining and the opportunities it offers.
出处 《计算机应用研究》 CSCD 北大核心 2006年第2期1-4,共4页 Application Research of Computers
基金 国家自然科学基金资助项目(70031010) 北京理工大学学校基金项目 北京理工大学育苗基金项目
关键词 文本挖掘 中文分词 特征选取 文本摘要 文本分类 文本聚类 关联分析 数据可视化 Text Mining Cutting Chinese Word Feature Selection Text Automatic Abstracting Text Categorization Text Clustering Text Association Data Visualization
  • 相关文献

参考文献48

二级参考文献61

  • 1唐振民,靳从,杨静宇.主题概念评价方法的分析[J].情报学报,1995,14(1):27-32. 被引量:2
  • 2杨伦标 高英仪.模糊数学[M].华南理工大学出版社,1939..
  • 3哈罗德·博科 查尔斯·L·贝尼埃.《文摘的概念和方法》[M].北京:书目文献出版社,1991..
  • 4江志军.用JAVA实现Internet中文搜索引擎:硕士学位论文[M].天津:天津大学,1998..
  • 5郭玉箐 张旭平 罗振声.自动文摘中统计信息与文本结构自动分析初探[A]..International Conference on Machine Translation amp Computer Language Information Processing[C].,1999..
  • 6[4]Mena J. Data mining your website[M]. USA:Digital Press, 1999.
  • 7[5]Micheline J H, Kamber. Data mining concepts and techniques[M]. Sanfrancison:Morgan Kaufmann, 2001.
  • 8[3]Feldman R,Dagan I. Knowledge discovery in textual databases(KDT)[C]. In:Proc of the 1st Int'l Conf on Knowledge Discovery. Montreal,1995.112- 117.
  • 9[4]Wuthrich B,Permunetilleke D,Leung S et al. Daily prediction of major stock indices from textual WWW data[C].In:Proc of the 4th Int'l C onf on Knowledge Discovery.New York,1998.
  • 10[6]Koller D,Sahami M.Hierarchically classifying documents using very few wor ds[J].ICML97,1997.170-178.

共引文献737

同被引文献507

引证文献58

二级引证文献380

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部