期刊文献+

一种基于粗集的文本数据特征信息的挖掘方法 被引量:1

A Mining Method for Characteristic Information in Text Data Based on Rough Sets
下载PDF
导出
摘要 1.引言 随着Internet的飞速发展,人们的信息交流越来越多地依赖于网络,人们在网上发表自己的意见和见解、相互讨论各种问题、交流情感和思想.在网上传输的这些数据中,大量涉及到的是文本数据,网络应用的普及使得文本数据呈现出高速膨胀的态势,面对浩瀚的文本大海,人们迫切需要快速、准确地从需要的文本数据中了解其观点、思想或热点问题等等.例如,在远程教育中,教师可能面对的是成百上千个学生,教师希望快速地从学生的讨论和交谈中寻找学生集中关心的问题,以便及时回答和调整教学.又如,出于国家安全的考虑,需要对类似于BBS的公众论坛的文档进行鉴别,以便进行有效地监督和管理.以上问题所涉及的都需要高效、快捷地对文本数据进行特定的信息挖掘. In this paper, we provide a new mining method on text data. Aiming at the mining for characteristic information in text data, we have the aid of knowledge representation based on rough sets to make concept frame, and advance quantitative index.
出处 《计算机科学》 CSCD 北大核心 2002年第8期91-92,共2页 Computer Science
关键词 文本数据特征信息 信息挖掘 粗糙集理论 信息处理 Text data,Characteristic information,Mining method,Rough sets,Concept frame
  • 相关文献

参考文献7

  • 1Pawlak Z. Rough set. International Journal of Information and Computer Science, 1982(11) :341~356
  • 2Pawlak Z. Rough set-theoretical aspects of reasoning about data. Dordrecht: Kluwer Academic Publishers, 1991
  • 3曾黄麟.粗集理论及其应用[M].重庆:重庆大学出版社,1998..
  • 4胡涛,吕炳朝.基于粗糙集的不确定知识表示方法[J].自动化信息,2000(2):8-10. 被引量:3
  • 5易树鸿,张为群.基于粗集的不确定性知识表示的精确性和关联性的研究[J].计算机科学,2001,28(9):91-94. 被引量:3
  • 6张磊 杜小勇 等.文本数据库中的扩展短语挖掘.第18届全国数据库学术会议论文集[J].计算机科学,2001,28(8):154-158.
  • 7刘昌钰 郭颖 等.基于潜在语义分析与Bayes分类的BBS文档鉴别.第18届全国数据库学术会议论文集[J].计算机科学,2001,28(8):179-183.

二级参考文献4

共引文献77

同被引文献13

引证文献1

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部