一种基于粗集的文本数据特征信息的挖掘方法被引量：1

A Mining Method for Characteristic Information in Text Data Based on Rough Sets

下载PDF

导出

摘要 1.引言随着Internet的飞速发展,人们的信息交流越来越多地依赖于网络,人们在网上发表自己的意见和见解、相互讨论各种问题、交流情感和思想.在网上传输的这些数据中,大量涉及到的是文本数据,网络应用的普及使得文本数据呈现出高速膨胀的态势,面对浩瀚的文本大海,人们迫切需要快速、准确地从需要的文本数据中了解其观点、思想或热点问题等等.例如,在远程教育中,教师可能面对的是成百上千个学生,教师希望快速地从学生的讨论和交谈中寻找学生集中关心的问题,以便及时回答和调整教学.又如,出于国家安全的考虑,需要对类似于BBS的公众论坛的文档进行鉴别,以便进行有效地监督和管理.以上问题所涉及的都需要高效、快捷地对文本数据进行特定的信息挖掘. In this paper, we provide a new mining method on text data. Aiming at the mining for characteristic information in text data, we have the aid of knowledge representation based on rough sets to make concept frame, and advance quantitative index.

作者易树鸿张为群

机构地区遵义师范学院计算机科学系西南师范大学计算机与信息科学学院

出处《计算机科学》 CSCD 北大核心 2002年第8期91-92,共2页 Computer Science

关键词文本数据特征信息信息挖掘粗糙集理论信息处理 Text data,Characteristic information,Mining method,Rough sets,Concept frame

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1Pawlak Z. Rough set. International Journal of Information and Computer Science, 1982(11) :341～356
2Pawlak Z. Rough set-theoretical aspects of reasoning about data. Dordrecht: Kluwer Academic Publishers, 1991
3曾黄麟.粗集理论及其应用[M].重庆:重庆大学出版社,1998..
4胡涛,吕炳朝.基于粗糙集的不确定知识表示方法[J].自动化信息,2000(2):8-10. 被引量：3
5易树鸿,张为群.基于粗集的不确定性知识表示的精确性和关联性的研究[J].计算机科学,2001,28(9):91-94. 被引量：3
6张磊杜小勇等.文本数据库中的扩展短语挖掘.第18届全国数据库学术会议论文集[J].计算机科学,2001,28(8):154-158.
7刘昌钰郭颖等.基于潜在语义分析与Bayes分类的BBS文档鉴别.第18届全国数据库学术会议论文集[J].计算机科学,2001,28(8):179-183.

二级参考文献4

1曾黄麟.粗集理论及其应用（一）[J].四川轻化工学院学报,1996,9(1):18-28. 被引量：41
2刘清,刘群.各种不精确理论的Rough集解释[J].计算机科学,1999,26(12):5-8. 被引量：7
3胡涛,吕炳朝,陈光(示禹).基于粗糙集的不确定知识表示方法[J].计算机科学,2000,27(3):90-92. 被引量：4
4胡涛,吕炳朝.基于粗糙集的不确定知识表示方法[J].自动化信息,2000(2):8-10. 被引量：3

共引文献77

1章四兵,周美立.系统相似性度量中的非平权距离系数法[J].合肥工业大学学报（自然科学版）,2004,27(8):903-906. 被引量：12
2刘知贵,梁辰,黄正良,蒲洁.粗集理论及其在智能控制中的应用综述[J].西南科技大学学报,2004,19(4):33-37. 被引量：1
3赵卫东,盛昭瀚.基于快速模拟退火的案例检索模型研究[J].管理工程学报,2001,15(1):77-79. 被引量：4
4梅晓丹,孙圣和.粗神经网络的禁止搜索训练算法研究[J].电子学报,2001,29(z1):1908-1911. 被引量：4
5易树鸿,樊林波,唐晔.基于Rough集理论的知识之间影响程度的一种度量[J].遵义师范学院学报,2003,5(3):62-64.
6王妙云,肖人彬.基于XML的分布式智能故障诊断系统研究[J].计算机应用,2004,24(6):151-154. 被引量：5
7肖长歌,胡咏梅,李兴鹤.一种基于S-粗集理论的工作车间滚动调度策略[J].机电一体化,2004,10(4):39-42.
8王德松,舒兰.粗集决策表与决策表简化的可信度比较[J].电子科技大学学报,2004,33(5):611-613. 被引量：4
9胡咏梅,贾磊,李歧强.一种基于S-粗集的实时调度建模方法[J].系统工程与电子技术,2004,26(10):1418-1420. 被引量：1
10朱红.关于属性间依赖度表示方法的探讨[J].计算机工程,2005,31(1):174-175. 被引量：4

同被引文献13

1熊忠阳,张鹏招,张玉芳.基于χ~2统计的文本分类特征选择方法的研究[J].计算机应用,2008,28(2):513-514. 被引量：44
2卫威,王建民.一种大规模数据的快速潜在语义索引[J].计算机工程,2009,35(15):35-37. 被引量：10
3赵仲秋,季海峰,高隽,胡东辉,吴信东.基于稀疏编码多尺度空间潜在语义分析的图像分类[J].计算机学报,2014,37(6):1251-1260. 被引量：26
4石慧,贾代平,苗培.基于词频信息的改进信息增益文本特征选择算法[J].计算机应用,2014,34(11):3279-3282. 被引量：16
5季铎,毕臣,蔡东风.基于类别信息优化的潜在语义分析分类技术[J].中国科学技术大学学报,2015,45(4):314-320. 被引量：5
6邱云飞,刘世兴,魏海超,邵良杉.W-POS语言模型及其选择与匹配算法[J].计算机应用,2015,35(8):2210-2214. 被引量：3
7甘丽新,万常选,刘德喜,钟青,江腾蛟.基于句法语义特征的中文实体关系抽取[J].计算机研究与发展,2016,53(2):284-302. 被引量：74
8罗燕,赵书良,李晓超,韩玉辉,丁亚飞.基于词频统计的文本关键词提取方法[J].计算机应用,2016,36(3):718-725. 被引量：77
9史庆伟,从世源.基于mRMR和LDA主题模型的文本分类研究[J].计算机工程与应用,2016,52(5):127-133. 被引量：8
10陈珂,柯文德,刘美,张良均.一种基于多类别信息的局部潜在语义分析算法研究[J].南京邮电大学学报（自然科学版）,2016,36(1):119-124. 被引量：2

引证文献1

1李惠富,陆光,景维鹏.文本分类中基于K-Sprinkling的特征提取方法[J].计算机工程,2017,43(12):141-146. 被引量：2

二级引证文献2

1杨肖楠,花季伟.互联网中非法文本特征自适应提取仿真研究[J].计算机仿真,2019,36(6):434-437. 被引量：1
2罗有志,陈征明,陈明,梅文涛.一种基于自适应关联熵的关键字提取算法[J].计算机与现代化,2020,0(4):67-71. 被引量：1

1老安.呵护你的眼睛——显示器完全调校[J].电脑爱好者,2001(16):38-40.
2无人喝彩.Flash涂鸦网上留[J].电脑迷,2005,0(8):88-89.
3金艳.加强高校校园网络文化建设与管理[J].政策,2009(6):55-56. 被引量：1
4非公众论坛[J].科技中国,2005(7):70-73.
5常晓雪.中职计算机教学学生创新能力的培养[J].计算机光盘软件与应用,2012,15(8):247-248. 被引量：6
6朱珠.WordPress让博客更精彩[J].软件世界,2007(18):47-48. 被引量：1
7吉秀.感悟发帖[J].水利天地,2007(2):23-23.
8吴莉莉,林爱英,刘存祥.《传感器原理与应用》课程教学方法探索[J].高教论坛,2008(4):114-116. 被引量：17
9倪叶忠.信息技术教学中促进师生互动的策略研究[J].中小学电教（下）,2012(12):35-35.
10龚松显,刘跃宣.传感器技术课程教学新模式的探索与实践[J].海南大学学报（自然科学版）,2011,29(4):388-390. 被引量：2

计算机科学

2002年第8期

浏览历史

内容加载中请稍等...

一种基于粗集的文本数据特征信息的挖掘方法被引量：1

参考文献7

二级参考文献4

共引文献77

同被引文献13

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

一种基于粗集的文本数据特征信息的挖掘方法 被引量：1

参考文献7

二级参考文献4

共引文献77

同被引文献13

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

一种基于粗集的文本数据特征信息的挖掘方法被引量：1