一种基于粗糙集理论的文本分类方法被引量：4

A Method of Text Categorization Based on Rough Set

下载PDF

导出

摘要在网络这个庞大的虚拟图书馆中,占信息比重最大的文本数据却缺乏结构化、组织化的规整性,大大降低了网络文本信息的利用效率,而文本的自动分类技术则能降低网络的查询时间,提高网络搜索质量。文章提出了一种基于粗糙集理论的文本分类方法。 In a vast virtual library network, which accounts for the largest proportion of the text message is a lack of baseline data structure and organization of structured, and greatly reduce the efficiency in the use of text information network, and automatic text classification technology is able to reduce the network＇s time and improve the quality of Internet search. This paper presents a rough set theory based on the text classification.

作者何峰

机构地区广东省科学院自动化工程研制中心

出处《自动化与信息工程》 2006年第3期1-3,共3页 Automation & Information Engineering

关键词文本分类粗糙集决策表属性约简规则提取 Text Categorization Rough Set Decision Table Reduction of Attributes Rule Extraction

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1何新贵,彭甫阳.中文文本的关键词自动抽取和模糊分类[J].中文信息学报,1999,13(1):9-15. 被引量：54
2陶志,许宝栋,汪定伟.基于决策属性支持度的知识约简方法[J].东北大学学报（自然科学版）,2002,23(11):1025-1028. 被引量：14
3庞剑锋,卜东波,白硕.基于向量空间模型的文本自动分类系统的研究与实现[J].计算机应用研究,2001,18(9):23-26. 被引量：293

二级参考文献13

1黄萱青吴立德.独立于语种的文本分类方法[M].,2000.37-43.
2鲁松白硕等.文本中词语权重计算方法的改进[M].,2000.31-36.
3卜东波.聚类/分类理论研究及其在大模型文本挖掘的应用：博士论文[M].,2000..
4何新贵，模糊知识处理的理论与技术（第2版），1998年
5Peng Fuyang，Pacific Asian Conf Expert Systems，1995年，98页
6黄萱菁，2000 International Conference on Multilingual Information Processing，2000年，37页
7鲁松，2000 International Conference on Multilingual Information Processing，2000年，31页
8卜东波，博士学位论文，2000年
9Yang Yiming，Proceedings of ACMSIGIR Conference on Research and Development in Information Retrieval（SIGIR），1999年，42页
10Yang Yiming，J Information Retrieval，1999年，1卷，1/2期，67页

共引文献356

1安艳辉,董五洲,游自英.基于改进的朴素贝叶斯文本分类研究[J].河北省科学院学报,2007,24(1):22-25. 被引量：7
2蒋英华.利用数据挖掘算法实现一个XML文档分类器[J].科技资讯,2005,3(25):66-70.
3巴德纯,王庆,王晓冬.RH-KTB大型真空冶金系统智能故障诊断[J].真空科学与技术学报,2005,25(z1):12-15.
4李粤,安捷,李星.排序融合算法在校园网搜索引擎中的应用[J].大连理工大学学报,2005,45(z1):257-260. 被引量：2
5蒋宗礼,肖华,赵钦.WebSifter:个性化网络搜索辅助系统[J].清华大学学报（自然科学版）,2005,45(S1):1903-1907. 被引量：5
6孔颖,裘彬强,徐从富.基于CART算法的垃圾邮件过滤模型设计与实现[J].计算机应用,2009,29(2):374-376. 被引量：4
7杨俊,廖闻剑,彭艳兵.一种中文文本聚类算法的研究[J].硅谷,2009,2(5):68-69.
8李长虹,李堂秋.一种改进的特征选择方法在文本分类系统中的应用[J].学术问题研究,2005,0(1):94-98.
9陈淑珍.Web文本挖掘中的特征表示与特征提取技术[J].三明高等专科学校学报,2004,21(2):53-57. 被引量：2
10许增福,梁静国,田晓宇.基于加权模糊推理网络的文本自动分类方法[J].哈尔滨工程大学学报,2004,25(4):504-508. 被引量：1

同被引文献40

1张冬慧,孙波,徐照财,程显毅.文本自动分类关键技术研究[J].微计算机信息,2008,24(6):197-199. 被引量：12
2于达仁,胡清华,鲍文.融合粗糙集和模糊聚类的连续数据知识发现[J].中国电机工程学报,2004,24(6):205-210. 被引量：70
3卢娇丽,郑家恒.基于粗糙集的文本分类方法研究[J].中文信息学报,2005,19(2):66-70. 被引量：16
4樊兴华,孙茂松.一种高性能的两类中文文本分类方法[J].计算机学报,2006,29(1):124-131. 被引量：70
5苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：386
6郝晓燕,常晓明.中文文本分类研究[J].太原理工大学学报,2006,37(6):710-713. 被引量：6
7刘洋.中文文本分类中特征选择方法的比较研究[J].科技信息,2007(3):54-54. 被引量：3
8孙秋野,张化光,戴璟.基于改进粗糙集约简算法的配电系统在线故障诊断[J].中国电机工程学报,2007,27(7):58-64. 被引量：12
9SCHAPIRE R E,SINGER Y.Boostexter:a boosting-based system for text categorization[J].Machine Learning,2000,39.135-168.
10ZHANG Ming-ling,ZHOU Zhi-hua.Multi-label learning by instance differentiation[C]//Proceedings of the 22nd AAAI Conference on Artificial Intelligence.Menlo Park,CA:AAAI Press,2007:669-674.

引证文献4

1高宏宾,杨海振,张小彬.一种改进的文本聚类方法[J].自动化技术与应用,2008,27(9):30-32. 被引量：3
2吕小勇,石洪波.基于粗糙集的多标签文本分类算法[J].广西师范大学学报（自然科学版）,2009,27(3):150-153. 被引量：4
3曾立梅.基于文本数据挖掘的硕士论文分类技术[J].重庆邮电大学学报（自然科学版）,2010,22(5):669-672. 被引量：9
4唐启涛,张燕,彭利红.基于粗糙集约简算法的配置文本聚类方法研究[J].计算机技术与发展,2015,25(11):105-109. 被引量：2

二级引证文献18

1石晓敬,韩燮.文本聚类算法的设计与实现[J].计算机工程与设计,2010,31(9):2013-2015. 被引量：5
2袁鼎荣,谢扬才,陆广泉,刘星.一种新的基于软集合理论的文本分类方法[J].广西师范大学学报（自然科学版）,2011,29(1):129-132. 被引量：2
3李忠,涂方辉,李鑫,袁静,邢丽莉,申涛.基于文本文件的可拓数据挖掘方法研究[J].防灾科技学院学报,2011,13(2):24-27. 被引量：1
4任剑锋,梁雪,李淑红.基于非线性流形学习和支持向量机的文本分类算法[J].计算机科学,2012,39(1):261-263. 被引量：10
5宋涛,施水才,房祥,吕学强.基于改进的潜在语义分析的文本聚类[J].北京信息科技大学学报（自然科学版）,2012,27(3):21-25. 被引量：5
6王振宇,吴泽衡,唐远华.基于多向量和二次聚类的话题检测[J].计算机工程与设计,2012,33(8):3214-3218. 被引量：3
7张纪元.基于大数据挖掘的精细化流量经营运营平台建设探索[J].互联网天地,2013(7):11-15. 被引量：6
8翁世洲,吕跃进,莫京兰.基于优势关系的排序模型及其保序性约简理论[J].广西师范大学学报（自然科学版）,2013,31(3):37-44. 被引量：13
9李红波,孟欣赏,吴渝,李娜芬.Web访问挖掘中的匿名用户识别算法研究[J].西南师范大学学报（自然科学版）,2015,40(9):78-84. 被引量：5
10张艳敏,庞帮艳.基于粗糙集的传感网络节点故障诊断方法研究[J].科学技术与工程,2016,16(27):231-235. 被引量：5

1薛朋强,努尔布力,吾守尔.斯拉木.基于网络文本信息的敏感信息过滤算法[J].计算机工程与设计,2016,37(9):2447-2452. 被引量：31
2赵悦品.网络信息安全防范与Web数据挖掘系统的设计与实现[J].现代电子技术,2017,40(4):61-65. 被引量：13
3马俊伟,王铁军,李庆,林漳希.基于网络信息挖掘的股市影响因素分析[J].吉林大学学报（信息科学版）,2014,32(2):195-200. 被引量：7
4刘清,陈炼,吕静.基于SVM的网络文本信息自动分类[J].现代计算机,2007,13(10):14-16.
5杨博,蔡东风,杨华.开放式信息抽取研究进展[J].中文信息学报,2014,28(4):1-11. 被引量：28
6王嘉梅,张建营,赵继勇.云南跨境多民族语言复杂网络舆情内容分析[J].信息与电脑（理论版）,2013(6):212-213. 被引量：4

自动化与信息工程

2006年第3期

浏览历史

内容加载中请稍等...

一种基于粗糙集理论的文本分类方法被引量：4

参考文献3

二级参考文献13

共引文献356

同被引文献40

引证文献4

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

一种基于粗糙集理论的文本分类方法 被引量：4

参考文献3

二级参考文献13

共引文献356

同被引文献40

引证文献4

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

一种基于粗糙集理论的文本分类方法被引量：4