摘要
文本自动分类系统是信息处理的重要研究方向,它是指在给定的分类体系下,根据文本的内容自动判别文本类别的过程。文章将对基于贝叶斯算法的文本分类技术进行论述。
出处
《大众科技》
2011年第2期18-20,共3页
Popular Science & Technology
参考文献5
-
1Tom M Mitchell.曾华军 张银奎译.机器学习[M].北京:机械工业出版社,2003..
-
2梅馨,邢桂芬.文本挖掘技术综述[J].江苏大学学报(自然科学版),2003,24(5):72-76. 被引量:29
-
3韩家炜 范明 孟小峰.数据挖掘概念与技术[M].北京:机械工业出版社,2001..
-
4王灏,黄厚宽,田盛丰.文本分类实现技术[J].广西师范大学学报(自然科学版),2003,21(A01):173-179. 被引量:15
-
5KONONENK0 I.Semi -- Naive Bayesian classifiers[C]. Proceedings of European Conference on Artificial Intelligence. Berlin: Springer-Verlag,1991: 206-219.
二级参考文献20
-
1Filippo Neri , Lorenza Saitta . Machine Learing for Information Extraction[J ]. Information Extraction: A Mulidisciplinary Approach to an Emergine Information Technology, 1997,1299 : 171 - 191.
-
2Dieter Merkl, A Min Tjoa. Data Mining in Large Free Text Document Archives[C]. In: Proceedings of the International Symposium on Cooperative Database Systems for Advanced Applications ( CODAS'96 ).Kyoto,Japan, 1996.
-
3Wendy Lehnert. A Performance Evaluation of Text Analysis Technologies[ J ]. AI Magazine, 1991,81 - 94.
-
4Heikki Mannila. Methods and Problem in Data Mining[C]. In: Afrati F, Kolaitis P. Proceedings of International Conference on Database Theory. Greece: Springer-Verlag, 1997.
-
5Kanagasa R, Tan A H. Topic Detection, Tracking and Trend Analysis Using Self-organizing Neural Networks[ C]. In: Fifth Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD'01 ). Hong Kong, 2001.
-
6Gerald DeJong. An Overview of the Frump System[C].In: Lehnert W B, Ringle M H. Strategies for NaturalLanguage Processing. Erlbaum, 1982.
-
7Helena Ahonen, Oskari Heinonen, Mika Klemettinen,Inkeri Verkamo A. Mining in the Phrasal Frontier[C].In: Proceedings of PKDD' 97 - 1st European Symposium on Principles of Data Mining and Knowledge Discovery. Norway: Trondheim, 1997.
-
8Helena Ahonen, Oskari Heinonen, Mika Klemettinen,Inkeri Verkamo A [ J ]. Applying Data Mining Techniques in Text Analysis, 1997 (2) : 4 - 8.
-
9Ronen Feldman, Willi Klosgen, Yaniv Ben-Yehuda, Gil Kedar, Vladmir Reznikov. Pattern Based Browsing in Document Collections[J]. Principles of Data Mining and Knowledge Discovery, 1997, 1263: 112-122.
-
10Oren Etzioni. The World-Wide Web: Quagmire or Gold Mine[J ]. Communications of the ACM, 1996,39 ( 11 ) :65 - 68.
共引文献106
-
1时雷,虎晓红,席磊.基于集成学习的网页分类算法[J].郑州大学学报(理学版),2009,41(3):26-29. 被引量:1
-
2田启明,王丽珍,尹群.基于网格距离的聚类算法的设计、实现和应用[J].计算机应用,2005,25(2):294-296. 被引量:12
-
3郑双怡.文本挖掘及其在知识管理中的应用[J].中南民族大学学报(人文社会科学版),2005,25(4):127-130. 被引量:24
-
4李国伟,周颜,李钜.ID3算法在硕士研究生报名中的应用[J].中原工学院学报,2005,16(3):37-39. 被引量:2
-
5刘瑛,白振兴,褚文奎.基于数据挖掘的OLAP分析技术及应用[J].现代电子技术,2006,29(1):72-74. 被引量:6
-
6姜亚莉,关泽群.用于Web文档聚类的基于相似度的软聚类算法[J].计算机工程,2006,32(2):59-61. 被引量:6
-
7王娜,李云松.基于概念格的文本挖掘[J].计算机技术与发展,2006,16(1):114-116. 被引量:1
-
8申红,吕宝粮,内山将夫,井佐原均.文本分类的特征提取方法比较与改进[J].计算机仿真,2006,23(3):222-224. 被引量:28
-
9欧兆虎.知识管理与知识评价[J].图书情报知识,2006,23(3):100-103. 被引量:12
-
10孙志伟,赵政,王红梅.基于网格和密度的随机样例的聚类算法[J].天津大学学报,2006,39(5):621-626. 被引量:2
同被引文献9
-
1张海龙,王莲芝.自动文本分类特征选择方法研究[J].计算机工程与设计,2006,27(20):3840-3841. 被引量:45
-
2张申亚.文本分类技术中的特征选择算法研究[J].信阳农业高等专科学校学报,2007,17(3):125-127. 被引量:5
-
3张浩;汪楠.文本分类技术研究进展[J]科技信息,2007(23):95-96.
-
4刘健,张维明.基于互信息的文本特征选择方法研究与改进[J].计算机工程与应用,2008,44(10):135-137. 被引量:23
-
5熊志斌,刘冬.朴素贝叶斯在文本分类中的应用[J].软件导刊,2013,20(2):49-51. 被引量:12
-
6潘兴仪.四格表卡方检验中一个值得注意的问题[J].广西医学,2002,24(6):868-869. 被引量:3
-
7王灏,黄厚宽,田盛丰.文本分类实现技术[J].广西师范大学学报(自然科学版),2003,21(A01):173-179. 被引量:15
-
8代六玲,黄河燕,陈肇雄.中文文本分类中特征抽取方法的比较研究[J].中文信息学报,2004,18(1):26-32. 被引量:228
-
9王玉玲,王娟.文本分类中的特征选取算法[J].孝感学院学报,2003,23(6):35-37. 被引量:5
-
1肖江,张亚非.Boosting算法在文本自动分类中的应用[J].解放军理工大学学报(自然科学版),2003,4(2):25-28. 被引量:7
-
2刘茂旺,林世平.BOOSTING算法在多类多标签文本分类中的应用[J].福建电脑,2006(3):103-104. 被引量:1
-
3贺贤明,戴坚峰.一种新型文本自动分类系统的研究与实现[J].微电子学与计算机,2004,21(10):23-26. 被引量:6
-
4庞剑锋,卜东波,白硕.基于向量空间模型的文本自动分类系统的研究与实现[J].计算机应用研究,2001,18(9):23-26. 被引量:293
-
5张业鹏,张道德.贝叶斯算法在文本自动分类系统中的应用[J].计算机与现代化,2006(2):36-37. 被引量:4
-
6闫秋玲,王二暖.基于单词簇的朴素贝叶斯文本分类器[J].华北水利水电学院学报,2007,28(1):72-75.
-
7马旭.贝叶斯网在.NET超文本分类检索中的应用[J].固原师专学报,2003,24(6):47-51.
-
8陈豪,蓝善根.网络安全攻击、威胁及分类研究[J].中国电子商务,2014,0(23):40-40.
-
9陈笑辉,范晓虹.搜索引擎Yahoo的分类体系及性能评价[J].中国信息导报,1999(7):18-20. 被引量:6
-
10王丁,运海红,张辉.文本自动分类系统的研究与实现[J].信息技术,2005,29(3):64-65.