一种基于迭代学习的文本分类器构造方法

An Iterative Learningbased Construction Method of Text Categorizer

下载PDF

导出

摘要文本自动分类系统是信息处理的重要研究方向。针对文本分错类和相似度低找不到合适类别等两种错误 ,提出一种迭代的学习算法 ,它利用分错的文本向量来提高或降低相应类别向量的权重 ,从而纠正分类错误 ,提高了分类准确率 ,并且最终得到了较精确的类别描述向量和较优的分类器。 The text categorization system is an important research aspect of information processing.On text error categorization and low similarity that can't find the adaptable class,etc.,this paper presents an iterative learning algorithm,which adopts error text vector to improve or decrease the weight of relative class vector to correct the error categorization,and improve category accuracy.Finally a more accuracy category description vector and better classifier has been obtained.

作者檀林张永奎

机构地区山西大学

出处《电脑开发与应用》 2004年第2期5-6,共2页 Computer Development & Applications

基金山西省回国留学人员基金资助 (2 0 0 2 0 0 4 )

关键词迭代学习文本分类器信息处理度量函数特征抽取 text categorization,categorization system,automatic categorization,iterative learning algorithm,classifier

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1周水庚,关佶红,俞红奇,胡运发.基于Ngram信息的中文文档分类研究[J].中文信息学报,2001,15(1):34-39. 被引量：23
2P Langley,W Iba,K Thompson.An Ananalysis of Bayesian classifiers.In:Proc of the 10th National Conf on Artificial Intelligence.San Jose,CA:AAAI Press,1992,223-228
3Schapire R,Singer Y.BoosTexter:a boosting-based system for text categorization.Machine Learning,2000,39(2/3):135-168

二级参考文献3

1黄萱菁,吴立德.基于向量空间模型的文档分类系统[J].模式识别与人工智能,1998,11(2):147-153. 被引量：24
2邹涛,王继成,黄源,张福炎.中文文档自动分类系统的设计与实现[J].中文信息学报,1999,13(3):26-32. 被引量：45
3战学刚,林鸿飞,姚天顺.中文文献的层次分类方法[J].中文信息学报,1999,13(6):20-25. 被引量：22

共引文献22

1陈晓云,胡运发.规则加权的文本关联分类[J].中文信息学报,2005,19(4):52-59. 被引量：4
2杜长海,吉根林.模糊聚类在中文文本分类中的应用研究[J].计算机工程与应用,2006,42(8):170-172. 被引量：5
3毛伟,徐蔚然,郭军.基于n-gram语言模型和链状朴素贝叶斯分类器的中文文本分类系统[J].中文信息学报,2006,20(3):29-35. 被引量：16
4蔡代纯.基于统计模型的逐步求精标引策略[J].现代图书情报技术,2006(6):39-42.
5刘金红,陆余良.基于Ontology改进的N-Gram文本分类模型研究[J].计算机工程与设计,2007,28(13):3213-3215. 被引量：3
6牛强,王志晓,陈岱,夏士雄.基于KNN的Web文本分类方法的研究[J].计算机应用与软件,2007,24(10):210-211. 被引量：8
7桂海霞,孟祥瑞.基于粗糙集与KNN的Web文本分类的研究[J].安徽理工大学学报（自然科学版）,2008,28(4):89-92.
8韩鹏,郭敦陶.Web文本分类系统研究[J].民营科技,2009(2):18-18.
9何伟,胡学钢,谢飞.基于张量空间模型的中文文本分类[J].合肥工业大学学报（自然科学版）,2010,33(12):1806-1810. 被引量：2
10李爽.改进型贝叶斯算法网络垃圾邮件信息过滤技术[J].科技通报,2012,28(4):180-181. 被引量：1

1郭庚麒,陈启买.一个基于Web挖掘的中文专业搜索引擎的设计与实现[J].计算机工程与科学,2004,26(9):16-20. 被引量：6
2刘钦创.财经类专业搜索引擎关键技术的设计与实现[J].韩山师范学院学报,2008,29(3):22-25. 被引量：1
3兰明敬.支持模糊搜索的结构化P2P算法[J].重庆邮电大学学报（自然科学版）,2013,25(5):680-685.
4刘海峰,张学仁,姚泽清,刘守生.基于类别选择的改进KNN文本分类[J].计算机科学,2009,36(11):213-216. 被引量：9
5陈池梅,张林.基于贝叶斯网络的海量数据多维分类学习方法研究[J].计算机应用研究,2016,33(3):689-692. 被引量：4
6刘海峰,赵华,刘守生.一种基于位置的改进中文文本特征选择[J].图书情报工作,2009,53(21):102-105. 被引量：3
7刘海峰,刘守生,汪泽焱.一种基于类别信息的改进文本特征选择[J].计算机应用与软件,2010,27(6):8-10. 被引量：1
8杜海莲,吕锋,辛涛,杜妮.基于证据理论的优化集成分类器融合算法及应用[J].化工学报,2012,63(9):2877-2881. 被引量：3
9吕林霞,张明新.基于Web挖掘的专业文本特征提取方法研究[J].兰州石化职业技术学院学报,2007,7(3):33-35. 被引量：1
10董飒,刘大有,李丽娜,欧阳若川,柴晓丽.基于类传播分布的关系近邻异质性网络分类方法[J].吉林大学学报（工学版）,2016,46(2):522-527. 被引量：2

电脑开发与应用

2004年第2期

浏览历史

内容加载中请稍等...

一种基于迭代学习的文本分类器构造方法

参考文献3

二级参考文献3

共引文献22

相关作者

相关机构

相关主题

浏览历史