摘要
介绍基于KNN的文本分类方法 ,分析KNN方法实质 ,基于隐含语义、特征聚合、强化文本中语义链属性因子和与检索相结合的迭代近邻法四种改进方法进行比较 ,给出涉及的关键技术。
出处
《福建电脑》
2005年第1期4-5,16,共3页
Journal of Fujian Computer
参考文献4
-
1杨建良,王永成.基于KNN与自动检索的迭代近邻法在自动分类中的应用[J].情报学报,2004,23(2):137-141. 被引量:18
-
2李永平,程莉,叶卫国.基于隐含语义的kNN文本分类研究[J].计算机工程与应用,2004,40(6):71-73. 被引量:8
-
3张晓辉,李莹,王华勇,赵宏.应用特征聚合进行中文文本分类的改进KNN算法[J].东北大学学报(自然科学版),2003,24(3):229-232. 被引量:60
-
4孙丽华,张积东,李静梅.一种改进的kNN方法及其在文本分类中的应用[J].应用科技,2002,29(2):25-27. 被引量:36
二级参考文献23
-
1尹中航.[D].上海:上海交通大学计算机系,2002.
-
2Mitchell T..Machine Learning.McGraw:Hill,1996.
-
3Vapnik V.N..The Nature of Statistical Learning Theory [ M ].NY:Springer-Verlag,1995
-
4Yang Y..Expert network:effective and efficient learning from human decision in text categorization and retrieval.Proceedings of the Fourth Annual Symposium on Document Analysis and Information Retrieval(SIGIR'94),1994.13~22
-
5G.Salton,M.E.Lesk.Computer evaluation of indexing and text processing.Journal of the ACM,1968:15(1),8~36
-
6T.M.Cover,P.E.Hart.Nearest neighbor pattern classification.IEEE Trans.on Inf.Theory,1967,IT-13:21~27
-
7Kwok-Yin Lai,Wai Lam.Automatic Textual Document Categorization Using Multiple Similarity-Based Models.SDM'2001,Nov.2001.
-
8Yang Y, Liu X. A re-examination of text categorization methods[A]. Proceedings, 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR'99)[C]. Berkeley: ACM Press, 1999.42-49.
-
9Han E H, George K, Vipin K. Text categorization using weight adjusted k-nearest neighbor classification[R]. Technical Report#00-046, University of Minnesota, 2000.
-
10Joachims T. Advances in kernel methods-support vector learning[M]. Cambridge MA:MIT Press, 1998.169-184.
共引文献113
-
1朱丹,吴兹古力.基于机器视觉的农业机械图像识别系统分析[J].农机化研究,2020,42(10):28-31. 被引量:13
-
2李敏,冯亚丽,吴东林.采摘机器人动态果实目标检测与跟踪技术研究——基于云存储[J].农机化研究,2020,42(9):207-211. 被引量:10
-
3张莉.网页自动分类技术概念分析[J].娄底职业技术学院学报(职教与经济研究),2007(2):58-62.
-
4孔凡村,胡勤友,陈宇里.基于VDR回放数据的船舶碰撞过程仿真系统的设计[J].中国航海,2004,27(2):25-28. 被引量:9
-
5李莹,张晓辉,王华勇,常桂然.一种应用向量聚合技术的KNN中文文本分类方法[J].小型微型计算机系统,2004,25(6):993-996. 被引量:13
-
6张莉,康耀红,王曙光,张春元.中文网页自动分类现状的研究[J].福建电脑,2004,20(5):3-4. 被引量:1
-
7张晓辉,李莹,常桂然,赵宏.适于Internet新闻文本实时分类的动态向量空间模型DVSM[J].计算机科学,2004,31(6):64-67. 被引量:1
-
8王金凤.一种基于特征聚合理论和LSI的文本分类新方法[J].北京理工大学学报(社会科学版),2004,6(5):92-94. 被引量:2
-
9钱晓东,王正欧.基于改进KNN的文本分类方法[J].情报科学,2005,23(4):550-554. 被引量:19
-
10赵世奇,张宇,刘挺,陈毅恒,黄永光,李生.基于类别特征域的文本分类特征选择方法[J].中文信息学报,2005,19(6):21-27. 被引量:21
同被引文献5
-
1闭小梅,闭瑞华.KNN算法综述[J].科技创新导报,2009,6(14):31-31. 被引量:36
-
2徐鹏,林森.基于C4.5决策树的流量分类方法[J].软件学报,2009,20(10):2692-2704. 被引量:169
-
3吴夙慧,成颖,郑彦宁,潘云涛.K-means算法研究综述[J].现代图书情报技术,2011(5):28-35. 被引量:161
-
4王千,王成,冯振元,叶金凤.K-means聚类算法研究综述[J].电子设计工程,2012,20(7):21-24. 被引量:297
-
5苏毅娟,邓振云,程德波,宗鸣.大数据下的快速KNN分类算法[J].计算机应用研究,2016,33(4):1003-1006. 被引量:29
-
1张智,顾进广,李鹏,刘宇.一个基于本体的P2P语义检索框架[J].武汉科技大学学报,2009,32(5):548-551. 被引量:1
-
2陈光,刘宗田.基于特征聚合与最大熵的文本分类算法[J].计算机应用与软件,2008,25(3):263-264. 被引量:2
-
3李博,易东云,赵城利.事件挖掘综述[J].计算机与现代化,2010(11):1-4.
-
4张江涛,杜永萍.基于语义链的检索在QA系统中的应用[J].计算机科学,2013,40(2):257-260. 被引量:6
-
5周彬,伍忠东,喻建平.基于语义链的色情网页过滤系统[J].兰州交通大学学报,2006,25(1):91-93. 被引量:1
-
6周莉,王珏,周勇.云计算环境下可视化探索式搜索引擎的研究[J].江西师范大学学报(自然科学版),2015,39(6):637-641.
-
7张成林.超文本CAD/CASE系统综述[J].计算机研究与发展,1992,29(12):46-52. 被引量:1
-
8黄华,李爱平,徐立云.面向加工中心的工艺方案优化技术[J].同济大学学报(自然科学版),2010,38(1):118-123. 被引量:4
-
9杜永萍,张江涛,刘江利.语义蕴涵关系识别中的特征提取方法[J].北京工业大学学报,2013,39(7):1046-1052.
-
10李剑峰.一种基于运动特征聚合的三维织物模拟算法[J].科技通报,2012,28(10):131-133. 被引量:1