期刊文献+

面向电力客户投诉信息的短文本分类算法的改进技术 被引量:3

An Improved Technique for Short-text Classification Algorithm for Power Customer Complaint Information
下载PDF
导出
摘要 针对电力客户投诉信息进行短文本分类,介绍了K近邻(KNN)算法和中心向量算法,并针对KNN分类算法的某些缺陷作了相关改进,主要加入了中心向量法的思想.对改良后的KNN算法、中心向量算法和传统的KNN算法进行了实验比较,结果发现,相比传统的KNN算法,改良后的新方案能更好地运用在电力客户投诉信息的分类操作上. In terms of the claims by electric power cousumers,texts of claims are classified. The central vector algorithms and KNN algorithms two classification methods are introduced some improvements are made on the drawbacks of KNN algorithm. Finally,an empirical study of using the improved KNN algorithm,the central vector algorithm and the traditional KNN algorithm to categorize the Chinese text is conducted. The result of the experiment shows that,compared with the improved KNN algorithm,the improved algorithm has better categorization effect of the Chinese text,verifying better validity and feasibility.
出处 《上海电力学院学报》 CAS 2017年第6期597-600,共4页 Journal of Shanghai University of Electric Power
关键词 文本分类 中心向量法 K近邻算法 相似度 text classification central vector method K-Nearest Neighbor algorithm similarity
  • 相关文献

参考文献4

二级参考文献19

  • 1孙建涛,郭崇慧,陆玉昌,石纯一.多项式核支持向量机文本分类器泛化性能分析[J].计算机研究与发展,2004,41(8):1321-1326. 被引量:16
  • 2孙国菊,张杰.中文文本分类的特征选取评价[J].哈尔滨理工大学学报,2005,10(1):76-78. 被引量:14
  • 3张宁,贾自艳,史忠植.使用KNN算法的文本分类[J].计算机工程,2005,31(8):171-172. 被引量:98
  • 4郝春风,王忠民.一种用于大规模文本分类的特征表示方法[J].计算机工程与应用,2007,43(15):170-172. 被引量:12
  • 5中国互联网络信息中心.第21次中国互联网络发展状况统计报告[DB/OL].北京:[出版者不详],2008-10-17.
  • 6Lewis D D. Ewduating and optimizing autonomous text classi- fication systems[ C]/7 In Proceedings of S1GIR - 95, 18th ACM International Conference on Research and Development in Infommtion Retrieval. Seattle, US: [s. n. ], 1995.
  • 7Sebasliani F. Machine Leanfing in Automated Text Categorization[J ]. ACM Computing Surveys, 2(102,34 ( 1 ) : 1 - 47.
  • 8[8]Vapnik V.The nature of statistical learning theory[M].New York:Springer-Verlag,1995
  • 9Salton G,Lesk M E.Computer Evaluation of Index and Text Processing. Association for Computing Machinery,1968,15(1).
  • 10Maron M E. On Relevance,Probabilistic Indexing and Information Retrieval. Journal of the ACM,1960,7(3).

共引文献144

同被引文献28

引证文献3

二级引证文献16

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部