期刊文献+

面向制造领域文本的多标签分类方法 被引量:2

A multi-label classification method for manufacturing-text
下载PDF
导出
摘要 机械制造领域存在大量的领域知识,这些领域知识将特征项与文本类别关联起来,有助于区分文本的类别。基于此,本文提出一种融合领域知识的多标签分类方法旨在提高机械制造领域文本的分类性能,该方法首先采用融合领域知识的x2统计特征选择方法得到文本表示特征项集合和对应的相关度矩阵R,R反映了各特征项与类别的相关度;然后将文本是否包含某类别标签这一事件和文本与该类别的相关度关联起来,文本与该类别相关度视作特征项与该类别相关度的集聚,其相关度越大,文本包含该类别标签的概率也越大,统计文本各类别相关度的贡献率,根据最大后验概率准则推理文本类别标签集合。在3个多标签分类常用评测指标下的实验结果表明:与MLKNN方法进行对比,对于机械制造领域文本,融合领域知识的多标签分类方法具有更好的分类性能。
作者 杨莹 王庆文
出处 《制造业自动化》 2016年第2期10-13,23,共5页 Manufacturing Automation
基金 国家科技重大专项:汉川机床采用国产数控系统加工大型机床零件应用示范工程(2012ZX04011-011)
  • 相关文献

参考文献8

  • 1Tsoumakas G,Katakis I,VlahavasI.Mining Multi-label Data. Data Mining and Knowledge Discovery Handbook[M]. Maimon O, RokachL.2nd ed.Springer,2010:667-685.
  • 2Zhang Minling, Zhou Zhihua. ML-kNN:A lazy learning approach to multi-label leaming[J].Pattem Recognition,2007(7):2038-2048.
  • 3张敏灵.一种新型多标记懒惰学习算法[J].计算机研究与发展,2012,49(11):2271-2282. 被引量:39
  • 4Ruben Nicolas,Andreu Sancho-Asensio, ElisabetGolobardes, Albert Fornells, Albert Orriols-Puig, Multi-label classification based on analog reasoning[J].Expert Systems with Applications, 2013(40):5924-5931.
  • 5Everton AlvaresCherman.Lazy Multi-label Learning Algorithms Based on Mutuality Strategies[J].Intell Robot Syst,2014(10): 1007- 1022.
  • 6朱靖波,陈文亮.基于领域知识的文本分类[J].东北大学学报(自然科学版),2005,26(8):733-735. 被引量:12
  • 7庞观松,蒋盛益.文本自动分类技术研究综述[J].情报理论与实践,2012,35(2):123-128. 被引量:33
  • 8Tsoumakas G.Multi-label classification[J].Intemational Journal of Data Warehousing&Mining ,2007(3): 1 - 13.

二级参考文献103

  • 1刘涛,吴功宜,陈正.一种高效的用于文本聚类的无监督特征选择算法[J].计算机研究与发展,2005,42(3):381-386. 被引量:37
  • 2赵世奇,张宇,刘挺,陈毅恒,黄永光,李生.基于类别特征域的文本分类特征选择方法[J].中文信息学报,2005,19(6):21-27. 被引量:21
  • 3苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量:387
  • 4ASEERVATHAM S, BENNANI Y. Semi-structured document categorization with a semantic kernel [ J ]. Pattern Recognition, 2009, 42 (9) : 2067-2076.
  • 5LUO P, LIN F, XIONG Y, et al. Towards combining Web classification and Web information extraction: a case study [ C ] //Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2009: 1235-1244.
  • 6EICKHOFF C, SERDYUKOV P, DE VRIES A. Web page classification on child suitability [ C ] //Proceedings of the 19th ACM International Conference on Information and Knowledge Management, 2010: 1425-1428.
  • 7BOLLEN J, PEPE A, MAO H. Modeling public mood and emotion : twitter sentiment and soeio-economic phenomena [ C ] //Proceeding of the 19th International Conference on World Wide Web, 2010.
  • 8THELWALL M, BUCKLEY K, PALTOGLOU G. Sentiment in Twitter events [ J]. Journal of the American Society for Information Science and Technology, 2011, 62 (2) : 406-418.
  • 9PHAN X, NGUYEN L, HORIGUCHI S. Learning to classify short and sparse text & Web with hidden topics from large-scale data collections [ C ] //Proceeding of the 17th International Conference on World Wide Web, 2008: 91-100.
  • 10BANERJEE S, RAMANATHAN K, GUPTA A. Clustering short texts using Wikipedia [ C ] //Proceeding of the International ACM SIGIR Conference on Research and Development in Information Retrieval, 2007: 787-788.

共引文献81

同被引文献16

引证文献2

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部