期刊文献+

面向新闻领域的中文文本分类研究综述 被引量:24

Research Review on Chinese Text Classification in the News Field
原文传递
导出
摘要 在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用。其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价方法、分类体系粗略、分类维度单一等,并提出相应措施。最后,针对当前信息环境,提出新闻分类不仅将朝着多层次、多维度、跨语言方向发展,还将与多媒体信息、大数据、社会化媒体相结合。 Based on the review of text classification and news categorization, the features of news text and the characteristics of news categorization are concluded. The applications of Chinese news categorization on news site navigation, topic detection and tracking, and personalized news recommendation are summarized. Finally, this paper puts forward corresponding measures to solve existing problems about Chinese news categorization, such as low authenticity of news, idealization of classification system, and single dimension of classification.
出处 《图书情报工作》 CSSCI 北大核心 2013年第14期134-139,共6页 Library and Information Service
基金 江苏省社会科学基金项目"数字报纸的自动标引研究"(项目编号:09TQC011) 教育部人文社会科学研究项目"电子报纸内容深加工研究"(项目编号:09YJC870014)研究成果之一
关键词 新闻分类 文本分类 机器学习 中文信息处理 news categorization text classification machine learning Chinese information processing
  • 相关文献

参考文献41

  • 1李安.Factiva新闻分类标引体系及其对我国的启示[J].图书馆建设,2003(6):102-104. 被引量:3
  • 2Goosle.Google新闻的工作原理[EB/OL].[2013-04-18].http://support.google.corn/news/bin/topic.py?hl=zh-Hans&topic=2428790.
  • 3百度百科.新华网[EB/OL].[2013-04-18].http://baike.baidu.com/view/154954.htm.
  • 4胡泽文,王效岳,白如江.国内外文本分类研究计量分析与综述[J].图书情报工作,2011,55(6):78-81. 被引量:16
  • 5Yang Yiming. An evaluation of statistical approaches to text categorization[ J]. Information Retrieval, 1999, 1 ( 1 - 2 ) : 69 -90.
  • 6Joachims T. Text categorization with support vector machines: Learning with many relevant features [ M ]. Berlin: Springer, 1998 : 137 - 142.
  • 7Lewis D D, Schapire R E, Callan J P, et al. Training algorithms for linear text classifiers [ C ]//Proceedings of the 19th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. Zurich : ACM, 1996:298 - 306.
  • 8侯汉清,黄刚.电子计算机与文献分类[J].现代图书情报技术,1982(1):5-14. 被引量:10
  • 9新华网.我国新闻信息分类浅析[EB/OL].[2013-04-13].http://news.xinhuanet.com/new-media/2006-02/10/eontent_4160298.htm.
  • 10杨丽英,李红娟,张永奎.突发事件新闻语料分类体系研究[C]//中文信息处理前言进展:中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议论文集.北京:清华大学出版社,2006:403-409.

二级参考文献200

共引文献348

同被引文献254

引证文献24

二级引证文献85

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部