期刊文献+

基于语义特征的自动文本分类方法 被引量:1

Semantic-based Automatic Text Classification Method
下载PDF
导出
摘要 自动文本分类是指在给定的分类体系下,让计算机根据文本的内容确定与它相关联的类别。现有的文本分类算法大都基于向量空间模型,因而不能充分表达文档的语义特征信息,从而影响了分类器性能。针对此问题,本文通过训练文档构造相似矩阵,从中获得每个类别的主题信息,由此构造分类器,最后与经典的分类器进行组合以确定文本类别。实验系统证明本文提出的分类方法较大改进了分类器性能。 Automatic text classification is defined as the task to assign pre-defined category labels to documents.Based on the limitations of Vector Space Model,the Vector Space Model is incapable of expressing the structure of documents effectively.To solve this problem,this paper constructs the sireilar matrix by train text,and achieves the subject information of each category through similar matrix,and then to construct the classifier by the subject information.Finally the classifier is combined with the classic classifier to determine the category of text.The experiment system shows the effectiveness of the method.
出处 《计算机与现代化》 2010年第11期9-11,15,共4页 Computer and Modernization
关键词 文本分类 语义特征 向量空间模型 图形模型 算法 text classification semantic features VSM graphical model algorithm
  • 相关文献

参考文献3

二级参考文献9

  • 1黄萱青 吴立德.独立于语种的文本分类方法[M].,2000.37-43.
  • 2鲁松 白硕 等.文本中词语权重计算方法的改进[M].,2000.31-36.
  • 3卜东波.聚类/分类理论研究及其在大模型文本挖掘的应用:博士论文[M].,2000..
  • 4黄萱菁,2000 International Conference on Multilingual Information Processing,2000年,37页
  • 5鲁松,2000 International Conference on Multilingual Information Processing,2000年,31页
  • 6卜东波,博士学位论文,2000年
  • 7Yang Yiming,Proceedings of ACMSIGIR Conference on Research and Development in Information Retrieval(SIGIR),1999年,42页
  • 8Yang Yiming,J Information Retrieval,1999年,1卷,1/2期,67页
  • 9李凡,鲁明羽,陆玉昌.关于文本特征抽取新方法的研究[J].清华大学学报(自然科学版),2001,41(7):98-101. 被引量:78

共引文献410

同被引文献13

  • 1毛军.元数据、自由分类法(Folksonomy)和大众的因特网[J].现代图书情报技术,2006(2):1-4. 被引量:65
  • 2Spiteri L F. The structure and form of folksonomy tags:The road to the public library catalog[J ]. Information Technology and Libraries,2007,26(3) :13-24.
  • 3Lu C M,Park J R, Hu X H. User tags versus expert-assigned subject terms :A comparison of library thing tags and library of congress subject headings [ J ]. Journal of Information Sci- ence ,2010,36 (6) :763-779.
  • 4Yi K, Chan L M. Linking folksonomy to library of congress subject headings: An exploratory study [ J ]. Journal of Docu- mentation,2009,65 (6) :872-900.
  • 5Kiu C C,Tsui E. TaxoFolk: A hybrid taxonomy-folksonomy classification for enhanced knowledge navigation [ J ]. Knowl- edge Management Research & Practice,2010,8( 1 ):24-32.
  • 6Tstfi E,Wang W M,Cheung C F,et al. A concept-relationship acquisition and inference approach for hierarchical taxonomy construction from tags[J]. Information Processing & Manage- ment,2010,46( 1 ) :44.
  • 7Milicevic A K, Nanopoulos A, Ivanovic M. Social tagging in recommender systems:A survey of the state-of-the-art and possible extensions [ J ]. Artificial Intelligence Review, 2010, 33(3) :187-209.
  • 8刘高勇,汪会玲.基于Wiki与Folksonomy的专业信息服务研究[J].图书情报工作,2008,52(10):122-124. 被引量:8
  • 9曾建勋,常春.网络时代叙词表的编制与应用[J].图书情报工作,2009,53(8):8-11. 被引量:23
  • 10刘春茂,米国伟.Web2.0环境下面向社会语义的信息构建的新认识[J].情报理论与实践,2010,33(2):89-92. 被引量:5

引证文献1

二级引证文献5

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部