期刊文献+

一种对聊天文本进行特征选取的方法研究

A Study on the Method of Feature Selection in Chat Text
下载PDF
导出
摘要 由于网络聊天文本具有结构松散、简短、上下文相关等特点,对其进行特征选取时使用传统的TFIDF(Term Frequency Inverse Document Frequency)算法存在较大缺陷。针对这个问题,本文提出了一种通过聊天主题来确定聊天文本的特征选取范围的方法,并通过实验验证了该方法的有效性。 Because online chat text is loosely and briefly organized and is context dependent, there are some defects to select features by using traditional TFIDF (Term Frequency Inverse Document Frequency). Aiming at solving the problem, this paper presents a method that the range of feature selection in chat text is obtained by using chat subjects, and the validity of the method is verified through experiment.
作者 李盛瑜 何文
机构地区 重庆工商大学
出处 《计算机科学》 CSCD 北大核心 2007年第5期202-204,共3页 Computer Science
关键词 文本挖掘 聊天文本 TFIDF Text mining, Chat text, TFIDF
  • 相关文献

参考文献3

二级参考文献15

  • 1唐振民,靳从,杨静宇,李远复.一种用于自动标引系统的主题词自动切分方法[J].南京理工大学学报,1995,19(5):401-404. 被引量:2
  • 2Zalane O R,Proc of 1998ACM-SIGMOD Conf onManagement of Data.Seattle,1998年,581页
  • 3Wang Ke,Newport Beach,1997年
  • 4Salton G,Commun ACM,1975年,18卷,5期,613页
  • 5Yang Y,http://citeseernjneccom/yang97comparativehtml,1997年
  • 6边肇祺 张学工.模式识别[M].北京:清华大学出版社,1999.282-283.
  • 7P Turney.Learning to Extract Keyphrases from Text[EB/OL].National Research Council of Canada(1999),http://arxiv.org/ftp/cs/papers/0212/0212013.pdf.
  • 8沈小建,许景红.清华同方主题词、分类号智能检索系统(医学专业)[J/OL].中国期刊网CNKI数字图书馆,2005.
  • 9http://linux.tcpip.com.cn/article/index.php?func=detail&par=14&parentid=159&start=16&s=0,2005-03[EB/OL].
  • 10Shiwen Yu,Xuefeng Zhu,Yunyun Zhang.The Specification of the Synthetic Knowledge-based of Contemporary Chinese[J].Journal of Chinese Information Processing,1996,10:1-22.

共引文献364

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部