期刊文献+

文本分类中基于对数似然比测试的特征词选择方法 被引量:18

下载PDF
导出
摘要 本文将对数似然比测试用于文本分类中的特征词选择。与传统的频度、集中度和分散度等多种统计指标的测试独立进行的方法相比较,这种方法利用协方差矩阵协调了各个统计指标之间的联系,从而将它们有机地统一为一个整体。实验显示,这种特征词选择方法优于传统的频度测试、集中度测试和分散度测试独立进行的特征词选择的方法。
作者 李国臣
出处 《中文信息学报》 CSCD 北大核心 1999年第4期16-21,共6页 Journal of Chinese Information Processing
  • 相关文献

参考文献8

  • 1杨允信.中文文件自动分类之研究.台湾第六届计算语言学研讨会论文集[M].-,1993..
  • 2丁均彦.文本分类系统的研究与实现[硕士学位论文].北京:清华大学,1998..
  • 3吴军,王作英,禹锋,王侠.汉语语料的自动分类[J].中文信息学报,1995,9(4):25-32. 被引量:24
  • 4丁均彦,硕士学位论文,1998年
  • 5Young S,The HTK Book,1997年
  • 6Yang Y,Proc 18th SIGIR Conf,1995年
  • 7杨允信,台湾第六届计算语言学研讨会论文集,1993年
  • 8蔡元龙,模式识别,1986年

二级参考文献6

  • 1吴军,第三届全国人机语音通信学术会议,1994年
  • 2刘开瑛,第二届全国计算语言学联合学术会议论文集,1993年
  • 3王永成,第二届全国计算语言学联合学术会议论文集,1993年
  • 4苑春法,第二届全国计算语言学联合学术会议论文集,1993年
  • 5施水才,1993年
  • 6郭进,第一届全国计算语言学联系学术会议,1991年

共引文献23

同被引文献131

引证文献18

二级引证文献195

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部