期刊文献+

基于字频向量的中文文本自动分类系统 被引量:17

下载PDF
导出
摘要 本文提出了一种根据汉字统计特性和基于实例映射的中文文本自动分类方法。该方法采用汉字字频向量作为文本的表示方法。它的显著特点是引入线性最小二乘方估计技术建立文本分类器模型 ,通过对训练集语料的手工分类标引以及对文本和类别间的相关性判定的学习 ,实现了基于全局最小错误率的汉字—类别两个向量空间的映射函数 ,并用该函数对测试文本进行分类。
出处 《情报学报》 CSSCI 北大核心 2000年第6期644-649,共6页 Journal of the China Society for Scientific and Technical Information
  • 相关文献

参考文献2

二级参考文献15

  • 1吴军,王作英,禹锋,王侠.汉语语料的自动分类[J].中文信息学报,1995,9(4):25-32. 被引量:24
  • 2苏新宁,徐进鸿,史九林.档案自动分类算法研究[J].情报学报,1995,14(3):194-200. 被引量:11
  • 3叶新明.基于《中图法》的中文文献自动分类[J].情报学报,1995,14(6):423-433. 被引量:11
  • 4吴军,第三届全国人机语音通信学术会议,1994年
  • 5刘开瑛,第二届全国计算语言学联合学术会议论文集,1993年
  • 6王永成,第二届全国计算语言学联合学术会议论文集,1993年
  • 7苑春法,第二届全国计算语言学联合学术会议论文集,1993年
  • 8施水才,1993年
  • 9郭进,第一届全国计算语言学联系学术会议,1991年
  • 10廉庆荣(译),矩阵计算,1983年

共引文献39

同被引文献140

引证文献17

二级引证文献271

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部