期刊文献+

基于向量空间模型的文本信息表示 被引量:3

下载PDF
导出
摘要 文本分析向量空间模型中的表示方法和映射过程中用到的关键技术和算法——特征选取和向量映射,给出文本建立向量空间模型,并进行特征选取和维度压缩,生成字典。在特征选取部分设计了一个特征选取模块,模块中的三种特征选取算法和它们的实现方式以可插拔方式组合在模块中。在向量映射部分,分析了它的主要步骤,设计了文本解析流水线,并展示了如何利用它完成文本解析和向量映射。
出处 《呼伦贝尔学院学报》 2011年第1期111-116,30,共7页 Journal of Hulunbuir University
  • 相关文献

参考文献5

二级参考文献42

  • 1叶浩,王明文,曾雪强.基于潜在语义的多类文本分类模型研究[J].清华大学学报(自然科学版),2005,45(S1):1818-1822. 被引量:18
  • 2高思丹,袁春风.语句相似度计算在主观题自动批改技术中的初步应用[J].计算机工程与应用,2004,40(14):132-135. 被引量:47
  • 3杨红颖,王向阳.基于建构主义学习理论的多媒体网络教学系统研究[J].现代远距离教育,2004(4):24-26. 被引量:22
  • 4徐凤亚,罗振声.文本自动分类中特征权重算法的改进研究[J].计算机工程与应用,2005,41(1):181-184. 被引量:56
  • 5穗志力,俞士汉.基于骨架依存树的语句相似度计算模型[C].中文信息处理国际会议(ICCIP98)论文集,1998:458-465.
  • 6Yang Yi-ming.An evaluation of statistical approaches to text categorization[J].Information Retrieval, 1999,1 ( 1 ) : 76-88.
  • 7Yang Yi-ming,Slattery S,Ghani R.A study of approaches to hypertext categorization [J].J Intelligent Information System, 2002,18 (2/3):219-241.
  • 8Attardi G,Gull A,Sebastiani F.Automatic Web page categorization by link and.context analysis[C]//Proceedings of 1st European Symposium on Telematics,Hypermedia and Artificial Intelligence, (Varese, IT ), 1999.
  • 9Shih L K,Karger D R.Using URLs and table layout for Web classification tasks[C]//Proceedings of the 13th International Conference on World Wide Web,200g.
  • 10Shen Dou,Chen Zheng,Yang QianglWeb-page classification through summarization[C]//Proceedings of the 27th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 2004 : 210-213.

共引文献32

同被引文献11

引证文献3

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部