期刊文献+

基于投影寻踪回归文本自动分类的模型 被引量:5

Automated text classification model based on projection pursuit regression
原文传递
导出
摘要 文本被表示为向量空间模型后,是维数非常高的数据,对其进行维数约简是必要的。投影寻踪正是一种稳健的、非参数化的维数约简方法。提出了一种基于投影寻踪回归的文本自动分类模型。应用该模型,可以真实地描述高维数据的客观内在规律,从而达到提高文本分类精度的目的,岭函数拟合函数的合理选择是提高分类精度的关键,故对拟合函数的选取做了初步的研究。采用标准文档集R eu ters-21578进行了分类实验,同时在相同的预处理条件下,与目前常用的方法进行了对比实验。实验结果表明,该模型对文本自动分类具有较高的召回率和准确率。 When a text is expressed as a vector space model, it becomes high-dimensional data. Dimensional reduction is a feasible and effective method of analyzing highdimensional data, and projection pursuit technique is a statistical and nonparametric dimensional reduction method in which data does not need to satisfy normal distribution hypothesis. This paper presents an automated text classification model based on projection pursuit regression. The model can describe the external disciplinarian of high-dimensiona...
出处 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第S1期1823-1827,共5页 Journal of Tsinghua University(Science and Technology)
基金 教育部重点科技资助项目(03070) 江西省自然科学基金资助项目(0311041) 江西师范大学校管课题青年成长基金(1090)
关键词 文本分类 维数约简 投影寻踪回归 text classification dimension reduction projection pursuit regression
  • 相关文献

参考文献2

二级参考文献7

  • 1[1]Sebastiani F. Machine learning in automated text categorization [J]. ACM Computing Survey, 2002,34 (1):1 -47.
  • 2[2]Deerwester S,Dumais S T,Furnas G W,et al. Indexing by latent semantic analysis [J]. Journal of the American Society of Information Science, 1990,41 (6) :391 - 407.
  • 3[3]Dumais S T. Using LSI for information filtering [A].Harman D. The Third Text Retrieval Conference ( TREC - 3) [C]. USA: National Institute of Standards and Technology Special Publication, 1995.
  • 4[4]Baker L D,McCallum A K. Distributional clustering of words for text classification [A]. Proc. ACM-SIGIR-98[C]. Australia: ACM Press, 1998. 96 - 103.
  • 5[5]Park H,Howland P,Jeon M. Cluster structure preserving dimension reduction based on the generalized singular value decompositon [J]. SIAM Journal on Matrix Analysis and Applications ,2003,25 (1): 165 - 179.
  • 6[6]Wold H. Encyclopedia of Statistical Science [M]. New York: Wiley, 1985.
  • 7[7]Tenenhaus M. La Régreesion PLS. Théorie et Pratique [M]. Paris: éditions Technip, 1998.

共引文献26

同被引文献99

引证文献5

二级引证文献22

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部