期刊文献+

免疫进化的投影寻踪模型在文本分类中的应用 被引量:4

Projection Pursuit Model of Immune Evolution and Its Application to Text Classification
下载PDF
导出
摘要 投影寻踪是通过寻找最能反映原高维数据的结构或特征的投影方向,把高维数据投影到低维子空间上,从而实现在低维空间上研究分析高维数据的目的。针对文本分类中维数灾难问题,采用投影寻踪模型,将高维的文本数据降到超低维。投影寻踪的关键是构造能够找到最佳投影方向的有效算法,本文根据免疫进化的思想提出了免疫进化的投影寻踪模型,该模型能有效地寻找最佳的投影方向。将该方法应用于Reuters-21578文档集和复旦文档集,实验结果表明此方法不仅能有效解决文本分类中难数灾难问题,而且得到了很好的分类性能。 Projection pursuit is used to find the projection direction which reflect the intrinsic structure and features of the original data.So the high dimensional data can be studied and analyzed through lower dimensional space.For the curse of dimensionality in text classification,the multi-dimensional data is turned into low-dimensional space by using projection pursuit model.The nature of the problem is that it is difficult to determine the direction of projection pursuit and the calculation is not easy,especially when the projection direction has more indicators.This paper proposed the projection pursuit model using immune evolution algorithm,which can effectively solve the optimization problem of the projection direction.In the experiment,it's applied to text classification including the Reuters-21578 document sets and FuDan document sets.The experimental results show that this method can not only solve the curse of dimensionality in text classification,but also obtain a satisfactory classification results.
出处 《广西师范大学学报(自然科学版)》 CAS 北大核心 2011年第1期123-128,共6页 Journal of Guangxi Normal University:Natural Science Edition
基金 国家自然科学基金资助项目(60963014) 江西省自然科学基金资助项目(2008GZS0052) 江西省教育厅青年科学基金资助项目(GJJ11067 GJJ10089)
关键词 免疫进化算法 投影寻踪 投影方向 文本分类 immune evolution algorithm projection pursuit projection direction text classification
  • 相关文献

参考文献10

  • 1谢科,张辉,陈鹏,庞斌.文本分类系统关键技术[J].广西师范大学学报(自然科学版),2007,25(2):123-126. 被引量:7
  • 2SEBASTIANI F. Machine learning in automated text categorization[J]. ACM Computing Surveys, 2002,34(1):1-47.
  • 3成平,李国英,陈忠琏,等.投影寻踪讲义[M].北京:中国科学院系统科学所,1986.
  • 4EUN-KYUNG L, DIANNE C,SIGBERT K, et al. Projection pursuit for exploratory supervised classification [J]. Journal of Computational and Graphical Statistics, 2005,14 (4) : 831-846.
  • 5WAN Zhong-ying, WANG Ming-wen,LIAO Hai-bo. Orthogonal projection feature extraction and its application to text classification[J]. Journal of Computational Information Systems ,2008,4(3) 1289-1297.
  • 6万中英, 王明文, 廖海波,等. 维数约简在文本分类中的应用[C]. 第一届全国信息检索与内容安全学术会议,2004.
  • 7万中英,王明文,廖海波.基于投影寻踪的中文网页分类算法[J].中文信息学报,2005,19(4):60-67. 被引量:11
  • 8郑立平,郝忠孝.遗传算法理论综述[J].计算机工程与应用,2003,39(21):50-53. 被引量:48
  • 9倪长健,丁晶,李祚泳.免疫进化算法[J].西南交通大学学报,2003,38(1):87-91. 被引量:74
  • 10舒栋才,樊明兰,林三益.免疫进化算法在水位流量关系拟合中的应用[J].东北水利水电,2004,22(4):1-3. 被引量:9

二级参考文献61

共引文献144

同被引文献33

引证文献4

二级引证文献8

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部