文本分类中的同义词和关联词聚类算法研究
The Rearch on Synonymy And Association Words Clustering in Text Classification
摘要
针对基于VSM的文本特征空间中存在着大量同义词和关联词的不足,文章结合潜在语义分析和关联规则挖掘以减少信息冗余,改进分类效率。最后对相应的算法进行了描述并实验验证。
出处
《计算机系统应用》
2007年第11期24-26,31,共4页
Computer Systems & Applications
参考文献4
-
1叶新明,徐进鸿.中文文献自动分类研究[J].情报科学,1992,13(5):31-34. 被引量:18
-
2S T Dumais,G W Fumas,T K Landauer et al. Using latent semantic analysis to improve information reteieval [ C ]. In : Proceedings of CHI' 88 : Conference on Human Factors in Computing. New York: ACM,1988:281-285.
-
3Dumais S. Improving the retrieval of information from external sources. Behavior Research Methods , Instruments and Computers , 1991 , 23(2) : 229 -236.
-
4G.W.斯图尔特.矩阵计算引论[M].上海:上海科学技术出版社,1980.
共引文献17
-
1张爱丽,刘广利,刘长宇.基于SVM的多类文本分类研究[J].情报杂志,2004,23(9):6-7. 被引量:7
-
2徐进鸿.文献自动分类的一种算法[J].现代图书情报技术,1993(3):25-28. 被引量:1
-
3李欣,陈星.基于中文科技图书的图书分类专家系统设计[J].现代图书情报技术,1994(4):24-28. 被引量:6
-
4王理达.电子政务中中文文本分类技术的应用[J].大众科技,2005,7(1):23-25.
-
5苏新宁,徐进鸿,史九林.档案自动分类算法研究[J].情报学报,1995,14(3):194-200. 被引量:11
-
6成颖,史九林.自动分类研究现状与展望[J].情报学报,1999,18(1):20-26. 被引量:37
-
7宗永升,张祎.支持向量机与K近邻结合的网页分类方法[J].计算机仿真,2010,27(9):208-211. 被引量:5
-
8俞君立,朱蓓.1996──1998年我国文献分类研究进展[J].图书馆杂志,1999,18(11):1-5. 被引量:3
-
9牟尧,李曦.关于文本自动分类算法的研究——以档案自动归类的应用为例[J].中国西部科技,2011,10(24):49-51. 被引量:1
-
10史九林,成颖.论语料库技术在自动分类研究中的应用[J].江苏图书馆学报,2000(4):31-35. 被引量:2
-
1李玲娟,梁玉龙,王汝传.数据归约技术及其在IDS中的应用研究[J].南京邮电大学学报(自然科学版),2006,26(6):52-55.
-
2谭国强,肖力.基于关联规则的高校人力资源数据仓库构建与信息挖掘[J].江西通信科技,2011(4):31-35. 被引量:2
-
3刘鹏,孙莉,赵洁,孙珏妍,许剑萍,董瑾,陈婷婷.数据挖掘技术在高校人力资源管理中的应用研究[J].计算机工程与应用,2008,44(10):201-204. 被引量:8
-
4杨君石.基于WEKA的主成分分析聚类的数据归约方法[J].福建电脑,2015,31(8):86-88.
-
5钟将,刘龙海,梁传伟.基于成对约束的主动半监督文本聚类[J].计算机工程,2011,37(13):183-186. 被引量:4
-
6朱颢东,钟勇.基于粗糙集和灰色关联度的综合性特征选择[J].计算机工程与应用,2009,45(35):6-9. 被引量:5
-
7亓俊红,张文东.文本挖掘中同义与关联词集的构造算法研究[J].微电子学与计算机,2007,24(4):118-121. 被引量:1
-
8张文东,易轶虎.利用潜在语义分析和关联规则挖掘构造同义与关联词集[J].计算机工程与科学,2007,29(1):103-104. 被引量:3
-
9田枫,尚福华,刘卓炫,沈旭昆.基于用户生成标签的多视角特征学习方法[J].系统仿真学报,2016,28(10):2362-2368.
-
10朱颢东,李红婵.结合类内集中度和优化RBF神经网络的特征选择[J].微电子学与计算机,2011,28(2):145-148. 被引量:6