基于语义相关和概念相关的自动分类方法研究被引量：5

Research on Automatic Classification of Documents Based on Semantic Relativity and Concept Relativity

下载PDF

导出

摘要文章区别于传统的基于词的中文文本自动分类方法,在选取文本特征时,考虑了词语的语言学信息以及词语概念之间的相关性,提出基于语义的方法和基于概念属性的方法,建立了分类模型。实验表明,改进后的这两种方法使分类系统具有较高的精度。 Different from the conventional word-form based automatic classification system of Chinese texts,giving fur-ther consideration on words' linguistic information and inter-phrase relativity,this paper proposes two feature selection algorithms ,based respectively on words' semantic information and concept attributes.The improved algorithms give a higher accuracy to the automatic classification system.

作者李莼罗振声厉宇航

机构地区清华大学计算机科学与技术系

出处《计算机工程与应用》 CSCD 北大核心 2003年第12期106-109,共4页 Computer Engineering and Applications

关键词文本分类特征抽取语义概念属性 Text classification,Feature selection,Semantic,Concept attribute

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1张月杰,姚天顺.基于特征相关性的汉语文本自动分类模型的研究[J].小型微型计算机系统,1998,19(8):49-55. 被引量：21
2陈志明.汉语文本自动分类系统概貌[A]..见:计算语言学文集[C].清华大学出版社,1999.353—358.
3梅家驹等.同义词词林[M].上海辞书出版社,1985..
4曹素丽,曾伏虎,曹焕光.基于汉字字频向量的中文文本自动分类系统[J].山西大学学报（自然科学版）,1999,22(2):144-149. 被引量：5

二级参考文献8

1刘东立，东北大学学报，1995年
2吴军，中文信息学报，1995年，9卷，4期
3姚天顺，自然语言理解，1995年
4刘湘生，中国分类主题词表，1994年
5梅家驹，同义词词林，1983年
6曹焕光，情报学报，1999年，18卷，2期，27页
7Chang Y Q，Pattern Recognition，1992年，35卷，1期，101页
8曹素青,曾伏虎,曹焕光.一个中文文本自动分类数学模型[J].情报学报,1999,18(1):27-32. 被引量：18

共引文献25

1徐凤亚,罗振声.文本自动分类中特征权重算法的改进研究[J].计算机工程与应用,2005,41(1):181-184. 被引量：56
2王凯,周建国,夏德麟,晏蒲柳,董伟钛.基于支持向量机的中文文本自动分类研究[J].计算机应用研究,2005,22(11):61-63. 被引量：3
3秦茂盛,刘敏.编辑侵权不容忽视[J].出版参考,2006(04S):25-25.
4杨为民,李龙澍.基于Agent的文本分类系统[J].计算机技术与发展,2007,17(2):135-137. 被引量：2
5刘华.基于关键短语的文本分类研究[J].中文信息学报,2007,21(4):34-41. 被引量：14
6王序臻.Web文本层次分类方法研究[J].温州职业技术学院学报,2008,8(3):44-47.
7陈勤,张国煊,王小华.文本自动模糊分类方法的研究[J].杭州电子科技大学学报（自然科学版）,1999,24(4):18-23.
8司莉,俞君立,贺定安.我国文献分类计算机化的发展与近期目标研究(上)——20年来的成就与存在问题[J].图书情报知识,2000,17(2):12-16. 被引量：8
9陈勤,张国煊,王小华,陆蓓,赵葆华.基于模糊模式识别的文本自动分类法研究[J].浙江大学学报（理学版）,2000,27(3):292-295. 被引量：7
10陈勤,张国煊,王小华.基于模糊综合评判的文本自动分类算法[J].计算机应用与软件,2001,18(9):56-59. 被引量：1

同被引文献38

1靳小波.文本分类综述[J].自动化博览,2006,23(z1):24-29. 被引量：16
2高一波.一种基于概念的知识表达体系[J].微电子学与计算机,2004,21(9):71-74. 被引量：14
3钱铁云,王元珍,冯小年.结合类频率的关联中文文本分类[J].中文信息学报,2004,18(6):30-36. 被引量：12
4王萌,何婷婷,姬东鸿,王晓荣.基于HowNet概念获取的中文自动文摘系统[J].中文信息学报,2005,19(3):87-93. 被引量：22
5廖莎莎,江铭虎.中文文本分类中基于概念屏蔽层的特征提取方法[J].中文信息学报,2006,20(3):22-28. 被引量：12
6王琳,陈伟萍,封化民,方勇,杨鼎才.基于类别概念的特征选择方法[J].北京电子科技学院学报,2006,14(2):10-14. 被引量：1
7韩客松.中文文本主题自动提取和标引若干关键技术研究[D].上海交通大学,2001.
8K K Bun, M Ish Izuka. Top ic extraction from news archives using TF * RDF algrithm [ C ]. The Third International Conference on Web Information Systems Engineering, Singapore, 2002. 73 -82.
9Hideki Kozima. Similarity between Words--Computed by Spreading Activation on an English Dictionary [ D ]. Doctoral Thesis. , December 13 ,1993.
10K Lagus, S Kaski. Keyword selection method for characterizing text document maps [ C ]. In Proceedings of ICANN ' 99,1999,1 : 317 - 376.

引证文献5

1李小兵,杨一平,刘曙光.基于概念网络的文本分类研究[J].微型机与应用,2005,24(7):55-57. 被引量：1
2廖莎莎,江铭虎.中文文本分类中基于概念屏蔽层的特征提取方法[J].中文信息学报,2006,20(3):22-28. 被引量：12
3蒋建慧,陈玉泉.基于词语量化关系的主题概念抽取算法研究[J].计算机仿真,2009,26(12):122-125. 被引量：2
4陈立伟,井志强,葛秘蕾.基于特征项扩展的中文文本分类方法[J].应用科技,2010,37(3):1-4. 被引量：1
5陈炯,张永奎.一种基于词聚类的文本特征描述方法[J].计算机系统应用,2011,20(2):211-215. 被引量：4

二级引证文献20

1王细薇,樊兴华,赵军.一种基于特征扩展的中文短文本分类方法[J].计算机应用,2009,29(3):843-845. 被引量：36
2左晓飞,刘怀亮,范云杰,赵辉.基于概念语义场的文本聚类算法研究[J].情报杂志,2012,31(5):180-184. 被引量：2
3王志玲,王效岳.国内文本分类研究论文的统计分析[J].图书情报工作,2006,50(11):136-138. 被引量：2
4刘海峰,王元元,张学仁,刘守生.文本分类中一种基于正交变换的特征降维方法[J].计算机科学,2008,35(5):125-126. 被引量：3
5孔庆苹,刘宗田,廖涛.基于概念获取的多文档主题划分研究[J].计算机科学,2008,35(5):131-133. 被引量：6
6陈立伟,井志强,葛秘蕾.基于特征项扩展的中文文本分类方法[J].应用科技,2010,37(3):1-4. 被引量：1
7张志平.基于“中文新闻信息分类与代码”文本分类[J].太原理工大学学报,2010,41(4):402-405. 被引量：5
8陈炯,张永奎.一种基于词聚类的文本特征描述方法[J].计算机系统应用,2011,20(2):211-215. 被引量：4
9古丽娜孜,孙铁利,伊力亚尔,吴迪.一种基于主动学习支持向量机哈萨克文文本分类方法[J].智能系统学报,2011,6(3):261-267. 被引量：3
10熊忠阳,付玲玲,张玉芳.文本分类中基于概念映射的二次特征降维方法[J].计算机工程与应用,2012,48(1):166-169. 被引量：1

1高炜,高云,梁立.基于ε-邻域方法的本体映射算法[J].云南师范大学学报（自然科学版）,2011,31(3):37-40. 被引量：2
2乔一枝,张运凯,马瑞霞.基础网络实验的设计[J].实验室研究与探索,2003,22(5):76-77. 被引量：2
3周安利.软件市场IBM风风火火[J].中国经济和信息化,1998(26):22-22.
4刘远超,王晓龙,徐志明,关毅.文档聚类综述[J].中文信息学报,2006,20(3):55-62. 被引量：65
5闫娟,穆晓霞.一种基于角色概念的组织方法研究[J].河南师范大学学报（自然科学版）,2015,43(5):137-141.
6丁政建,李飞.基于本体的信息检索技术的研究[J].科学技术与工程,2008,8(13):3660-3663. 被引量：6
7沙莎,曾慧宏,罗三定.一种面向元数据描述文档的概念检索方法[J].计算机工程与应用,2005,41(25):168-171. 被引量：2
8蒋旦,周文乐,朱明.基于语义和图的文本聚类算法研究[J].中文信息学报,2016,30(5):121-128. 被引量：2
9李飞,赵世霞.基于本体的语义信息检索技术的研究[J].信息与电脑（理论版）,2010(6):106-107. 被引量：6
10郭猛,冯志勇.基于本体实现有效Web信息检索[J].微处理机,2007,28(4):116-119. 被引量：1

计算机工程与应用

2003年第12期

浏览历史

内容加载中请稍等...

基于语义相关和概念相关的自动分类方法研究被引量：5

参考文献4

二级参考文献8

共引文献25

同被引文献38

引证文献5

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于语义相关和概念相关的自动分类方法研究 被引量：5

参考文献4

二级参考文献8

共引文献25

同被引文献38

引证文献5

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于语义相关和概念相关的自动分类方法研究被引量：5