-
题名融入内部语义关系对文本分类的影响研究
被引量:3
- 1
-
-
作者
朱建林
杨小平
彭鲸桥
-
机构
中国人民大学财政金融学院
中国人民大学信息学院
-
出处
《计算机科学》
CSCD
北大核心
2016年第9期82-86,共5页
-
基金
国家自然科学基金(71271209)
北京市自然科学基金(4132067)
+1 种基金
教育部人文社会科学青年基金(11YJC630268)
河北省自然科学基金项目(A2013410011)资助
-
文摘
为了在不加入外部语义知识的前提下改善向量空间模型的文本分类效果,通过挖掘语料库内部蕴含的词间关系和文本间关系,并以不同的方式融入原始的词文本矩阵,然后选择常用的SVM和KNN算法,在领域性较强的法律语料库和领域性较宽泛的新闻语料库上进行文本分类的对比实验。实验证明,加入词间关系和文本间关系通常能有效改善文本分类的效果,但是对不同的分类方法和领域特征有不同的影响,在实际应用中应该区别对待。
-
关键词
向量空间模型
文本分类
语义挖掘
特征矩阵
-
Keywords
Vector space model, Text categorization, Semantic mining, Feature matrix
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-