-
题名基于段落匹配的文本分类机制
被引量:3
- 1
-
-
作者
郑海
林鸿飞
-
机构
海军大连水面舰艇学院航海系
大连理工大学计算机系
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第28期174-176,共3页
-
文摘
文本分类是海量文本组织和管理的重要方法,文章提出了基于段落匹配的文本分类机制。其基本思想是:对于文本特征向量进行概念扩充,减少特征项之间的相关性,增强特征项的表现能力。选取文本段落作为分类的基本要素,通过段落匹配的约束,防止由发散特征引起的假相关现象,从而获取较高精度的文本分类结果。
-
关键词
文本分类
概念扩充
段落匹配
-
Keywords
text categorization,conceptual expansion,passage match
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于概念和关联扩充的文本标题分类机制
- 2
-
-
作者
郑海
林鸿飞
杨志豪
付建文
-
机构
海军大连水面舰艇学院航海系
大连理工大学计算机系
-
出处
《小型微型计算机系统》
CSCD
北大核心
2005年第5期732-734,共3页
-
基金
国家自然科学基金项目 (60 3 73 0 95 )资助
-
文摘
文本分类是处理电子可读文本的重要手段,本文提出了基于标题的文本分类机制.其基本思想是:鉴于文本标题的重要性和简洁性,利用汉语语义分类树寻求概念上的扩充,利用语料库的关联矩阵,进行关联扩充,以丰富标题的语义内涵,从而获取较高精度的文本分类结果.该方法不依赖于汉语分析器和相应的领域知识库,速度较快,应用面较广.
-
关键词
文本分类
概念扩充
关联扩充
向量空间模型
-
Keywords
text classification
conceptual expansion
associated expansion
vector space model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-