-
题名层次式文本分类的Nave Bayes改进方法
被引量:1
- 1
-
-
作者
张博锋
苏金树
徐昕
-
机构
国防科技大学计算机学院
-
出处
《计算机工程与科学》
CSCD
2008年第4期20-22,49,共4页
-
基金
国家自然科学基金资助项目(90604006)
教育部高校博士点基金资助项目(20049998027)
-
文摘
Nave Bayes方法在文本分类中的决策强烈依赖于主观选择的样本关于类别的分布。本文利用层次式分类的特点并引入概率条件改进Nave Bayes方法,使其在每个内部类别所属的子类局部数据中进行决策,缓解了全局数据分布对分类器的影响,部分克服了数据偏斜问题。实验表明,改进方法在层次式分类中的效果较Nave Bayes方法有显著提高。
-
关键词
文本分类
层次式分类
NAIVE
BAYES
机器学习
数据偏斜
-
Keywords
text categorization
hierarchical categorization
Naive Bayes
machine learning
data skewness
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于无标记Web数据的层次式文本分类
- 2
-
-
作者
何力
谭霜
贾焰
韩伟红
-
机构
国防科学技术大学计算机学院
-
出处
《智能系统学报》
CSCD
北大核心
2014年第3期330-335,共6页
-
基金
国家"863"计划资助项目(2010AA012505
2011AA010702
+7 种基金
2012AA01A401
2012AA01A402)
国家重点基础研究发展计划资助项目(2013CB329601
2013CB329602)
国家自然科学基金资助项目(60933005
91124002)
国家科技支撑计划资助项目(2012BAH38B04)
国家242信息安全计划资助项目(2011A010)
-
文摘
传统的文本分类方法需要标注好的语料来训练分类器,然而人工标记语料代价高昂并且耗时。对此,通过无类别标记的Web数据来训练文本分类器,提出一种基于无标记Web数据的层次式文本分类方法,该方法结合类别知识和主题层次信息来构造Web查询,从多种Web数据中搜索相关文档并抽取学习样本,为监督学习找到分类依据,并结合层次式支持向量机进行分类器的学习。实验结果表明,该方法能够利用无标记Web数据学习分类器,并取得了较好的分类效果,其性能接近于有标记训练样本的监督分类方法。
-
关键词
层次式文本分类
主题层次
无标记数据分类
支持向量机
-
Keywords
hierarchical text classification
topic hierarchy
classification without labeled data
support vector machine
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP181
[自动化与计算机技术—控制理论与控制工程]
-