-
题名智能搜索中基于特征选择和贝叶斯的文本分类算法浅析
- 1
-
-
作者
杨小强
-
机构
浙江卓信信息技术有限公司
-
出处
《广播电视信息》
2013年第8期68-69,73,共3页
-
文摘
互联网在全球的普及和应用的不断发展,推动了数据挖掘和知识发现技术,而文本分类作为处理和组织大量文本数据的关键技术,是数据挖掘研究的一个重点和热点。由于贝叶斯方法具有运行快速、易于实现的特点,它被广泛应用于各种文本分类及信息检索系统。本文着重研究和分析了几个不同的特征选择方法,将贝叶斯的文本分类方法和改进了的特征选择方法结合起来实现了训练算法、特征选择算法和分类算法。
-
关键词
特征
贝叶斯
文本分类
智能搜索
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名浅谈基于SVD和KNN的文本聚类算法系统
- 2
-
-
作者
杨小强
-
机构
浙江卓信信息技术有限公司
-
出处
《广播电视信息》
2013年第10期76-78,共3页
-
基金
国家科技支撑计划项目课题No.2012BAH02B01经费资助
-
文摘
本文着重剖析了KNN文本分类算法的优点及不足,为了克服KNN分类器速度慢的缺陷,提出采用与奇异值分解算法进行合并,最后设计并初步实现了一个基于SVD和KNN的文本聚类算法在智能搜索中应用软件。
-
关键词
奇异值分解
K近邻法
文本分类
智能搜索
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
TP391.1
[自动化与计算机技术—计算机应用技术]
-