期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
一种文本无监督特征选择方法
下载PDF
职称材料
导出
摘要
由于向量空间模型在文本聚类中的应用,而必须对文本特征进行降维。本方法首先利用特征的概率分布计算特征之间的相似度,在此基础上对特征进行聚类;然后在文本聚类的结果上计算各个特征的信息增益值;最后在各个特征类上取出一定比例的最重要的特征达到特征选择的目标。实验表明,该改进算法在聚类的准确度方面较以前的方法有所提高,可以有效地用于文本自动聚类。
作者
辛颖梅
孙志挥
机构地区
南京擎天科技公司
东南大学计算机学院
出处
《软件导刊》
2009年第9期9-11,共3页
Software Guide
关键词
文本聚类
特征选择
联合概率
DBSCAN
分类号
TP301 [自动化与计算机技术—计算机系统结构]
引文网络
相关文献
节点文献
二级参考文献
0
参考文献
0
共引文献
0
同被引文献
0
引证文献
0
二级引证文献
0
1
杨学明.
Web中文文本聚类研究及实现[J]
.现代图书情报技术,2006(12):81-84.
被引量:8
2
王伟.
文本自动聚类技术研究[J]
.情报杂志,2009,28(2):94-97.
被引量:6
3
周勇.
基于不可分辨关系的文本自动聚类[J]
.计算机系统应用,2012,21(12):190-192.
4
赵鹏,耿焕同,蔡庆生.
一种基于语义和统计特征的中文文本特征表示方法[J]
.小型微型计算机系统,2007,28(7):1311-1313.
被引量:8
5
杨延锟,许少华.
基于FVSM的核聚类算法在文本聚类中的应用[J]
.长江大学学报(自科版)(上旬),2010,7(1):72-75.
6
黄蔚,李戴维.
基于MapReduce的网络舆情分析系统的设计与实现[J]
.信息技术,2014,38(7):149-153.
被引量:2
软件导刊
2009年 第9期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部