期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种基于聚类加权的文本特征生成算法
被引量:
3
1
作者
张凤琴
王磊
+2 位作者
张水平
王鹏
程超
《计算机应用研究》
CSCD
北大核心
2013年第1期146-148,共3页
目前的文本特征生成算法一般采用加权的文本向量空间模型,该模型使用TF-IDF评价函数来计算单个特征的权值,这种算法生成的文本特征冗余度往往都比较高。针对这一问题,采用了一种基于聚类加权的文本特征生成算法,首先对特征候选集进行初...
目前的文本特征生成算法一般采用加权的文本向量空间模型,该模型使用TF-IDF评价函数来计算单个特征的权值,这种算法生成的文本特征冗余度往往都比较高。针对这一问题,采用了一种基于聚类加权的文本特征生成算法,首先对特征候选集进行初始加权处理;然后通过语义和信息熵对特征进行进一步加权处理;最后使用特征聚类对冗余特征进行剔除。实验表明该算法比传统的TF-IDF算法的平均分类准确率高出5%左右。
展开更多
关键词
文本分类
特征生成
权值计算
特征聚类
信息熵
下载PDF
职称材料
题名
一种基于聚类加权的文本特征生成算法
被引量:
3
1
作者
张凤琴
王磊
张水平
王鹏
程超
机构
空军工程大学信息与导航学院指挥自动化工程系
北京航空航天
大学
软件
学院
出处
《计算机应用研究》
CSCD
北大核心
2013年第1期146-148,共3页
基金
陕西省自然科学基金资助项目(2011JM8035)
文摘
目前的文本特征生成算法一般采用加权的文本向量空间模型,该模型使用TF-IDF评价函数来计算单个特征的权值,这种算法生成的文本特征冗余度往往都比较高。针对这一问题,采用了一种基于聚类加权的文本特征生成算法,首先对特征候选集进行初始加权处理;然后通过语义和信息熵对特征进行进一步加权处理;最后使用特征聚类对冗余特征进行剔除。实验表明该算法比传统的TF-IDF算法的平均分类准确率高出5%左右。
关键词
文本分类
特征生成
权值计算
特征聚类
信息熵
Keywords
text classification
features generated
weight calculation
features clustering
information entropy
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种基于聚类加权的文本特征生成算法
张凤琴
王磊
张水平
王鹏
程超
《计算机应用研究》
CSCD
北大核心
2013
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部