期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
Web文本分类中的标签权重自动优化研究
被引量:
4
1
作者
钟旭东
黄章进
+1 位作者
顾乃杰
张旭
《小型微型计算机系统》
CSCD
北大核心
2016年第5期890-894,共5页
Web文本分类是Web数据挖掘的重要技术之一.为了利用HTML的半结构特性,现有的Web文本分类技术多采用手工指定的方法,决定不同标签的权重系数.这种方法完全根据个人经验,未能充分利用样本集的结构特性,识别效果提升并不明显.针对这一问题...
Web文本分类是Web数据挖掘的重要技术之一.为了利用HTML的半结构特性,现有的Web文本分类技术多采用手工指定的方法,决定不同标签的权重系数.这种方法完全根据个人经验,未能充分利用样本集的结构特性,识别效果提升并不明显.针对这一问题,本文设计和实现了一种基于差分进化算法的Web文本标签权重系数自动寻优方案,并对差分优化算法进行了改进,以提高其局部搜索能力.实验结果表明,该方案能充分利用样本集的特性并能有效地提高分类的准确率.
展开更多
关键词
WEB文本分类
自动权重调优
差分进化算法
半结构特征
下载PDF
职称材料
题名
Web文本分类中的标签权重自动优化研究
被引量:
4
1
作者
钟旭东
黄章进
顾乃杰
张旭
机构
中国科学技术大学计算机科学技术学院
中国科学技术大学安徽省计算与通信软件重点实验室
中国科学技术大学先进技术研究院
出处
《小型微型计算机系统》
CSCD
北大核心
2016年第5期890-894,共5页
基金
安徽省自然科学基金项目(1408085MKL06)资助
高等学校学科创新引智计划项目(B07033)资助
文摘
Web文本分类是Web数据挖掘的重要技术之一.为了利用HTML的半结构特性,现有的Web文本分类技术多采用手工指定的方法,决定不同标签的权重系数.这种方法完全根据个人经验,未能充分利用样本集的结构特性,识别效果提升并不明显.针对这一问题,本文设计和实现了一种基于差分进化算法的Web文本标签权重系数自动寻优方案,并对差分优化算法进行了改进,以提高其局部搜索能力.实验结果表明,该方案能充分利用样本集的特性并能有效地提高分类的准确率.
关键词
WEB文本分类
自动权重调优
差分进化算法
半结构特征
Keywords
Web texts classification
automatic weight adjustment
differential evolution (DE)
semi-structure
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
Web文本分类中的标签权重自动优化研究
钟旭东
黄章进
顾乃杰
张旭
《小型微型计算机系统》
CSCD
北大核心
2016
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部