期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
网络文本分类中基于信息瓶颈的特征提取
被引量:
6
1
作者
贺一帆
江铭虎
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010年第1期45-48,53,共5页
针对网络文本特征关键词多、新词多的特点,提出了一种基于概念特征的文本分类提取方法。应用信息瓶颈法,根据关键词在不同类标号上的分布情况完成关键词聚类。在此基础上,结合概念抽取的方法,将词聚类结果映射到知网义原,并以此作为分...
针对网络文本特征关键词多、新词多的特点,提出了一种基于概念特征的文本分类提取方法。应用信息瓶颈法,根据关键词在不同类标号上的分布情况完成关键词聚类。在此基础上,结合概念抽取的方法,将词聚类结果映射到知网义原,并以此作为分类特征。在网络文本语料上的分类实验显示,该方法保留了基于概念特征提取方法的鲁棒性强、特征维数低的优点,但克服了概念词典中新词无定义,需要维护更新词典的不足。
展开更多
关键词
文本分类
特征提取
信患瓶颈法
原文传递
题名
网络文本分类中基于信息瓶颈的特征提取
被引量:
6
1
作者
贺一帆
江铭虎
机构
清华大学人文学院
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010年第1期45-48,53,共5页
基金
国家自然科学基金资助项目(60673109,60871100)
教育部哲学社科重大项目(07JZD0005)
中科院模式识别国家重点实验室开放基金资助
文摘
针对网络文本特征关键词多、新词多的特点,提出了一种基于概念特征的文本分类提取方法。应用信息瓶颈法,根据关键词在不同类标号上的分布情况完成关键词聚类。在此基础上,结合概念抽取的方法,将词聚类结果映射到知网义原,并以此作为分类特征。在网络文本语料上的分类实验显示,该方法保留了基于概念特征提取方法的鲁棒性强、特征维数低的优点,但克服了概念词典中新词无定义,需要维护更新词典的不足。
关键词
文本分类
特征提取
信患瓶颈法
Keywords
text categorization
feature selection
information bottleneck method
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
网络文本分类中基于信息瓶颈的特征提取
贺一帆
江铭虎
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010
6
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部