期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
网络文本分类中基于信息瓶颈的特征提取 被引量:6
1
作者 贺一帆 江铭虎 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第1期45-48,53,共5页
针对网络文本特征关键词多、新词多的特点,提出了一种基于概念特征的文本分类提取方法。应用信息瓶颈法,根据关键词在不同类标号上的分布情况完成关键词聚类。在此基础上,结合概念抽取的方法,将词聚类结果映射到知网义原,并以此作为分... 针对网络文本特征关键词多、新词多的特点,提出了一种基于概念特征的文本分类提取方法。应用信息瓶颈法,根据关键词在不同类标号上的分布情况完成关键词聚类。在此基础上,结合概念抽取的方法,将词聚类结果映射到知网义原,并以此作为分类特征。在网络文本语料上的分类实验显示,该方法保留了基于概念特征提取方法的鲁棒性强、特征维数低的优点,但克服了概念词典中新词无定义,需要维护更新词典的不足。 展开更多
关键词 文本分类 特征提取 信患瓶颈法
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部