期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于分组提升集成的跨领域文本情感分类 被引量:12
1
作者 赵传君 王素格 +1 位作者 李德玉 李欣 《计算机研究与发展》 EI CSCD 北大核心 2015年第3期629-638,共10页
针对目标领域带标签数据偏少的问题,综合运用半监督学习、BootStrapping、数据分组、AdaBoost、集成学习等策略与技术,提出了一种基于分组提升集成的跨领域文本情感分类方法.该方法首先利用少量人工标注的目标领域数据,基于合成过抽样... 针对目标领域带标签数据偏少的问题,综合运用半监督学习、BootStrapping、数据分组、AdaBoost、集成学习等策略与技术,提出了一种基于分组提升集成的跨领域文本情感分类方法.该方法首先利用少量人工标注的目标领域数据,基于合成过抽样技术产生一定数量的虚拟数据.在此基础上,采用BootStrapping方法获得更多目标领域高可信度的带标签数据.在分类器的构建方面,首先将源领域的带标签数据等量分割,并分别与目标领域带标签数据组合,在每个组合数据块上运用AdaBoost方法提升地训练多个分类器,并将这些分类器线性地集成为一个分类器.在亚马逊购物网站4个领域的情感数据集上的实验表明,基于分组提升集成的跨领域文本情感分类方法一定程度上提高了跨领域文本情感分类的精度. 展开更多
关键词 情感分类 跨领域 合成过抽样技术 分组提升 集成分类器
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部