-
题名面向社会事件的半监督自训练多方立场分析
被引量:2
- 1
-
-
作者
林俊杰
王磊
毛文吉
-
机构
中国科学院自动化研究所复杂系统管理与控制国家重点实验室
中国科学院大学人工智能学院
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2018年第12期1074-1084,共11页
-
基金
国家自然科学基金项目(No.71702181
11832001)资助~~
-
文摘
已有的立场分析方法主要采用有监督或无监督方式训练立场分类模型,有监督模型训练通常需要大量有标注数据支持,而相比有监督模型,无监督模型的性能差距较大.为了降低模型训练对有标注训练数据的要求,同时保证模型性能,文中面向社会事件相关的社交媒体文本,提出半监督自训练多方立场分析方法.对于自训练方法,在模型迭代训练过程中,选择高质量样本加入训练集合,对提升模型性能起到关键作用.为此,文中方法首先根据用户立场一致性度量文本的分类置信度,然后利用话题信息进一步筛选高质量样本扩充训练集合,保证模型性能不断提升.实验表明,相比相关工作中的代表性方法和其它半监督模型训练方式,文中方法能够取得更优的立场分类效果,并且方法依据的用户立场一致性和话题信息均有助于提升立场分类效果.
-
关键词
多方立场分析
半监督
自训练
用户立场一致性
话题信息
-
Keywords
Multiple Standpoint Analysis
Semi-supervised
Self-training
User-Level Standpoint Consistency
Topic Information
-
分类号
TP24
[自动化与计算机技术—检测技术与自动化装置]
-