期刊文献+

在线评论可行动信息识别研究 被引量:1

Identifying Actionable Information from Online Reviews
原文传递
导出
摘要 【目的】以评论文本为研究对象,研究可行动信息识别方法,为实践者发挥自身优势及弥补不足提供行动参考。【方法】将目标任务定义为句子级分类问题,提出一种基于文段的可行动信息识别模型SAII。基于BERT预训练模型对输入句子进行编码,建立词级别的上下文表征;枚举句子中不同范围的文段,引入文段注意力机制生成信息量丰富的文段级表征;为缓解噪声问题,提出多通道文段过滤机制,最大限度地保留接近关键元素原型的文段;融合提纯后的文段表示和上下文表示,自动识别可行动信息。【结果】在两个真实数据集上的实验结果表明,所提模型的效果最佳。与三类基线模型中的最优模型相比,SAII模型在Yelp数据集和RateMDs数据集上的F1指标分别提高7.91个百分点和5.42个百分点;2.10个百分点和2.73个百分点;1.94个百分点和1.46个百分点。【局限】仍需在多领域和多模态数据集上广泛验证模型的有效性。【结论】本文模型具备词级和文段级表征能力,有效提高了识别准确率,推动了用户生成内容的价值实现。 [Objective]This paper explores methods automatically identifying actionable information from online reviews,aiming to help practitioners improve their follow-up work.[Methods]We defined our task as a sentencelevel classification procedure,and proposed a span-based model(SAII).First,we encoded the input sentences based on BERT to generate token-level representation.Then,we enumerated all possible spans from the given sentences and generated informative representations with the help of attention mechanism.Third,we proposed a multi-channel filtering strategy to preserve spans close to the key element prototypes.Finally,we merged the refined span-level and context representations to predict actionable information.[Results]We examined the SAII model with two real-world datasets and found it yielded satisfactory results.Compared with the three best existing models,SAII’s F1 value increased by 7.91%/5.42%,2.10%/2.73%,and 1.94%/1.46%.[Limitations]More research is needed to evaluate the effectiveness of our new model on multimodal datasets of different domains.[Conclusions]The SAII model could effectively identify actionable information from user-generated contents.
作者 商丽丽 唐华云 王延昭 左美云 Shang Lili;Tang Huayun;Wang Yanzhao;Zuo Meiyun(Post-Doctoral Research Center,China Central Depository&Clearing Co.,Ltd,Beijing 100033,China;School of Information,Renmin University of China,Beijing 100871,China;Blockchain Lab,ChinaBond Finance and Information Technology Co.,Ltd,Beijing 100044,China)
出处 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第12期1-12,共12页 Data Analysis and Knowledge Discovery
基金 绿色发展大数据决策北京市重点实验室基金项目(项目编号:dm202103)的研究成果之一。
关键词 文本评论 文段模型 自然语言处理 可行动信息 BERT Online Reviews Span Model NLP Actionable Information BERT
  • 相关文献

参考文献3

二级参考文献21

共引文献67

同被引文献11

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部