当前对新词发现、情感词极性标注与情感词库构建的研究比较多,却少有一个专门针对新情感词识别的方法。提出一种基于OC-SVM的新情感词识别方法,通过种子词扩展方法获得词语集,并用旧词典、词频和停用词等对扩展的词进行过滤,获取新词,...当前对新词发现、情感词极性标注与情感词库构建的研究比较多,却少有一个专门针对新情感词识别的方法。提出一种基于OC-SVM的新情感词识别方法,通过种子词扩展方法获得词语集,并用旧词典、词频和停用词等对扩展的词进行过滤,获取新词,对新词获取的实验评估显示在适当的F值下,正确率可以达到45.5%。由于情感词和非情感词训练集的不平衡性,采用词频、相邻词及其词性等作为特征用OC-SVM(one-class support vector machine)对新词进行分类,获得新情感词,构建一个有效的新情感词识别系统。实验结果在召回率为26.6%的情况下,正确率可以达到45.7%,证明了算法的有效性。展开更多
方面情感三元组抽取旨在识别一条评论中的方面项及其情感倾向,并提取与其相关的观点项.现有方法大多将该类任务分为多个子任务,将子任务组成流水线并完成这类任务.然而,基于流水线思想的方法在实际应用中会受到误差传播、不易使用等因...方面情感三元组抽取旨在识别一条评论中的方面项及其情感倾向,并提取与其相关的观点项.现有方法大多将该类任务分为多个子任务,将子任务组成流水线并完成这类任务.然而,基于流水线思想的方法在实际应用中会受到误差传播、不易使用等因素的影响.为此,文中提出词对关系学习方法,将方面情感三元组抽取任务转化为端到端的词对关系学习任务.方法包含一种可将句中的词对关系进行统一标注以表示所有三元组的词对关系标注的方法,以及为此特别构建的可输出词对关系的词对关系网络.首先,使用双向门控循环单元和混合式注意力对句子进行编码表示.然后,使用注意力图转换模块将句子编码转换为各项标签概率.最后,从词对关系标签结果中提取三元组.此外,将预训练的BERT(Bidirectional Encoder Representation from Transformer)应用于文中方法.在4个标准数据集上的实验表明,文中方法性能较优.展开更多
文摘当前对新词发现、情感词极性标注与情感词库构建的研究比较多,却少有一个专门针对新情感词识别的方法。提出一种基于OC-SVM的新情感词识别方法,通过种子词扩展方法获得词语集,并用旧词典、词频和停用词等对扩展的词进行过滤,获取新词,对新词获取的实验评估显示在适当的F值下,正确率可以达到45.5%。由于情感词和非情感词训练集的不平衡性,采用词频、相邻词及其词性等作为特征用OC-SVM(one-class support vector machine)对新词进行分类,获得新情感词,构建一个有效的新情感词识别系统。实验结果在召回率为26.6%的情况下,正确率可以达到45.7%,证明了算法的有效性。
文摘方面情感三元组抽取旨在识别一条评论中的方面项及其情感倾向,并提取与其相关的观点项.现有方法大多将该类任务分为多个子任务,将子任务组成流水线并完成这类任务.然而,基于流水线思想的方法在实际应用中会受到误差传播、不易使用等因素的影响.为此,文中提出词对关系学习方法,将方面情感三元组抽取任务转化为端到端的词对关系学习任务.方法包含一种可将句中的词对关系进行统一标注以表示所有三元组的词对关系标注的方法,以及为此特别构建的可输出词对关系的词对关系网络.首先,使用双向门控循环单元和混合式注意力对句子进行编码表示.然后,使用注意力图转换模块将句子编码转换为各项标签概率.最后,从词对关系标签结果中提取三元组.此外,将预训练的BERT(Bidirectional Encoder Representation from Transformer)应用于文中方法.在4个标准数据集上的实验表明,文中方法性能较优.