在互联网时代,越来越多的财务公司选择在财经新闻平台上发表自己的见解,这些评论文本作为舆情的载体,可以充分反映财务公司的情绪,影响公众的投资决策和市场走势.情感分析为分析海量的经济类文本情感类型提供了有效的研究手段.但是,由...在互联网时代,越来越多的财务公司选择在财经新闻平台上发表自己的见解,这些评论文本作为舆情的载体,可以充分反映财务公司的情绪,影响公众的投资决策和市场走势.情感分析为分析海量的经济类文本情感类型提供了有效的研究手段.但是,由于特定领域文本的专业性和大标签数据集的不适用性,经济类文本情感分析给传统的情感分析模型带来了巨大的挑战.当将一般情感分析模型应用于经济等特定领域时,模型在准确率与召回率上表现较差.为了克服这些挑战,文章针对财经新闻平台上的经济类文本的情感分析任务,从词表示模型出发,提出了基于知识蒸馏方法的双路BERT(Two-way BERT based on knowledge distillation method)情感分析模型,与文本卷积神经网络(Text-CNN)、卷积递归神经网络(CRNN)、双向长时和短时记忆网络(Bi-LSTM)等算法进行对比实验,结果得出该改进方法相较于其他算法在准确率、召回率和F1值均提升了1%~3%,具有较好的泛化性能.展开更多
现有的方面级情感分析方法对句法依存树蕴含信息使用不足,忽略多方面词之间的关联,并且缺少对外部知识的使用。针对这些问题,提出一种知识增强的方面词交互图神经网络(KEAIG)模型。首先利用融合领域知识的BERT-PT (Bidirectional Encode...现有的方面级情感分析方法对句法依存树蕴含信息使用不足,忽略多方面词之间的关联,并且缺少对外部知识的使用。针对这些问题,提出一种知识增强的方面词交互图神经网络(KEAIG)模型。首先利用融合领域知识的BERT-PT (Bidirectional Encoder Representation from Transformers with Post-Train)编码文本,并利用知识图谱增加句法树的情感信息。模型分两部分对句法依存树蕴含的信息进行提取:第一部分利用句法依存树中的关联关系和每个单词的词性标签提取句子特征,第二部分对融入知识图谱的句法依存树进行特征提取。之后使用融合门控单元将多方面词关联特征融合进提取到的特征中。最后将两部分句子表示拼接起来作为最终分类依据。在4个数据集上的实验结果表明,所提模型相较于基准模型关系图注意力网络(RGAT),在准确率上分别提升了2.17%、5.54%、2.60%和2.83%,在F1值(Macro-F1)上分别提升了2.69%、6.87%、8.77%和14.70%,充分表明了利用句法树、引入外部知识和提取多方面词关联的有效性。展开更多
文摘在互联网时代,越来越多的财务公司选择在财经新闻平台上发表自己的见解,这些评论文本作为舆情的载体,可以充分反映财务公司的情绪,影响公众的投资决策和市场走势.情感分析为分析海量的经济类文本情感类型提供了有效的研究手段.但是,由于特定领域文本的专业性和大标签数据集的不适用性,经济类文本情感分析给传统的情感分析模型带来了巨大的挑战.当将一般情感分析模型应用于经济等特定领域时,模型在准确率与召回率上表现较差.为了克服这些挑战,文章针对财经新闻平台上的经济类文本的情感分析任务,从词表示模型出发,提出了基于知识蒸馏方法的双路BERT(Two-way BERT based on knowledge distillation method)情感分析模型,与文本卷积神经网络(Text-CNN)、卷积递归神经网络(CRNN)、双向长时和短时记忆网络(Bi-LSTM)等算法进行对比实验,结果得出该改进方法相较于其他算法在准确率、召回率和F1值均提升了1%~3%,具有较好的泛化性能.
文摘现有的方面级情感分析方法对句法依存树蕴含信息使用不足,忽略多方面词之间的关联,并且缺少对外部知识的使用。针对这些问题,提出一种知识增强的方面词交互图神经网络(KEAIG)模型。首先利用融合领域知识的BERT-PT (Bidirectional Encoder Representation from Transformers with Post-Train)编码文本,并利用知识图谱增加句法树的情感信息。模型分两部分对句法依存树蕴含的信息进行提取:第一部分利用句法依存树中的关联关系和每个单词的词性标签提取句子特征,第二部分对融入知识图谱的句法依存树进行特征提取。之后使用融合门控单元将多方面词关联特征融合进提取到的特征中。最后将两部分句子表示拼接起来作为最终分类依据。在4个数据集上的实验结果表明,所提模型相较于基准模型关系图注意力网络(RGAT),在准确率上分别提升了2.17%、5.54%、2.60%和2.83%,在F1值(Macro-F1)上分别提升了2.69%、6.87%、8.77%和14.70%,充分表明了利用句法树、引入外部知识和提取多方面词关联的有效性。