文本提出一种基于预训练语言模型双向Transformers编码表示(Bidirectional encoder representation from transformers,简称BERT)的商品中文评论方面抽取模型。首先,利用BERT模型对商品评论文本进行词嵌入;然后,利用BiGRU网络对词向量...文本提出一种基于预训练语言模型双向Transformers编码表示(Bidirectional encoder representation from transformers,简称BERT)的商品中文评论方面抽取模型。首先,利用BERT模型对商品评论文本进行词嵌入;然后,利用BiGRU网络对词向量进行特征提取以获得文本特征,再通过注意力机制为每个字词赋予不同的关注度;接着,将文本特征和关注度融合得到新的文本特征;最后,将模型输出输入到CRF层中,抽取出评价对象的有关方面。该模型能够在编码阶段充分学习到词语的语义,实验结果表明,本文提出的方法提高了抽取准确度。展开更多
为了能够快速有效地将中文商品评论识别为好评或差评,提出一种算法。针对不同类别的商品,预先根据其评论语料构建领域情感词典,评论文本与情感词典集匹配提取情感特征,构建情感特征向量空间模型SF-VSM(Sentiment Feature Vector Space M...为了能够快速有效地将中文商品评论识别为好评或差评,提出一种算法。针对不同类别的商品,预先根据其评论语料构建领域情感词典,评论文本与情感词典集匹配提取情感特征,构建情感特征向量空间模型SF-VSM(Sentiment Feature Vector Space Model),解决传统的特征向量空间模型维数较高及特征选择误差问题。然后基于该模型结合改进的多项式朴素贝叶斯方法对评论进行情感倾向分类。实验结果表明,相比分别基于原始特征和基于χ2特征选取的朴素贝叶斯分类算法,该算法分类精度较高且分类速度快。展开更多
文摘文本提出一种基于预训练语言模型双向Transformers编码表示(Bidirectional encoder representation from transformers,简称BERT)的商品中文评论方面抽取模型。首先,利用BERT模型对商品评论文本进行词嵌入;然后,利用BiGRU网络对词向量进行特征提取以获得文本特征,再通过注意力机制为每个字词赋予不同的关注度;接着,将文本特征和关注度融合得到新的文本特征;最后,将模型输出输入到CRF层中,抽取出评价对象的有关方面。该模型能够在编码阶段充分学习到词语的语义,实验结果表明,本文提出的方法提高了抽取准确度。
文摘为了能够快速有效地将中文商品评论识别为好评或差评,提出一种算法。针对不同类别的商品,预先根据其评论语料构建领域情感词典,评论文本与情感词典集匹配提取情感特征,构建情感特征向量空间模型SF-VSM(Sentiment Feature Vector Space Model),解决传统的特征向量空间模型维数较高及特征选择误差问题。然后基于该模型结合改进的多项式朴素贝叶斯方法对评论进行情感倾向分类。实验结果表明,相比分别基于原始特征和基于χ2特征选取的朴素贝叶斯分类算法,该算法分类精度较高且分类速度快。