-
题名面向问答文本的属性级情感分类研究
被引量:2
- 1
-
-
作者
江明奇
李逸薇
刘欢
李寿山
-
机构
苏州大学计算机科学与技术学院
香港理工大学中文及双语学系
-
出处
《计算机科学》
CSCD
北大核心
2019年第S11期5-8,共4页
-
基金
国家自然科学基金(61672366)资助
-
文摘
传统情感分析任务的目的是分析整个文本的情感极性,这是一种粗粒度的任务。近年来,随着技术的革新,情感分析任务也在不断细化,研究者们希望能获取关于文本中具体对象的情感极性。文中的研究任务是获取问答文本中关于产品属性的情感极性。针对问答文本的属性级情感分析问题,提出了一种基于注意力机制的方法。首先,将属性信息拼接到答案词向量上;其次,对答案文本和问题文本学习一个LSTM模型;然后,通过注意力机制获得问题文本和答案文本的相关性,并根据相关性的重要程度获取答案文本的整体特征;最后,通过分类器输出最终的整体特征结果。实验结果表明,所提方法优于传统的属性级情感分析方法。
-
关键词
问答文本
情感分析
注意力机制
-
Keywords
Question-answering text
Sentiment analysis
Attention mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于联合学习的跨领域法律文书中文分词方法
被引量:4
- 2
-
-
作者
江明奇
严倩
李寿山
-
机构
苏州大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2019年第9期17-23,共7页
-
基金
国家自然科学基金(61672366)
-
文摘
中文分词任务是自然语言处理的一项基本任务。但基于统计的中文分词方法需要大规模的训练样本,且拥有较差的领域适应性。然而,法律文书涉及众多领域,对大量的语料进行标注需要耗费大量的人力、物力。针对该问题,该文提出了一种基于联合学习的跨领域中文分词方法,该方法通过联合学习将大量的源领域样本辅助目标领域的分词,从而提升分词性能。实验结果表明,在目标领域标注样本较少的条件下,该文方法的中文分词性能明显优于传统方法。
-
关键词
中文分词
法律文书
联合学习
-
Keywords
Chinese word segmentation
legal documents
joint learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向问答文本的属性分类方法
被引量:3
- 3
-
-
作者
江明奇
沈忱林
李寿山
-
机构
苏州大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2019年第4期120-126,共7页
-
基金
国家自然科学基金(61672366)
-
文摘
属性分类是属性级情感分析中的一个重要任务。该任务旨在对文本包含的某些具体属性进行自动分类。已有的属性分类方法研究基本都是面向新闻、评论等文本类型。与已有研究不同的是,该文的研究主要面向问答文本的属性分类任务。针对问答文本的属性分类问题,该文提出了一种多维文本表示的方法。首先,该方法进行中文句子切分;其次,使用LSTM模型对每个子问题和答案学习一个隐层表示;再其次,通过融合多个隐层表示,形成多维文本表示;最后,使用卷积层处理多维文本表示,获得最终分类结果。实验结果表明该方法明显优于传统的属性分类方法。
-
关键词
属性分类
问答文本
多维文本表示
-
Keywords
attribute classification
Question-Answer text
multi-dimension textual representation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-