-
题名基于外部知识和层级篇章表示的阅读理解方法
被引量:6
- 1
-
-
作者
谭红叶
李宣影
刘蓓
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2020年第4期85-91,共7页
-
基金
国家重点研发计划重点专项项目课题(2018YF131005103)
国家自然科学基金(61673248)
山西省自然科学基金(201701D121054)
-
文摘
阅读理解指的是基于给定文章自动回答相关问题,这是人工智能及自然语言处理领域的一个研究热点。目前已提出许多基于深度学习的阅读理解方法,但是这些方法对问题理解及篇章建模不充分,导致模型获取答案准确率不高。为了解决上述问题,该文提出一个基于外部知识和层级篇章表示的阅读理解方法。该方法特点有:①通过引入问题重要词的字典释义、HowNet义原,并结合问题类型,加强问题理解;②使用层级篇章表示,提升模型对篇章的理解;③在一个框架下联合优化问题类型预测与答案预测两个子任务。在DuReader数据集上的实验结果表明,该方法与基线系统性能相比最大提升了8.2%。
-
关键词
阅读理解
外部知识
篇章表示
-
Keywords
reading comprehension
external knowledge
discourse representation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于宏观语义表示的宏观篇章关系识别方法
被引量:3
- 2
-
-
作者
周懿
褚晓敏
朱巧明
蒋峰
李培峰
-
机构
苏州大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2019年第3期1-7,24,共8页
-
基金
国家自然科学基金(61772354
61773276
+1 种基金
61836007)
国防科技先导计划(17-ZLXDXX-02-06-02-04)
-
文摘
宏观篇章分析旨在分析相邻段落或段落群之间的语义联系,是自然语言处理领域其他任务的工作基础。该文研究了宏观篇章分析中的关系识别问题,提出了一个宏观篇章关系识别模型。该模型利用基于词向量的宏观篇章语义表示方法和适用于宏观篇章关系识别的结构特征,从两个层面提高了模型分辨宏观篇章关系的能力。在汉语宏观篇章树库(MCDTB)上的实验表明,该模型在大类分类中F1值达到了68.22%,比基准系统提升了4.17%。
-
关键词
宏观篇章关系识别
宏观篇章结构特征
宏观篇章语义表示
-
Keywords
macro discourse-level relation classification
structure features of macro discourse
representation of marco discourse
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名宏观篇章结构表示体系和语料建设
被引量:5
- 3
-
-
作者
褚晓敏
奚雪峰
蒋峰
徐昇
朱巧明
周国栋
-
机构
苏州大学自然语言处理实验室
苏州科技大学电子与信息工程学院
-
出处
《软件学报》
EI
CSCD
北大核心
2020年第2期321-343,共23页
-
基金
国家自然科学基金(61773276,61673290,61836007).
-
文摘
篇章结构分析是自然语言处理领域的一个重要研究方向.篇章结构分析有助于理解篇章的结构和语义,并为自然语言处理的应用(如自动文摘、信息抽取、问答系统等)提供有力的支撑.目前,篇章结构分析主要集中在微观的层面,分析的重点是句子内部或句子与句子之间的关系和结构,而宏观层面的研究相对较少.因此,以篇章结构作为研究对象,并将研究重点放在宏观篇章结构的表示体系和语料资源建设上.探讨了篇章结构分析的重要性,从理论体系、语料资源、计算模型这3个方面阐述了篇章结构分析的研究现状,提出了以篇章主次关系为媒介的宏观和微观统一的篇章结构表示框架,并分别构建了宏观篇章的逻辑语义结构和功能语用结构.在此基础上,标注了规模为720篇新闻报道的宏观篇章结构语料,并对标注的结果进行了一致性分析和标注统计分析.
-
关键词
篇章结构分析
宏观篇章结构
篇章结构表示体系
逻辑语义结构
功能语用结构
语料标注
-
Keywords
discourse structure analysis
macro discourse structure
discourse structure representation schema
logical semantic structure
functional pragmatic structure
corpus annotating
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-