-
题名基于篇章主题的中文宏观篇章主次关系识别方法
被引量:4
- 1
-
-
作者
孙振华
周懿
朱巧明
蒋峰
李培峰
-
机构
苏州大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2020年第12期30-38,共9页
-
基金
国家自然科学基金(61836007,61773276,61772354)
江苏省高校优势学科建设工程资助项目。
-
文摘
篇章分析是自然语言处理领域研究的热点和重点。作为篇章分析的任务之一,篇章主次关系研究篇章的主要和次要内容,从而更好地理解和把握篇章的核心内容。该文重点研究宏观领域的中文篇章主次关系,提出了一种基于篇章主题的中文宏观篇章主次关系识别方法。该方法利用篇章单元间、篇章单元与篇章主题间的语义交互来识别主次关系,并有选择地应用篇章主题信息,有效提高了主次关系核心的识别。在中文宏观汉语篇章树库(MCDTB)上的实验结果显示,该方法优于目前性能最好的基准系统。
-
关键词
篇章分析
宏观篇章主次识别
BERT
篇章主题
-
Keywords
discourse parsing
macro discourse nuclearity recognition
BERT
discourse topic
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于门控记忆网络的汉语篇章主次关系识别方法
被引量:1
- 2
-
-
作者
王体爽
李培峰
朱巧明
-
机构
苏州大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2019年第5期39-46,共8页
-
基金
国家自然科学基金(61836007
61772354
61773276)
-
文摘
篇章分析是自然语言理解的基础。作为篇章分析的重要任务之一,汉语主次关系识别还处于探索阶段。该文提出了一种基于门控记忆网络(GMN)的汉语篇章主次关系识别方法。该方法首先使用Bi-LSTM和CNN分别获取每个篇章单元的全局信息和局部信息。然后,融合两部分篇章单元信息并从中计算得到一个门控单元。最后,使用这个门控单元捕获各个篇章单元相对于篇章整体来说相对重要的特征表示,从而识别出核心篇章单元。在Chinese Discourse Treebank(CDTB)语料库上的实验显示,和最好的基准系统相比,该文的方法在宏平均F1、微平均F1值上均得到了提高。
-
关键词
篇章分析
主次识别
汉语篇章树库
-
Keywords
discourse parsing
nuclearity recognition
Chinese discourse treebank
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-