融入结构化信息的端到端中文指代消解被引量：1

End to End Chinese Coreference Resolution with Structural Information

下载PDF

导出

摘要在LEE等人提出的端到端指代消解模型基础上,考虑中文行文特点,提出一种融合结构化信息的中文指代消解模型。压缩文档中所进行有句子对应的成分句法树并获取文档压缩树叶节点深度,采用成分句法树的结构化嵌入(SECT)方法将结构信息进行向量化处理,将词性、文档压缩树叶节点深度与SECT信息作为3个特征向量引入模型中进行中文指代消解。在CoNLL2012数据集中的测试结果表明,通过结合上述3个特征,可使该模型的中文指代消解性能得到有效提高,其平均F1值可达62.33%,较基准模型提升5.28%。 On the basis of the end to end coreference resolution model proposed by LEE et al.,this paper further considers the characteristics of Chinese writing and proposes a Chinese coreference resolution model with structural information.The constituency tree of all sentences is compressed to obtain the leaf node depth of the document compression tree.The Structural Embedding of Constituency Tree(SECT)is used to vectorize the structural information.The part of speech,the leaf node depth and the SECT information are introduced into the model as three eigenvectors for Chinese coreference resolution.The test results on the CoNLL2012 dataset show that the application of the three eigenvectors can effectively improve the Chinese coreference resolution of the proposed model,whose average F1 value can reach 62.33%,which is 5.28%higher than the baseline.

作者付健孔芳 FU Jian;KONG Fang(School of Computer Science and Technology,Soochow University,Suzhou,Jiangsu 251006,China)

机构地区苏州大学计算机科学与技术学院

出处《计算机工程》 CAS CSCD 北大核心 2020年第1期45-51,共7页 Computer Engineering

基金国家自然科学基金(61876118) 国家自然科学基金人工智能基础研究应急管理项目(61751206) 国家重点研发计划子课题(2017YFB1002101)

关键词端到端指代消解结构化嵌入词性成分句法树文档句法压缩树 end to end coreference resolution structural embedding part of speech constituency tree document syntactic compression tree

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1李敏,禹龙,田生伟,吐尔根.依布拉音,赵建国.基于深度学习的维吾尔语名词短语指代消解[J].自动化学报,2017,43(11):1984-1992. 被引量：7
2奚雪峰,周国栋.基于Deep Learning的代词指代消解[J].北京大学学报（自然科学版）,2014,50(1):100-110. 被引量：23
3李冬白,田生伟,禹龙,吐尔根.依布拉音,冯冠军.基于深度学习的维吾尔语人称代词指代消解[J].中文信息学报,2017,31(4):80-88. 被引量：6

二级参考文献17

1王厚峰,梅铮.鲁棒性的汉语人称代词消解[J].软件学报,2005,16(5):700-707. 被引量：36
2李国臣,罗云飞.采用优先选择策略的中文人称代词的指代消解[J].中文信息学报,2005,19(4):24-30. 被引量：33
3周俊生,黄书剑,陈家骏,曲维光.一种基于图划分的无监督汉语指代消解算法[J].中文信息学报,2007,21(2):77-82. 被引量：19
4杨勇,李艳翠,周国栋,朱巧明.指代消解中距离特征的研究[J].中文信息学报,2008,22(5):39-44. 被引量：7
5王海东,胡乃全,孔芳,周国栋.指代消解中语义角色特征的研究[J].中文信息学报,2009,23(1):23-29. 被引量：8
6王海东,胡乃全,孔芳,周国栋.基于树核函数的英文代词消解研究[J].中文信息学报,2009,23(5):33-39. 被引量：6
7李凡,刘启和,李洪伟.基于Fuzzy Rough集模型的汉语人称代词消解[J].计算机科学,2010,37(1):245-250. 被引量：1
8董国志,朱玉全,程显毅.中文人称代词指代消解的研究[J].计算机应用研究,2011,28(5):1774-1776. 被引量：8
9许敏,王能忠,马彦华.汉语中指代问题的研究及讨论[J].西南师范大学学报（自然科学版）,1999,24(6):633-637. 被引量：18
10孔芳,周国栋.基于树核函数的中英文代词消解[J].软件学报,2012,23(5):1085-1099. 被引量：23

共引文献28

1李艳峰,王新晴,张梅军,朱会杰.基于奇异值分解和深度信度网络多分类器的滚动轴承故障诊断方法[J].上海交通大学学报,2015,49(5):681-686. 被引量：25
2李贤慧,余正涛,魏斯超,高盛祥,王立人.基于Listwise的深度学习专家排序方法[J].模式识别与人工智能,2015,28(11):976-982. 被引量：7
3周炫余,刘娟,罗飞,刘洋,颜晗.中文指代消解模型的对比研究[J].计算机科学,2016,43(2):31-34. 被引量：7
4李冬白,田生伟,禹龙,艾斯卡尔.艾木都拉,吐尔根.依布拉音.深度学习的维吾尔语语句隐式情感分类[J].计算机工程与设计,2016,37(9):2577-2580. 被引量：5
5王兆凯,李亚星,冯旭鹏,刘利军,黄青松,刘晓梅.基于深度信念网络的个性化信息推荐[J].计算机工程,2016,42(10):201-206. 被引量：5
6赵一中,刘文波.基于深度信念网络的非限制性人脸识别算法研究[J].计量学报,2017,38(1):65-68. 被引量：6
7张亚军,刘宗田,周文.基于深度信念网络的事件识别[J].电子学报,2017,45(6):1415-1423. 被引量：12
8李冬白,田生伟,禹龙,吐尔根.依布拉音,冯冠军.基于深度学习的维吾尔语人称代词指代消解[J].中文信息学报,2017,31(4):80-88. 被引量：6
9李敏,禹龙,田生伟,吐尔根.依布拉音,赵建国.基于深度学习的维吾尔语名词短语指代消解[J].自动化学报,2017,43(11):1984-1992. 被引量：7
10陶豆豆,禹龙,田生伟,赵建国,吐尔根.依布拉音,艾斯卡尔.艾木都拉.维吾尔语名词短语待消解项识别[J].中文信息学报,2017,31(5):92-98. 被引量：1

同被引文献18

1马月坤,刘鑫,裴嘉诚,秦帅波.基于BERT的中文关系抽取方法[J].计算机产品与流通,2019,0(12):251-251. 被引量：5
2黄锵嘉,黄沛杰,李杨辉,杜泽峰.面向任务口语对话系统中不含槽信息话语的端到端对话控制[J].中文信息学报,2018,32(12):109-117. 被引量：3
3黄学华,孔芳,周国栋.汉语表述识别与指代消解[J].计算机工程,2016,42(9):168-173. 被引量：3
4张伟男,张杨子,刘挺.对话系统评价方法综述[J].中国科学：信息科学,2017,47(8):953-966. 被引量：21
5杨春妮,冯朝胜.结合句法特征和卷积神经网络的多意图识别模型[J].计算机应用,2018,38(7):1839-1845. 被引量：11
6车万翔,张伟男.人机对话系统综述[J].人工智能,2018,0(1):76-82. 被引量：11
7杨丽,吴雨茜,王俊丽,刘义理.循环神经网络研究综述[J].计算机应用,2018,38(A02):1-6. 被引量：384
8李菁,张海松,宋彦.面向非任务型对话系统的人工标注中文数据集[J].中文信息学报,2019,33(3):17-24. 被引量：6
9侯丽仙,李艳玲,李成城.面向任务口语理解研究现状综述[J].计算机工程与应用,2019,55(11):7-15. 被引量：9
10刘娇,李艳玲,林民.人机对话系统中意图识别方法综述[J].计算机工程与应用,2019,55(12):1-7. 被引量：27

引证文献1

1王堃,林民,李艳玲.端到端对话系统意图语义槽联合识别研究综述[J].计算机工程与应用,2020,56(14):14-25. 被引量：14

二级引证文献14

1刘鹏宇,朱雪耀.基于深度学习的融合空域空管指令语义解析技术[J].航空学报,2023,44(S01):160-168.
2于丹,闫晓宇,王艳秋,来关军,肖鹏,王宇.任务型对话机器人的设计及其应用[J].软件工程,2021,24(2):55-59. 被引量：11
3王玉荣,林民,李艳玲.BERT跨语言词向量学习研究[J].计算机科学与探索,2021,15(8):1405-1417. 被引量：2
4杜晓敏,潘晓.基于BERT深度学习模型的地质资料目录自动分类研究[J].中国矿业,2021,30(S02):143-148. 被引量：3
5Xingping Wu,Xusheng Liu,Yeteng An.Key technologies of artificial intelligence in electric power customer service[J].Global Energy Interconnection,2021,4(6):631-640.
6牛迪.基于自注意力机制的多特征融合槽抽取模型[J].南京理工大学学报,2022,46(1):69-75. 被引量：2
7余建明,刘赫,单连飞,张越,乔咏田,姜涛.基于ALBERT和RE2融合模型的电网调度意图识别方法[J].电力系统保护与控制,2022,50(12):144-151. 被引量：2
8郭振东,林民,李成城,赵佳鹏.基于BERT-CRF的领域词向量生成研究[J].计算机工程与应用,2022,58(21):156-162. 被引量：2
9王雷,宋士杰,朱庆华.基于微信公众号文章的失真健康信息识别方法比较与优化[J].情报学报,2023,42(2):127-135. 被引量：2
10程超,葛维,郭兰柯,陈博,张亚炜.基于深度学习的新型电力智能交互平台多任务集成模型研究[J].电测与仪表,2023,60(6):81-85. 被引量：1

1俞木发.简洁高效Linux中使用命令行查看压缩文档[J].电脑爱好者,2018,0(21):39-39.
2飞利浦ISCV星影智能系统助力智慧化超声诊疗[J].中国医院院长,2019,0(22):86-87.
3王冰霜.从张培之的英译本《背影》谈英汉两种语言异同[J].淮北职业技术学院学报,2019,18(6):72-74.
4蒋磊,龚雪明,Stefanie Kaess,鹿蓉,苗华栋.双能量与单能量CT扫描及重建影像在头颈部肿瘤粒子治疗计划靶区显示的差异[J].中国医学计算机成像杂志,2019,25(6):574-580. 被引量：3

计算机工程

2020年第1期

浏览历史

内容加载中请稍等...

融入结构化信息的端到端中文指代消解被引量：1

参考文献3

二级参考文献17

共引文献28

同被引文献18

引证文献1

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

融入结构化信息的端到端中文指代消解 被引量：1

参考文献3

二级参考文献17

共引文献28

同被引文献18

引证文献1

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

融入结构化信息的端到端中文指代消解被引量：1