基于深度学习的维吾尔语名词短语指代消解被引量：7

Coreference Resolution of Uyghur Noun Phrases Based on Deep Learning

下载PDF

导出

摘要针对维吾尔语名词短语指代现象,提出了一种利用栈式自编码深度学习算法进行基于语义特征的指代消解方法.通过对维吾尔语名词短语指称性的研究,提取出利于消解任务的13项特征.为提高特征对文本语义的表达,在特征集中引入富含词汇语义及上下文位置关系的Word embedding.利用深度学习机制无监督的提取隐含的深层语义特征,训练Softmax分类器进而完成指代消解任务.该方法在维吾尔语指代消解任务中的准确率为74.5%,召回率为70.6%,F值为72.4%.实验结果证明,深度学习模型较浅层的支持向量机更合适于本文的指代消解任务,对Word embedding特征项的引入,有效地提高了指代消解模型的性能. Aimed at the reference phenomena of Uyghur noun phrases, a method using stacked autoencoder model to achieve coreference resolution based on semantic characteristics is presented. Through the study of noun phrases referentiality, we pick up beneficial 13 features for coreference resolution tasks. In order to improve the expression of features for semantic text, Word embedding is added into feature sets, which makes feature sets contain lexical semantic information and context positional relationship. A deep learning algorithm is proposed for unsupervised detection of implicit semantic information, and also introduced is a softmax classifier to decide whether the two markables actually corefer. Experiments show that precision rate, recall rate and F value of coreference resolution reach 74.5 %, 70.6 % and 72.4 %, respectively, which demonstrates that the proposed method on coreference resolution of Uyghur noun phrase and introduction of Word embedding to feature sets are able to improve the performance of coreference resolution system.

作者李敏禹龙田生伟吐尔根.依布拉音赵建国

机构地区新疆大学软件学院新疆大学网络中心新疆大学信息科学与工程学院新疆大学人文学院

出处《自动化学报》 EI CSCD 北大核心 2017年第11期1984-1992,共9页 Acta Automatica Sinica

基金国家自然科学基金(61563051 61262064 61662074 61331011) 自治区科技人才培养项目(QN2016YX0051)资助~~

关键词深度学习栈式自编码神经网络指代消解 WORD EMBEDDING 维吾尔语 Deep learning, stacked autoencoder, coreference resolution, word embedding, Uyghur

分类号 TP181 [自动化与计算机技术—控制理论与控制工程] TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1周俊生,黄书剑,陈家骏,曲维光.一种基于图划分的无监督汉语指代消解算法[J].中文信息学报,2007,21(2):77-82. 被引量：19
2王海东,胡乃全,孔芳,周国栋.指代消解中语义角色特征的研究[J].中文信息学报,2009,23(1):23-29. 被引量：8
3孔芳,周国栋.基于树核函数的中英文代词消解[J].软件学报,2012,23(5):1085-1099. 被引量：23
4奚雪峰,周国栋.基于Deep Learning的代词指代消解[J].北京大学学报（自然科学版）,2014,50(1):100-110. 被引量：23
5王厚峰,梅铮.鲁棒性的汉语人称代词消解[J].软件学报,2005,16(5):700-707. 被引量：36
6贺宇,潘达,付国宏.基于自动编码特征的汉语解释性意见句识别[J].北京大学学报（自然科学版）,2015,51(2):234-240. 被引量：6

二级参考文献51

1王厚峰,梅铮.鲁棒性的汉语人称代词消解[J].软件学报,2005,16(5):700-707. 被引量：36
2李国臣,罗云飞.采用优先选择策略的中文人称代词的指代消解[J].中文信息学报,2005,19(4):24-30. 被引量：33
3周俊生,黄书剑,陈家骏,曲维光.一种基于图划分的无监督汉语指代消解算法[J].中文信息学报,2007,21(2):77-82. 被引量：19
4Wee. Meng Soon, Hwee Tou Ng and Daniel Chung Yong lim. A machine learning approach to coreference resolution of noun phrase[J]. Computational Linguistics,2001,27(4): 521-544.
5Vincent Ng and Claire Cardie. Improving machine learning approaches to coreference resolution [C]// Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics,2002.
6YangX. F., Su J., Zhou G.D. and Tan C. L. 2004 Improving pronoun resolution by incorporating eorefer ential information of candidates[C]//ACL'2004:127 134, Barcelona, Spain, 21-26, July,2004 .
7Yang X.F. ,Zhou G.D. , Su J. and. Tan C. L. 2003. Coreference Resolution Using Competition Learning Approach[C]//ACL'2003: 176-183, Sapporo, Japan, 7-12, July, 2003.
8Yang X. F. , Su J. and Tan C.L. 2006, Kernel-Based Pronoun Resolution with Structured Syntactic Knowl edge[C]//ACL' 2006..41-48, Sydney,July. 2006.
9Zhou G. D. and Su J. 2004. A high-performance coreference resolution system using a multi-agent strategy[C]//COLING'2004:522-528. 23 27, Aug, 2004, Geneva, Switzerland.
10Zhou GD. and Su J. 2002. Named Entity Recognition using an HNMM-based Chunk Tagger[C]//ACL' 2002: 473-480, Philadelphia, July,2002.

共引文献79

1徐琳,赵铁军.国家自然科学基金在自然语言处理领域近年来资助的已结题项目综述[J].软件学报,2005,16(10):1853-1858. 被引量：7
2周俊生,黄书剑,陈家骏,曲维光.一种基于图划分的无监督汉语指代消解算法[J].中文信息学报,2007,21(2):77-82. 被引量：19
3庞宁,杨尔弘.基于统计模型与规则的指代消解研究[J].太原科技,2007(5):61-62. 被引量：2
4赵军,刘非凡.Linguistic Theory Based Contextual Evidence Mining for Statistical Chinese Co-Reference Resolution[J].Journal of Computer Science & Technology,2007,22(4):608-617. 被引量：1
5肖春,周建龙.生物医学领域中的文本信息抽取技术与系统综述[J].计算机应用研究,2007,24(9):1-7. 被引量：6
6冯元勇,孙乐,董静,李文波.基于分类信心重排序的中文共指消解研究[J].中文信息学报,2007,21(6):22-28.
7李元龙,周俊生,陈家骏.一种基于关联聚类的汉语共指消解方法[J].计算机科学,2007,34(12):216-218. 被引量：2
8庞宁,苏尚宏,赖振丹.中文人称代词消解研究[J].太原科技大学学报,2008,29(3):179-181. 被引量：2
9宋巍,秦兵,郎君,刘挺.句法与词义相结合的中文代词消解[J].中文信息学报,2008,22(6):8-13. 被引量：4
10谢永康,周雅倩,黄萱菁.一种基于谱聚类的共指消解方法[J].中文信息学报,2009,23(3):10-16. 被引量：5

同被引文献14

1王厚峰,梅铮.鲁棒性的汉语人称代词消解[J].软件学报,2005,16(5):700-707. 被引量：36
2王海东,胡乃全,孔芳,周国栋.指代消解中语义角色特征的研究[J].中文信息学报,2009,23(1):23-29. 被引量：8
3许敏,王能忠,马彦华.汉语中指代问题的研究及讨论[J].西南师范大学学报（自然科学版）,1999,24(6):633-637. 被引量：18
4王厚峰,何婷婷.汉语中人称代词的消解研究[J].计算机学报,2001,24(2):136-143. 被引量：36
5奚雪峰,周国栋.基于Deep Learning的代词指代消解[J].北京大学学报（自然科学版）,2014,50(1):100-110. 被引量：23
6钟军,禹龙,田生伟,吐尔根.依布拉音.基于双层模型的维吾尔语突发事件因果关系抽取[J].自动化学报,2014,40(4):771-779. 被引量：11
7郑新,李培峰,朱巧明.基于全局优化的中文事件时序关系推理方法[J].中文信息学报,2016,30(5):129-135. 被引量：3
8李冬白,田生伟,禹龙,吐尔根.依布拉音,冯冠军.基于深度学习的维吾尔语人称代词指代消解[J].中文信息学报,2017,31(4):80-88. 被引量：6
9田生伟,周兴发,禹龙,冯冠军,艾山.吾买尔,李圃.基于双向LSTM的维吾尔语事件因果关系抽取[J].电子与信息学报,2018,40(1):200-208. 被引量：18
10王坤峰,左旺孟,谭营,秦涛,李力,王飞跃.生成式对抗网络:从生成数据到创造智能[J].自动化学报,2018,44(5):769-774. 被引量：39

引证文献7

1田生伟,胡伟,禹龙,吐尔根.依布拉音,赵建国,李圃.结合注意力机制的Bi-LSTM维吾尔语事件时序关系识别[J].东南大学学报（自然科学版）,2018,48(3):393-399. 被引量：11
2祁青山,田生伟,禹龙,艾山·吾买尔.基于ATT-IndRNN-CNN的维吾尔语名词指代消解[J].中文信息学报,2019,33(9):60-68.
3付健,孔芳.融入结构化信息的端到端中文指代消解[J].计算机工程,2020,46(1):45-51. 被引量：2
4付晓,沈远彤,李宏伟,程晓梅.基于半监督编码生成对抗网络的图像分类模型[J].自动化学报,2020,46(3):531-539. 被引量：14
5张江,田生伟,禹龙.CNN_BiLSTM双通道维吾尔语名词短语指代消解[J].计算机仿真,2020,37(4):255-259.
6杨启萌,禹龙,田生伟,艾山·吾买尔.基于深度强化学习的维吾尔语人称代词指代消解[J].电子学报,2020,48(6):1077-1083. 被引量：3
7杨启萌,禹龙,田生伟,艾山·吾买尔.基于多注意力机制的维吾尔语人称代词指代消解[J].自动化学报,2021,47(6):1412-1421.

二级引证文献30

1周海华,曹春萍.基于BLSTM-CRF的领域知识点实体识别技术[J].软件,2019,40(2):1-5.
2王伟,孙玉霞,齐庆杰,孟祥福.基于BiGRU-attention神经网络的文本情感分类模型[J].计算机应用研究,2019,36(12):3558-3564. 被引量：66
3徐德华,张未央.基于深度记忆网络的在线评论细粒度情感分类[J].电子制作,2020,0(1):28-29.
4饶竹一,张云翔.基于BiGRU和注意力机制的多标签文本分类模型[J].现代计算机,2020,26(1):31-35. 被引量：4
5李凌浩,李欣晔,张承强,周雄图,张永爱.基于Bi-GRU和双层注意力机制的商品评论情感分析[J].广播电视网络,2020,27(2):102-107. 被引量：1
6姚苗,杨文忠,袁婷婷,马国祥.自注意力机制的短文本分类算法[J].计算机工程与设计,2020,41(6):1592-1598. 被引量：7
7王堃,林民,李艳玲.端到端对话系统意图语义槽联合识别研究综述[J].计算机工程与应用,2020,56(14):14-25. 被引量：17
8孙敏,李旸,庄正飞,钱涛.基于BGRU和自注意力机制的情感分析[J].江汉大学学报（自然科学版）,2020,48(4):80-89. 被引量：5
9孙敏,李旸,庄正飞,余大为.基于并行混合网络融入注意力机制的情感分析[J].计算机应用,2020,40(9):2543-2548. 被引量：3
10莫建文,贾鹏.基于改进梯形网络的半监督虚拟对抗训练模型[J].桂林电子科技大学学报,2020,40(4):321-327. 被引量：1

1李冬白,田生伟,禹龙,吐尔根.依布拉音,冯冠军.基于深度学习的维吾尔语人称代词指代消解[J].中文信息学报,2017,31(4):80-88. 被引量：6
2黄红梅,严海林,冉鸣.基于中学化学教学资源库的深度学习实践探讨[J].中学化学教学参考,2017,0(21):45-48. 被引量：1
3廖文琪,徐鲁强.游戏化学习机制在小学数学微课中的应用研究[J].中国教育信息化,2017,23(22):10-12. 被引量：8
4秦越,禹龙,田生伟,赵建国,冯冠军.基于深度置信网络的维吾尔语人称代词待消解项识别[J].计算机科学,2017,44(10):228-233. 被引量：1
5沈先耿.基于稀疏自编码神经网络的军事目标图像分类[J].指挥与控制学报,2017,3(3):245-248. 被引量：4
6陈仁祥,黄鑫,杨黎霞,汤宝平,陈思杨,杨星.加噪样本扩展深度稀疏自编码神经网络的滚动轴承寿命阶段识别[J].振动工程学报,2017,30(5):874-882. 被引量：14
7王沙婷,范毓熙,白利娟.航空舵机生产资源冲突问题的消解模型构建及应用[J].航空制造技术,2017,60(20):104-109. 被引量：1
8郭洁,顾阳.汉语比较句引介词的功能特征再析[J].语言科学,2017,16(6):586-597.
9伊尔夏提.吐尔贡,吾守尔.斯拉木,热西旦木.吐尔洪太.基于有监督分词方法的维吾尔文情感分析[J].计算机工程与设计,2017,38(11):3143-3146. 被引量：3
10范梦瑶.利用集成分类器进行稀有类分类[J].科技与创新,2017(24):46-48.

自动化学报

2017年第11期

浏览历史

内容加载中请稍等...

基于深度学习的维吾尔语名词短语指代消解被引量：7

参考文献6

二级参考文献51

共引文献79

同被引文献14

引证文献7

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

基于深度学习的维吾尔语名词短语指代消解 被引量：7

参考文献6

二级参考文献51

共引文献79

同被引文献14

引证文献7

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

基于深度学习的维吾尔语名词短语指代消解被引量：7