采用拼音降维的中文对话模型被引量：1

A Chinese Conversation Model Using Pinyin for Dimension Reduction

下载PDF

导出

摘要对话是自然语言处理的一个重要研究领域,其成果已经得到广泛的应用。然而中文对话模型训练时由于字词数量庞大,必然会面临模型复杂度过高的问题。为解决此问题,该文首先将对话模型的汉字输入转化为拼音输入并将拼音分为声母、韵母和声调三个部分,以此减小输入的字词数量。然后以嵌入编码的方法将拼音信息组合为图像形式,再通过全卷积神经网络(FCN)和双向Long Short Term Memory(LSTM)网络提取拼音特征。最后采用4层的Gated Recurrent Units(GRU)网络对拼音特征进行解码以解决长时记忆问题,得到对话模型的输出。在此基础上,模型在解码阶段加入了注意力机制,使模型的输出可以更好地与输入进行对应。为对提出的中文对话模型进行评价,该文建立了应用于医疗领域的中文对话数据库,并以BLEU和ROUGE_L为评价指标在该数据库上对模型进行了测试。 Conversation is an important research field in natural language processing with wide applications.However,when training the Chinese conversation model,we have to face the problem of excessively high model complexity due to the large number of words.To deal with this issue,this paper proposes to convert the Chinese input into Pinyin and divide it into initials,finals and tones three parts,thereby reducing the number of words.Then,the Pinyin information is combined into image form using embedding method.We extract the Pinyin feature through a Fully Convolutional Network(FCN)and a bi-directional Long Short Term Memory(LSTM)network.Finally,we use a 4-layer Gated Recurrent Units(GRU)network to decode the Pinyin feature for solving the problem of long time memory,and obtain the output of the conversation model.On this basis,the attention mechanism is added in the decoding stage so that the output can correspond with the input better.In the experiment,we set up a conversation database in the medical field,and use BLEU and ROUGE_L as an evaluation indicator to test our model on the database.

作者吴邦誉周越赵群飞张朋柱 WU Bangyu;ZHOU Yue;ZHAO Qunfei;ZHANG Pengzhu(Key Laboratory of System Control and Information Processing,Department of Automation,Shanghai Jiao Tong University, Shanghai 200240,China;College of Management Information System, Antai College of Economics and Management,Shanghai Jiao Tong University,Shanghai 200240, China)

机构地区上海交通大学自动化系系统控制与信息处理教育部重点实验室上海交通大学安泰经济与管理学院管理信息系统系

出处《中文信息学报》 CSCD 北大核心 2019年第5期113-121,共9页 Journal of Chinese Information Processing

基金国家自然科学基金(91646205)

关键词对话模型拼音特征注意力机制 conversation model Pinyin feature attention mechanism

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1赵宇晴,向阳.基于分层编码的深度增强学习对话生成[J].计算机应用,2017,37(10):2813-2818. 被引量：6
2王文,赵群飞,朱特浩.人-服务机器人交互中自然语言理解研究[J].微型电脑应用,2015,31(3):45-49. 被引量：7
3赵博轩,房宁,赵群飞,张朋柱.利用拼音特征的深度学习文本分类模型[J].高技术通讯,2017,27(7):596-603. 被引量：8

二级参考文献14

1Pulasinghe K, Watanabe K, Izumi K, Kiguchi K. Modular fuzzy-neuro controller driven by spoken language com- mands[J]. IEEE Transactions on Systems, Man, and Cy- bernetics, Part B: Cybernetics,2004, 34(1):293-302.
2Matuszek C, Herbst E, Zettlemoyer L, et al. Learning to parse natural language commands to a robot control sys- tem[C]//Experimental Robotics. Springer International Publishing, 2013:403-415.
3Misra D K, Sung J, Lee K, et al. Tell me dave: Con- text-sensitive grounding of natural language to mobile manipulation instructions[C]//Robotics: Science and Sys- tems, RSS. 2014.
4Roth D, Tu Y. Aspect guided text categorization with unobserved labels[C]//Data Mining, Ninth IEEE Interna- tional Conference on. IEEE, 2009: 962-967.
5Berger AL, Della Pietra SA, Della Pietra VJ. A maximum entropy approach to natural language processing[J]. Computational Linguistics, 1996, 22(1):39-71.
6Salton G, Wong A,Yang C. A VectorSpace Model for Automatic Indexing[J]. Communications of ACM, 1975, 18(11):613-620.
7Mnic D, Grobelnik M. Feature Selection for Unbalanced Class Distribution and Nafve Bayees[C]//Proceedings ofthe 6th International Conference on Machine Learning. Blrf: Morgan Kaufmann, 1999: 258-267.
8Zhang Le. Maximum Entropy Modeling Toolkit for Py- thon and C++[EB/OL].http://homepages.inf.ed.ac.uk/ lzhang 10/maxent_toolkit.html.
9骆家伟,牟琳,靳泰戈.智能家庭服务机器人语音系统实现[J].计算机应用,2010,30(12):322-325. 被引量：8
10李新德,张秀龙,戴先中.一种基于受限自然语言处理的移动机器人视觉导航方法[J].机器人,2011,33(6):742-749. 被引量：10

共引文献18

1左瑛,朱丽萍,方霓,王寅,梁栋.上海市孕产妇贫血情况的调查[J].上海医学,2000,23(5):315-316. 被引量：3
2张梦洋,田国会,龚京,袁媛.基于本体知识库的服务决策机制的设计方法[J].华中科技大学学报（自然科学版）,2017,45(10):70-74. 被引量：3
3来云.图书馆智能化咨询问答机器人系统设计与语料技术研究[J].现代情报,2017,37(11):121-124. 被引量：12
4赵博轩,房宁,赵群飞,张朋柱.利用拼音特征的深度学习文本分类模型[J].高技术通讯,2017,27(7):596-603. 被引量：8
5张梦洋,田国会,龚京,袁媛.基于强化学习的服务规划生成方法[J].华中科技大学学报（自然科学版）,2018,46(9):59-63. 被引量：2
6王凡,尹浩伟,蒋峰岭,郭玉堂.服务机器人自然语言处理的研究与应用[J].安徽科技学院学报,2018,32(4):61-69. 被引量：3
7周震卿,韩立新.基于TextCNN情感预测器的情感监督聊天机器人[J].微型电脑应用,2019,35(5):104-106. 被引量：3
8何杨,肖基毅.基于深度强化学习的网络共享资源智能调度方法[J].自动化与仪器仪表,2019,0(6):80-82. 被引量：3
9侯雨铃.中文文本汉语拼音自动产生系统设计方案[J].软件,2019,40(9):144-147.
10易炜,何嘉,邹茂扬.基于循环神经网络的对话系统记忆机制[J].计算机工程与设计,2019,40(11):3259-3264. 被引量：6

同被引文献1

1宋皓宇,张伟男,刘挺.基于DQN的开放域多轮对话策略学习[J].中文信息学报,2018,32(7):99-108. 被引量：5

引证文献1

1刘喜凯,林鸿飞,徐博,杨亮,任玉琪.基于检索结果融合机制的对话生成模型[J].中文信息学报,2021,35(7):134-142.

1吉晓梅.基于思维导图的初中英语教学探究[J].考试周刊,2019,0(45):122-122.
2陈英妮.论提高学生汉字书写能力的有效途径[J].教育革新,2019,0(3):57-57. 被引量：1
3王晓翠.浅谈初中英语教学中的英汉对比情境创设[J].英语教师,2017,17(15):136-139. 被引量：1
4艾美酒店携手法国美妆品牌La Bouche Rouge定制红唇体验[J].中国会展,2019,0(10):21-21.
5张胜军.综合心理治疗对精神分裂症患者认知功能的影响分析[J].中外医学研究,2019,17(10):177-178. 被引量：4
6王达磊,彭博,潘玥,陈艾荣.基于深度神经网络的锈蚀图像分割与定量分析[J].华南理工大学学报（自然科学版）,2018,46(12):121-127. 被引量：22
7万静,郭雅志.基于多段落排序的机器阅读理解研究[J].北京化工大学学报（自然科学版）,2019,46(3):93-98. 被引量：3
830小时速记3000个单词抗遗忘~? 英语单词速记[J].中学生数理化（初中版．中考版）,2019,0(8):30-30.
9赵思林.数学活动经验的含义新探[J].数学教育学报,2019,28(2):75-80. 被引量：33
10曹宇,李天瑞,贾真,殷成凤.BGRU:中文文本情感分析的新方法[J].计算机科学与探索,2019,13(6):973-981. 被引量：36

中文信息学报

2019年第5期

浏览历史

内容加载中请稍等...

采用拼音降维的中文对话模型被引量：1

参考文献3

二级参考文献14

共引文献18

同被引文献1

引证文献1

相关作者

相关机构

相关主题

浏览历史

采用拼音降维的中文对话模型 被引量：1

参考文献3

二级参考文献14

共引文献18

同被引文献1

引证文献1

相关作者

相关机构

相关主题

浏览历史

采用拼音降维的中文对话模型被引量：1