基于门控卷积机制与层次注意力机制的多语义词向量计算方法被引量：4

A Multi-sense Word Embedding Method Based on Gated Convolution and Hierarchical Attention Mechanism

下载PDF

导出

摘要现有的将词映射为单一向量的方法没有考虑词的多义性,从而会引发歧义问题;映射为多个向量或高斯分布的方法虽然考虑了词的多义性,但或多或少没能有效利用词序、句法结构和词间距离等信息对词在某一固定语境中语义表达的影响。综合考虑以上存在的问题,该文提出了一种基于非残差块封装的门控卷积机制加以层次注意力机制的方法,分别在所选取语境窗口中词的子语义层、合成语义层获得非对称语境窗口下目标单词的合成语义向量以预测目标单词,并按此法在给定语料上学习得到多语义词向量的计算方法。小规模语料上用该方法得到的多语义词向量,在词类比任务的语义类比上相比于基线方法准确率最高可提升1.42%;在WordSim353、MC、RG、RW等计算单词相似度任务的数据集上相比于基线方法能够达到平均2.11的性能提升,最高可到5.47。在语言建模实验上,该方法的语言模型性能相比于其他预测目标单词的方法也有显著提升。 The existing methods（mapping a word to a single vector）do not consider the problem of polysemy,which may cause the problem of ambiguity;Rather than mapping a word to multiple vectors,this paper proposes a computing method of multi-sense word embedding by：1）fusing hierarchical attention mechanism with non-residual encapsulated gated convolution mechanism in the sub-sense layer and synthetic sense layer of the words in the selected context window,and 2）obtains the synthetic sense embedding of the target word under the asymmetric window to predict the target word.On small-scale corpus,the proposed multi-sense word embedding achieves at most 1.42%increase in the accuracy of the word analogy task,an average 2.11%（up to 5.47%）improvement in the word similarity tasks including WordSim353,MC,RG,and RW.In addition,this method also significantly improves the performance of the language modeling compared with other methods predicting target words.

作者柳杨吉立新黄瑞阳朱宇航李星 LIU Yang;JI Lixin;HUANG Ruiyang;ZHU Yuhang;LI Xing(National Digital Switching System Engineering and Technological RInD Center,Zhengzhou,Henan 450002,China)

机构地区国家数字交换系统工程技术研究中心

出处《中文信息学报》 CSCD 北大核心 2018年第7期1-10,19,共11页 Journal of Chinese Information Processing

基金国家自然科学基金(61601513)

关键词多语义词向量层次注意力门控卷积 Multi-sense word embedding hierarchical attention gated convolution

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献35

1李妮,关焕梅,杨飘,董文永.基于BERT-IDCNN-CRF的中文命名实体识别方法[J].山东大学学报（理学版）,2020,55(1):102-109. 被引量：49
2杨超,冯时,王大玲,杨楠,于戈.基于情感词典扩展技术的网络舆情倾向性分析[J].小型微型计算机系统,2010,31(4):691-695. 被引量：68
3周咏梅,杨佳能,阳爱民.面向文本情感分析的中文情感词典构建方法[J].山东大学学报（工学版）,2013,43(6):27-33. 被引量：40
4欧阳继红,刘燕辉,李熙铭,周晓堂.基于LDA的多粒度主题情感混合模型[J].电子学报,2015,43(9):1875-1880. 被引量：23
5蔡国永,夏彬彬.基于卷积神经网络的图文融合媒体情感预测[J].计算机应用,2016,36(2):428-431. 被引量：25
6陆钊.嵌入式数据库中多维离散数据检测仿真[J].计算机仿真,2017,34(3):400-403. 被引量：9
7李信,李旭晖,陆伟,黄薇.大数据驱动下的图书情报学科热点领域挖掘——面向WOS题录数据的实证视角[J].图书馆论坛,2017,37(4):49-57. 被引量：30
8熊晓军,简世凯,李翔,刘阳.基于标准差统计的窄方位角叠前裂缝预测方法[J].石油地球物理勘探,2017,52(1):114-120. 被引量：5
9林顺富,田二伟,符杨,汤晓栋,李东东,王群京.基于信息熵分段聚合近似和谱聚类的负荷分类方法[J].中国电机工程学报,2017,37(8):2242-2252. 被引量：45
10王欣,胡平,景波.基于度量阈值裁决的WSN恶意节点筛选算法[J].计算机工程与设计,2017,38(5):1142-1147. 被引量：3

引证文献4

1林雪.海量不确定数据集中离群点快速检测方法仿真[J].计算机仿真,2021,38(6):378-382. 被引量：4
2杨璐,何明祥.基于门控机制和卷积神经网络的中文文本情感分析模型[J].计算机应用,2021,41(10):2842-2848. 被引量：4
3陈晋华.基于改进机器学习的智能英语翻译机器人在线校准系统研究[J].自动化与仪器仪表,2022(10):201-206. 被引量：1
4周润民,胡旭耀,吴克伟,于磊,谢昭,江龙.基于交叉注意力的方面级情感分析[J].计算机工程与应用,2023,59(9):190-197. 被引量：1

二级引证文献10

1文志霄,梁志剑.基于词级和语义级注意力的细粒度情感分析模型[J].中北大学学报（自然科学版）,2022,43(5):431-440. 被引量：1
2刘财辉,刘地金.离群点检测的邻近性方法综述[J].计算机工程与应用,2022,58(21):1-12. 被引量：4
3郭飞,吴佳静,周怡,高利燕,麦晓庆.考虑气象因素的台区线损异常智能识别模型及应用[J].宁夏电力,2022(6):26-32.
4叶晟,吴晓朝.基于网格划分和LLE的高维数据离群点自适应检测方法[J].湖南科技大学学报（自然科学版）,2023,38(1):85-91.
5周宁,钟娜,靳高雅,刘斌.基于混合词嵌入的双通道注意力网络中文文本情感分析[J].数据分析与知识发现,2023,7(3):58-68. 被引量：5
6蔡昌骁,王士同.基于相关性差异化迁移的渐进式神经网络[J].计算机应用,2023,43(7):2107-2115.
7邵清,ZHANG Wenshuang,WANG Shaojun.End-to-end aspect category sentiment analysis based on type graph convolutional networks[J].High Technology Letters,2023,29(3):325-334.
8傅丽芳,陈卓,敖长林.基于分类和回归树决策树的网络大数据集离群点动态检测算法[J].吉林大学学报（工学版）,2023,53(9):2620-2625. 被引量：1
9程兆亮,沈雅婷,唐俊杰,王泽铭.改进过滤模型解决音变问题研究[J].电脑与电信,2023(9):5-10.
10李潇.基于人工神经网络的机器自动化翻译及矫正模型构建[J].自动化与仪器仪表,2023(11):20-24.

1梁楠,冀艳波,刘静伟.基于唐文化的服装感性工学技术在服装设计方法中的应用研究[J].新丝路（下旬）,2018,0(12):142-144.
2罗淇尹,刘盾,梁文霞,史楠楠,李京.便携式多功能家居环境监控系统设计[J].智能计算机与应用,2018,8(3):197-200.
3金保华,周兵,王睿,殷长魁.基于词义消歧的短文本情感分类方法研究[J].现代计算机（中旬刊）,2018(7):38-41.
4张立波,孙一涵,罗铁坚.一种基于大规模知识库的语义相似性计算方法[J].计算机研究与发展,2017,54(11):2576-2585. 被引量：13
5王宏,何洋,冯成,雷娜.基于树莓派的远程智能门控系统的设计与实现[J].智能计算机与应用,2018,8(3):79-83. 被引量：3
6林坤,张建寰.提高共焦拉曼光谱成像系统分辨率的技术分析[J].激光杂志,2018,39(8):11-14. 被引量：3
7李剑,冯国瑞.浅谈电力客服重复来电工单文本语义向量分析方法[J].名城绘,2018,0(5):649-649.
8刘佳,刘世理.基于判断构式分析的隐喻语义认知价值取向[J].解放军外国语学院学报,2018,41(1):48-56. 被引量：3
9郭亚,宫叶云,张奇,黄萱菁.基于主题模型的微博转发行为预测[J].中文信息学报,2018,32(4):130-136. 被引量：7
10王雪明.明喻翻译研究:以朱自清散文英译为例[J].北京科技大学学报（社会科学版）,2017,33(5):29-35. 被引量：8

中文信息学报

2018年第7期

浏览历史

内容加载中请稍等...

基于门控卷积机制与层次注意力机制的多语义词向量计算方法被引量：4

同被引文献35

引证文献4

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于门控卷积机制与层次注意力机制的多语义词向量计算方法 被引量：4

同被引文献35

引证文献4

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于门控卷积机制与层次注意力机制的多语义词向量计算方法被引量：4