基于共享词嵌入空间的跨语言相似问句挖掘

Cross-Language Similar Questions Mining Based on Shared Word Embeddings Space

下载PDF

导出

摘要针对跨语言相似问句查找问题,提出一种基于共享词嵌入空间计算中文和英文问句相似性的方法。该方法首先用fastText训练中、英文词嵌入,之后训练中文词嵌入转换到英文词嵌入的线性矩阵,再对待处理的中、英文问句做相应处理,生成英文空间下句子嵌入,根据句子嵌入余弦相似性计算句子相似性。实验结果表明该方法是可行的。 Aiming at the problem of cross-language similar questions lookup, proposes a method based on Sentence2Embeddings to calculate the similarity between Chinese and English questions. This method first trains Chinese and English word embeddings with fastText, and then trains the Chinese word embeddings to convert to the linear matrix of English word embeddings, then deals with the Chinese questions and English questions sentence to be processed, and generates sentence embedding in English space. Sentence similarity is calculated based on sentence embedding. Experimental results show that the method is feasible.

作者刘鹏周安民 LIU Peng;ZHOU An-min(College of Electronic Information,Sichuan University,Chengdu 610065)

机构地区四川大学电子信息学院

出处《现代计算机》 2019年第8期16-21,共6页 Modern Computer

关键词句子嵌入问句相似跨语言 fastText Sentence2Embeddings Sentence Embeddings Cross-Language Similar to the Question

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

1杨芳权.基于包装产业大数据知识图谱的智能问答系统设计[J].现代电子技术,2018,41(4):143-146. 被引量：10
2朱俚治.一种基于计算机病毒行为权值的检测算法[J].信息技术与标准化,2018(12):69-72.
3魏力恺.建筑的数字符号化表达——探索面向人工智能的狭义建筑数字史学纲要[J].新建筑,2018(6):5-7. 被引量：3
4田程,张娜.如何以热点事件营销提高媒体公信力——以湖北广播电视台“爱心补给站全城送清凉”活动为例[J].新闻前哨,2019(2):45-46. 被引量：1
5张志强.数学核心素养与空间想象力的培养[J].高中数学教与学,2018(12X):1-3.
6李华刚,郝景宏,陈宝山.基于数值分析的大跨度刚架拱桥整体稳定性问题研究[J].工程技术研究,2018,3(14):202-203.
7王天培.浅谈如何做好供电企业用电检查工作[J].科学与信息化,2017,0(11):174-175.
8乔猛,刘慧君,梁光辉.词义层级上的专家系统问题相似度计算优化[J].信息工程大学学报,2018,19(4):447-452. 被引量：1
9张君.曲线钢桥单梁模型与板单元模型计算比较[J].北方交通,2019(2):12-15. 被引量：2
10姚亮.拆迁安置小区的管理困境与网格化管理模式研究——以B市经济技术开发区为例[J].淮海工学院学报（人文社会科学版）,2019,17(3):108-110. 被引量：2

现代计算机

2019年第8期

浏览历史

内容加载中请稍等...

基于共享词嵌入空间的跨语言相似问句挖掘

相关作者

相关机构

相关主题

浏览历史