-
题名无监督的问句相似度匹配方法
被引量:2
- 1
-
-
作者
宋颖毅
叶东升
王坤龙
葛志
-
机构
中国航天科工集团第二研究院研究生院
北京计算机技术及应用研究所
-
出处
《计算机应用研究》
CSCD
北大核心
2020年第S02期69-72,共4页
-
基金
国防基础科研基金资助项目
-
文摘
问句语义匹配作为常用问题集(frequently asked question,FAQ)问答中的关键任务之一,其主要目的是根据用户输入问题与数据库中问题的相似度对数据库中的问题进行排序,并选择出语义相似度高的问题答案返回给用户。通过对深度学习循环神经网络模型的研究,将双向长短期记忆网络模型(Bi-LSTM)与统计学方法(TF-IDF)相结合,使用无监督的方式学习,生成问句的向量表示,计算问句之间的语义相似度,充分利用和挖掘句子的语义信息。通过在公开百科问答集上的对比实验,表明该方法可以很好地提高问答准确性,对于问答系统的构建有着重要意义。
-
关键词
常用问答
语义相似度
双向长短期记忆网络
词频—逆向文件频率
无监督学习
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
-