-
题名基于VSM和LDA模型的FAQ问答系统
被引量:3
- 1
-
-
作者
郑诚
刘娇丽
项珑
-
机构
安徽大学计算机科学与技术学院
-
出处
《计算机技术与发展》
2014年第1期133-135,共3页
-
基金
安徽省自然科学基金资助项目(11040606M133)
-
文摘
传统的搜索引擎返回的数据太过庞大,很多情况下用户不能快速地找到自己要的答案。在这种情况下,文中引入FAQ系统。FAQ中如何找到最佳匹配答案,是文中的研究重点。改进了传统的VSM模型,使得它能更好地体现问题中词的权重。重点引入了LDA模型,并用计算机故障领域内的文档资料对它进行训练,得到主题-词的概率分布。通过主题-词中词的概率分布,计算词与词的相关度,提出通过词与词间相关度计算句子与句子间相似度的算法。对两个算法进行综合,得到最终的相似度算法。文中对FAQ进行整理,得到了FAQ问答系统的雏形。通过实验分析,说明相似度算法有很好的效果。
-
关键词
VSM
相似度计算
LDA(Latent
DIRICHLET
Allocation)
主题-词分布
-
Keywords
VSM
similarity calculation
LDA ( Latent Dirichlet Allocation)
topic-term distribution
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-