-
题名一种基于向量词序的句子相似度算法研究
被引量:15
- 1
-
-
作者
程志强
闵华松
-
机构
武汉科技大学信息科学与工程学院
武汉科技大学冶金自动化与检测技术教育部工程研究中心
-
出处
《计算机仿真》
CSCD
北大核心
2014年第7期419-424,共6页
-
基金
国家自然科学基金(61175094)
-
文摘
针对传统的句子相似度算法在句法结构等方面存在匹配率低的问题。为提高相似度计算的准确性,提出了一种改进的基于向量距离词序的句子相似度算法,从特征领域权重和词序方面进行改进,通过建立相应的领域特征集,对于相关领域的特征项给予更高的权重,同时,在向量空间模型的基础上,引入词序因子,计算句子词序相似度。使用包含6个领域的2651个句子作为语料库,实验结果表明,改进方法使特征领域内句子相似度计算的准确度得到提高。
-
关键词
向量空间模型
特征领域权重
词序
-
Keywords
Vector space model
Text feature-weight
Chinese word order
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-