摘要
句子的相似度计算在自然语言处理的各个领域都占有十分重要的地位。提出了一种多特征融合的句子相似度计算模型,该计算方法把句子的词形、词序、结构、长度、距离和语义这6种特征相似度考虑进来,通过对不同的特征赋予不同的权重来调节各个特征对于句子相似度的贡献,从而使计算结果得到最优。实验结果表明,该方法与其他方法相比,描述句子的信息更加全面,在计算句子相似度方面具有较高的准确率。
Sentence similarity computing is very important in the field of natural language processing.This paper proposes a sentence similarity computing model based on the multi-features combination,it combines the word-form ,word-order,structure, length, distance and semantic of the sentences to calculate the similarity between sentences, using the weight to describe the contribution of each feature of the sentence, then gets a better experiment result.Experiment result shows that this approach can fully describe the features of the sentence,and then can get the more accurate result.
出处
《计算机工程与应用》
CSCD
北大核心
2010年第26期136-137,157,共3页
Computer Engineering and Applications
基金
中国石油大学(华东)计算机与通信工程学院青年教师创新基金(No.08120907)
关键词
自然语言处理
句子相似度
多特征融合
结构相似度
语义相似度
natural language processing
sentence similarity
multi-features combination
structural similarity
semantic similarity