多特征融合的语句相似度计算模型被引量：19

Model for sentence similarity computing based on multi-features combination

下载PDF

导出

摘要句子的相似度计算在自然语言处理的各个领域都占有十分重要的地位。提出了一种多特征融合的句子相似度计算模型,该计算方法把句子的词形、词序、结构、长度、距离和语义这6种特征相似度考虑进来,通过对不同的特征赋予不同的权重来调节各个特征对于句子相似度的贡献,从而使计算结果得到最优。实验结果表明,该方法与其他方法相比,描述句子的信息更加全面,在计算句子相似度方面具有较高的准确率。 Sentence similarity computing is very important in the field of natural language processing.This paper proposes a sentence similarity computing model based on the multi-features combination,it combines the word-form ,word-order,structure, length, distance and semantic of the sentences to calculate the similarity between sentences, using the weight to describe the contribution of each feature of the sentence, then gets a better experiment result.Experiment result shows that this approach can fully describe the features of the sentence,and then can get the more accurate result.

作者张培颖

机构地区中国石油大学(华东)计算机与通信工程学院

出处《计算机工程与应用》 CSCD 北大核心 2010年第26期136-137,157,共3页 Computer Engineering and Applications

基金中国石油大学(华东)计算机与通信工程学院青年教师创新基金(No.08120907)

关键词自然语言处理句子相似度多特征融合结构相似度语义相似度 natural language processing sentence similarity multi-features combination structural similarity semantic similarity

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献12

1张奇,黄萱菁,吴立德.一种新的句子相似度度量及其在文本自动摘要中的应用[J].中文信息学报,2005,19(2):93-99. 被引量：34
2吕学强,任飞亮,黄志丹,姚天顺.句子相似模型和最相似句子查找算法[J].东北大学学报（自然科学版）,2003,24(6):531-534. 被引量：68
3李素建.基于语义计算的语句相关度研究[J].计算机工程与应用,2002,38(7):75-76. 被引量：83
4李彬,刘挺,秦兵,李生.基于语义依存的汉语句子相似度计算[J].计算机应用研究,2003,20(12):15-17. 被引量：127
5穗志方俞士汶.基于骨架依存树的语句相似度计算模型[C]..中文信息处理国际会议(ICCIP98)论文集[C].,1998.458-465.
6车万翔,刘挺,秦兵,李生.基于改进编辑距离的中文相似句子检索[J].高技术通讯,2004,14(7):15-19. 被引量：64
7王荣波,池哲儒.基于词类串的汉语句子结构相似度计算方法[J].中文信息学报,2005,19(1):21-29. 被引量：28
8周法国,杨炳儒.句子相似度计算新方法及在问答系统中的应用[J].计算机工程与应用,2008,44(1):165-167. 被引量：45
9江敏,肖诗斌,王弘蔚,施水才.一种改进的基于《知网》的词语语义相似度计算[J].中文信息学报,2008,22(5):84-89. 被引量：109
10刘群,李素建.基于知网的词汇语义相似度计算[C]//第三届汉语词汇语义学研讨会.台北,2002.

二级参考文献68

1刘海涛.依存语法和机器翻译[J].语言文字应用,1997(3):91-95. 被引量：43
2高思丹,袁春风.语句相似度计算在主观题自动批改技术中的初步应用[J].计算机工程与应用,2004,40(14):132-135. 被引量：47
3夏天,樊孝忠,刘林,骆正华.基于ALICE的汉语自然语言接口[J].北京理工大学学报,2004,24(10):885-889. 被引量：11
4郭艳华,周昌乐.一种汉语语句依存关系网协动生成方法研究[J].杭州电子工业学院学报,2000,20(4):24-32. 被引量：11
5李良富,樊孝忠,李宏乔,顾益军.知识是如何驱动Q/A系统的[J].计算机工程与应用,2004,40(20):70-73. 被引量：8
6张奇,黄萱菁,吴立德.一种新的句子相似度度量及其在文本自动摘要中的应用[J].中文信息学报,2005,19(2):93-99. 被引量：34
7吴健,吴朝晖,李莹,邓水光.基于本体论和词汇语义相似度的Web服务发现[J].计算机学报,2005,28(4):595-602. 被引量：218
8胡国全,陈家骏,戴新宇,尹存燕.一种基于实例的汉英机器翻译策略[J].计算机工程与设计,2005,26(4):900-903. 被引量：5
9骆正华,樊孝忠,刘林.本体论在自动问答系统中的应用[J].计算机工程与应用,2005,41(32):229-232. 被引量：5
10朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326

共引文献450

1贾善崇,周兰江,张建安,周枫.融入多特征的汉-老双语对齐方法[J].中国水运（下半月）,2020,20(3):78-80. 被引量：2
2张嵩,杨晓明,田露.基于语义相似度计算的航天标准关联度评价[J].南京航空航天大学学报,2021,53(S01):153-156. 被引量：3
3李茂胜,王天一.基于多特征融合的羊养殖问句相似度评价方法[J].智能计算机与应用,2021,11(12):22-27.
4刘茂福,李淑君,金可佳,张晓龙.多文档自动文摘中的特征组合优化[J].计算机系统应用,2008,17(8):59-63. 被引量：3
5王常亮,闫利华,吴曦德.基于XML的智能答疑系统研究[J].赤峰学院学报（自然科学版）,2008,24(9):86-89.
6周粉,夏幼明.一种改进的基于知网的语义相似度计算方法[J].云南大学学报（自然科学版）,2008,30(S2):215-218. 被引量：1
7余正涛,邓锦辉,韩露,毛存礼,郑志蕴,郭剑毅.受限域FAQ中文问答系统研究[J].计算机研究与发展,2007,44(z2):388-393. 被引量：6
8柴晓丽,张丽伟,管玉玲.基于HowNet自动文摘的研究[J].电脑编程技巧与维护,2009(S1):164-165. 被引量：1
9高思丹,袁春风.语句相似度计算在主观题自动批改技术中的初步应用[J].计算机工程与应用,2004,40(14):132-135. 被引量：47
10刘亚军,徐易.一种基于加权语义相似度模型的自动问答系统[J].东南大学学报（自然科学版）,2004,34(5):609-612. 被引量：35

同被引文献162

1钱爱兵,江岚.基于改进TF-IDF的中文网页关键词抽取——以新闻网页为例[J].情报理论与实践,2008,31(6):945-950. 被引量：29
2刘海涛.依存语法和机器翻译[J].语言文字应用,1997(3):91-95. 被引量：43
3刘胜久,李天瑞,贾真,尹红风.元搜索引擎排序方法建模与算法研究[J].计算机科学,2012,39(S3):197-199. 被引量：4
4车万翔,刘挺,秦兵,李生.基于改进编辑距离的中文相似句子检索[J].高技术通讯,2004,14(7):15-19. 被引量：64
5颜志军,孙宝文,王天梅.基于UML的业务流程模型分析方法研究[J].计算机工程与应用,2004,40(29):226-228. 被引量：9
6郭艳华,周昌乐.一种汉语语句依存关系网协动生成方法研究[J].杭州电子工业学院学报,2000,20(4):24-32. 被引量：11
7王荣波,池哲儒.基于词类串的汉语句子结构相似度计算方法[J].中文信息学报,2005,19(1):21-29. 被引量：28
8尚俊杰,李芳乐,李浩文.“轻游戏”:教育游戏的希望和未来[J].电化教育研究,2005,26(1):24-26. 被引量：193
9张奇,黄萱菁,吴立德.一种新的句子相似度度量及其在文本自动摘要中的应用[J].中文信息学报,2005,19(2):93-99. 被引量：34
10金博,史彦军,滕弘飞.基于语义理解的文本相似度算法[J].大连理工大学学报,2005,45(2):291-297. 被引量：80

引证文献19

1汪力君,张庆.高校智能化短信服务平台的建设与研究[J].吉林师范大学学报（自然科学版）,2012,33(4):106-108.
2周群芳.相似专利检测研究[J].现代图书情报技术,2012(11):60-64. 被引量：3
3曾兰星.突出激励机制的VB代码评测系统的开发与应用[J].职业教育研究,2013(8):172-174. 被引量：1
4于洪志,夏建华,万福成,陈新一.基于藏语句多特征融合的主观题自动评分算法[J].计算机工程与应用,2014,50(5):216-220. 被引量：1
5刘胜久,李天瑞,贾真,景运革.基于搜索引擎的相似度研究与应用[J].计算机科学,2014,41(4):211-214. 被引量：3
6侯丽敏,张永强.面向课程的中文FAQ自动问答系统模型[J].计算机与现代化,2014(10):20-24. 被引量：3
7王全民,曹建奇,王莉.一种基于多特征混合句子相似度计算的改进[J].计算机与现代化,2015(7):31-33. 被引量：2
8毛良文,徐亮.基于句子权重和篇章结构的政府公文自动文摘算法[J].计算机与现代化,2015(12):19-24. 被引量：1
9李峰,黄金柱,李舟军,杨伟铭.使用关键词扩展的新闻文本自动摘要方法[J].计算机科学与探索,2016,10(3):372-380. 被引量：14
10谭文斌,张太华,何二宝.基于多特征融合的产品评论语句相似度计算[J].贵州师范大学学报（自然科学版）,2016,34(1):81-87.

二级引证文献75

1黄波,刘传才.基于加权TextRank的中文自动文本摘要[J].计算机应用研究,2020,37(2):407-410. 被引量：21
2闫硕,付丽琴,邢亚英,侯佳丽,马玲.基于Seq2Seq的校园招生智能客服设计与实现[J].电声技术,2022,46(8):72-74. 被引量：2
3余莹,朱贤友.网络评测系统在程序设计教学中的应用研究[J].衡阳师范学院学报,2013,34(6):44-47. 被引量：1
4陈颖,李芳,吴英杰.面向技术解决方案的专利分析方法及其应用效果[J].中华医学图书情报杂志,2014,23(4):18-23. 被引量：1
5王秀红,袁艳,赵志程,李洁玉,刘海军,杨国立.专利文献的结构树模型及其在相似度计算中的应用[J].情报理论与实践,2015,38(3):107-111. 被引量：8
6李成龙,多拉.藏语单句相似度计算模型研究[J].中国科技纵横,2016,0(6):220-221. 被引量：1
7黄洪,陈德锐.基于语义依存的汉语句子相似度改进算法[J].浙江工业大学学报,2017,45(1):6-9. 被引量：11
8杜秀英.基于聚类与语义相似分析的多文本自动摘要方法[J].情报杂志,2017,36(6):167-172. 被引量：7
9陈二静,姜恩波.文本相似度计算方法研究综述[J].数据分析与知识发现,2017,1(6):1-11. 被引量：76
10郭显久,程罗德,张菁,张红.高校水产特色资源数据库建设与开发应用研究[J].农业图书情报学刊,2018,30(3):42-47.

1张艳杰,邵雄凯,刘建舟.一种基于语义与结构的句子相似度计算方法[J].湖北工业大学学报,2015,30(5):82-85. 被引量：5
2薛慧芳.句子相似度计算初探[J].科技信息,2009(19):162-162. 被引量：2
3饶倩,文红,喻文,毛祺琦,苏伟伟.超像素及其应用综述[J].电脑与信息技术,2013,21(5):1-3. 被引量：8
4张超,侯青青,陶宏敏,李俊杰,邹威.基于句子相似度语句定位的文本作业检测技术[J].计算机光盘软件与应用,2013,16(4):278-278.
5许展乐,张琳.中文问答系统中句子相似度计算方法研究[J].现代计算机,2010,16(5):34-37.
6李园伟,宁可为,王炜.分布式自动答疑系统[J].计算机系统应用,2012,21(7):22-25. 被引量：1
7汪星一,林木辉.基于语义Web的受限领域智能答疑系统设计[J].闽江学院学报,2009,30(5):89-92.
8魏光杏.基于人类视觉特性和结构相似度图像评价方法[J].怀化学院学报,2009,28(11):42-44.
9熊晶,王继鹏,魏墨济.基于细粒度依存关系的中文长句相似度计算[J].科学技术与工程,2017,17(11):277-281. 被引量：4
10苏慧群.XML文档数对序列模型与结构相似度算法研究[J].湖南广播电视大学学报,2010(3):79-84.

计算机工程与应用

2010年第26期

浏览历史

内容加载中请稍等...

多特征融合的语句相似度计算模型被引量：19

参考文献12

二级参考文献68

共引文献450

同被引文献162

引证文献19

二级引证文献75

相关作者

相关机构

相关主题

浏览历史

多特征融合的语句相似度计算模型 被引量：19

参考文献12

二级参考文献68

共引文献450

同被引文献162

引证文献19

二级引证文献75

相关作者

相关机构

相关主题

浏览历史

多特征融合的语句相似度计算模型被引量：19