一种基于多特征混合句子相似度计算的改进被引量：2

An Improvement of Sentence Similarity Calculation Based on Multi-features

下载PDF

导出

摘要句子相似度计算是自然语言处理领域的关键问题,计算句子相似度的方法也有很多。本文针对基于多特征句子相似度计算模型对计算句子相似度结果偏低这一问题进行研究,在词语语义的基础上增加相似词计算,同时增加句子成分关系相似度计算方法,该改进方法既避免了增加额外同义词词典的操作,又充分考虑句子的词形、句长、词序、语义、成分关系等多特征信息,提高了句子相似度的计算结果。实验结果表明,该方法对句子相似度计算有一定的提高,且该方法合理、简便、可行。 Sentence similarity calculation is a key issue in the field of natural language processing. There are many methods to calculate sentence similarity. We research the problem of low calculation results of sentence similarity calculation model based on multi-features. On the basis of word semantic similarity,the paper adds similar word calculation method,at the same time,adds the similarity calculation method of the sentence constituents＇ relationship. The improved method not only avoids the operation of the additional synonyms dictionary,but also fully considers the words in the sentence,sentence length,word order,semantic,the relationship of sentence constituents. The method improves the sentence similarity calculation results. Experimental results show that the method can improve the results of sentence similarity calculation and the method is reasonable,simple and feasible.

作者王全民曹建奇王莉

机构地区北京工业大学计算机学院

出处《计算机与现代化》 2015年第7期31-33,39,共4页 Computer and Modernization

基金国家自然科学基金资助项目(61272500)

关键词句子相似度相似词成分关系多特征 sentence similarity similar word constituent＇s relationship multi-features

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献16

1李春梅,徐庆生.基于多特征的汉语句子相似度计算模型的研究[J].计算机技术与发展,2014,24(6):136-139. 被引量：11
2Li Yuhua, McLean D, Bandar Z A, et al. Sentence similarity based on semantic nets and corpus statistics[J]. Knowledge and Data Engineering, 2006,18(8):1138-1150.
3Salton G, Wong A, Yang C S. A vector space model for automatic indexing[J]. Communication of the ACM, 1975,3(18):613-620.
4车万翔,刘挺,秦兵,李生.基于改进编辑距离的中文相似句子检索[J].高技术通讯,2004,14(7):15-19. 被引量：64
5Sartori G, Lombardi L. Semantic relevance and semantic disorders [J]. Journal of Cognitive Neuroscience, 2004,16(3):439-452.
6穗志方俞士汶.基于骨架依存树的语句相似度计算模型[C]..中文信息处理国际会议(ICCIP98)论文集[C].,1998.458-465.
7张培颖.多特征融合的语句相似度计算模型[J].计算机工程与应用,2010,46(26):136-137. 被引量：19
8赵臻,吴宁,宋盼盼.基于多特征融合的句子语义相似度计算[J].计算机工程,2012,38(1):171-173. 被引量：18
9知网. 知网主页[EB/OL]. http://www.keenage.com, 2015-02-13.
10刘群,李素建. 基于《知网》的词汇语义相似度计算[C]// 台北:第三届汉语词汇语义学研讨会. 2002.

二级参考文献54

1闫宏飞,陈翀.词汇与中心词的距离信息对问句相似度匹配的影响[J].清华大学学报（自然科学版）,2005,45(S1):1873-1877. 被引量：8
2刘海涛.依存语法和机器翻译[J].语言文字应用,1997(3):91-95. 被引量：43
3冯志伟.特思尼耶尔的从属关系语法[J].当代语言学,1983(1):63-65. 被引量：48
4车万翔,刘挺,秦兵,李生.基于改进编辑距离的中文相似句子检索[J].高技术通讯,2004,14(7):15-19. 被引量：64
5郭艳华,周昌乐.一种汉语语句依存关系网协动生成方法研究[J].杭州电子工业学院学报,2000,20(4):24-32. 被引量：11
6李良富,樊孝忠,李宏乔,顾益军.知识是如何驱动Q/A系统的[J].计算机工程与应用,2004,40(20):70-73. 被引量：8
7王荣波,池哲儒.基于词类串的汉语句子结构相似度计算方法[J].中文信息学报,2005,19(1):21-29. 被引量：28
8张奇,黄萱菁,吴立德.一种新的句子相似度度量及其在文本自动摘要中的应用[J].中文信息学报,2005,19(2):93-99. 被引量：34
9胡国全,陈家骏,戴新宇,尹存燕.一种基于实例的汉英机器翻译策略[J].计算机工程与设计,2005,26(4):900-903. 被引量：5
10张敏,罗振声.语料库与知识获取模型[J].中文信息学报,1994,8(1):15-24. 被引量：3

共引文献272

1贾善崇,周兰江,张建安,周枫.融入多特征的汉-老双语对齐方法[J].中国水运（下半月）,2020,20(3):78-80. 被引量：2
2刘海涛,林燕妮.大数据时代语言研究的方法和趋向[J].新疆师范大学学报（哲学社会科学版）,2018,39(1):72-83. 被引量：26
3张嵩,杨晓明,田露.基于语义相似度计算的航天标准关联度评价[J].南京航空航天大学学报,2021,53(S01):153-156. 被引量：3
4宋颖毅,叶东升,王坤龙,葛志.无监督的问句相似度匹配方法[J].计算机应用研究,2020,37(S02):69-72. 被引量：2
5余正涛,邓锦辉,韩露,毛存礼,郑志蕴,郭剑毅.受限域FAQ中文问答系统研究[J].计算机研究与发展,2007,44(z2):388-393. 被引量：6
6刘彬.基于依存语法的消歧策略在机译中的运用[J].湖南医科大学学报（社会科学版）,2003,0(3):95-97.
7高思丹,袁春风.语句相似度计算在主观题自动批改技术中的初步应用[J].计算机工程与应用,2004,40(14):132-135. 被引量：47
8秦兵,刘挺,李生.基于局部主题判定与抽取的多文档文摘技术[J].自动化学报,2004,30(6):905-910. 被引量：10
9于凤,郑德权,赵铁军,李生.基于上下文多元信息的文档相似度计算研究[J].哈尔滨工程大学学报,2006,27(B07):397-402. 被引量：2
10李剑锋,胡国平,王仁华.基于整句相似性计算的韵律短语预测模型[J].小型微型计算机系统,2006,27(10):1935-1938. 被引量：1

同被引文献25

1胡雨晴,纪明宇,王晨龙.基于依存句法的句子相似度计算方法[J].智能计算机与应用,2020(4):113-118. 被引量：2
2梅立军,周强,臧路,陈祖舜.知网与同义词词林的信息融合研究[J].中文信息学报,2005,19(1):63-70. 被引量：28
3裴婧,包宏.汉语句子相似度计算在FAQ中的应用[J].计算机工程,2009,35(17):46-48. 被引量：24
4田久乐,赵蔚.基于同义词词林的词语相似度计算方法[J].吉林大学学报（信息科学版）,2010,28(6):602-608. 被引量：178
5蓝雁玲,陈建超.基于词性及词性依存的句子结构相似度计算[J].计算机工程,2011,37(10):47-49. 被引量：6
6邸书灵,刘晓飞,李欢.基于分词的语句相似度计算的改进[J].石家庄铁道大学学报（自然科学版）,2011,24(4):94-97. 被引量：2
7刘宏哲.一种基于本体的句子相似度计算方法[J].计算机科学,2013,40(1):251-256. 被引量：17
8汪卫明,梁东莺.基于语义依存关系匹配的汉语句子相似度计算[J].深圳信息职业技术学院学报,2014,12(1):56-61. 被引量：4
9李春梅,徐庆生.基于多特征的汉语句子相似度计算模型的研究[J].计算机技术与发展,2014,24(6):136-139. 被引量：11
10张艳杰,邵雄凯,刘建舟.一种基于语义与结构的句子相似度计算方法[J].湖北工业大学学报,2015,30(5):82-85. 被引量：5

引证文献2

1李思卓,周兰江,周枫,张建安.基于互译特征词对匹配的老-汉双语句子相似度计算方法研究[J].现代电子技术,2019,42(24):79-83. 被引量：1
2申震,王逊,黄树成,周尓昊.基于依存句法与词语语义的汉语句子相似度计算[J].江苏科技大学学报（自然科学版）,2022,36(2):65-72. 被引量：1

二级引证文献2

1陈啸,陈建译,张浩骞.基于知识图谱的CTC系统故障诊断方法研究[J].铁道通信信号,2023,59(6):26-31. 被引量：2
2郭泓,尚庆生,赵薇,韩运龙.基于贝叶斯算法的中文新闻标题分类研究[J].现代信息科技,2023,7(23):89-92.

1阮冬茹,潘洪岩,高凯.基于POS-CBOW语言模型的相似词分析[J].河北科技大学学报,2015,36(5):532-538. 被引量：3
2王永生.自动获取不同义项的相似词算法[J].计算机应用与软件,2015,32(3):258-260.
3郭蓝天,李扬,慕德俊,杨涛,李哲.一种基于LDA主题模型的话题发现方法[J].西北工业大学学报,2016,34(4):698-702. 被引量：22
4夏营威,张龙,董浩,荆熠,刘勇.透明BOPP薄膜耐磨性能与材料成分关系的实验方法[J].仪器仪表学报,2012,33(6):1324-1330. 被引量：3
5吴云芳,石静,金澎.基于图的同义词集自动获取方法[J].计算机研究与发展,2011,48(4):610-616. 被引量：13
6昝红英,吴泳钢,贾玉祥,牛桂玲.基于多源知识的中文微博命名实体链接[J].山东大学学报（理学版）,2015,50(7):9-16. 被引量：3
7马晖男,吴江宁,潘东华.一种修正的向量空间模型在信息检索中的应用[J].哈尔滨工业大学学报,2008,40(4):666-669. 被引量：6
8杨学兵,孙航.一种基于本体的混合检索方法[J].计算机技术与发展,2009,19(1):125-127. 被引量：2
9孙瑜,姚瑞波,孙国雄,汤崇熙,俞旭如,骆斌,丁邦泰.利用人工神经网络分析熔炼工艺参数与铁液成分的关系[J].现代铸铁,1998,18(4):39-41. 被引量：3
10杨鸿骏,周亚建,郭玉翠.一种基于同义词扩展的不平衡文本分类方法[J].北京电子科技学院学报,2014,22(2):6-10.

计算机与现代化

2015年第7期

浏览历史

内容加载中请稍等...

一种基于多特征混合句子相似度计算的改进被引量：2

参考文献16

二级参考文献54

共引文献272

同被引文献25

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

一种基于多特征混合句子相似度计算的改进 被引量：2

参考文献16

二级参考文献54

共引文献272

同被引文献25

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

一种基于多特征混合句子相似度计算的改进被引量：2