文本案例相似度计算方法

Research on textual case similarity algorithm

下载PDF

导出

摘要目的针对常用的向量空间模型忽视了文本中的词序和结构信息,影响文本相似度计算的准确度的缺点,提出新的文本案例相似度计算方法。方法将文本表示粒度由词提高到句子,加入词序信息。结果提出了句子向量空间模型及基于该模型的文本案例相似度计算方法。结论这种方法更符合人类理解的模式,提高了文本案例相似度计算的准确度。 Aim The traditional algorithm based on vector space model actually neglects the word order and structure in sentences,which will affect the accuracy of similarity computing.So this paper proposed a new textual case similarity algorithm.Methods The sentence,rather than the word,was used as the unit and the word order information was considered,sentence vector space model was proposed,which is the base of textual case similarity algorithm.Results The method is more consistent with the mode of human understanding and improves the accuracy of textual case similarity compatation.Conclusion The application in textual case classification proves that the method is feasible.

作者赵晓慧吴江董红妮李彦粉袁小蛟张文明

机构地区西北大学信息科学与技术学院

出处《西北大学学报（自然科学版）》 CAS CSCD 北大核心 2010年第6期991-994,共4页 Journal of Northwest University（Natural Science Edition）

基金西北大学科研启动基金资助项目(PR08067) 西北大学研究生自主创新基金资助项目(08YZZ35)

关键词句子向量空间模型词序相似度文本案例分类满意度 sentence vector space model word order similarity textual case classification satisfaction degree

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1任纪生,张弛,王作英.一种基于词序信息的自动文摘方法[J].计算机工程与设计,2007,28(1):178-181. 被引量：3
2RAMIZ M,ALIGULIYEV.A new sentence similarity measure and sentence based extractive technique for automatic text summarization[J].Expert Systems with Applications,2009,36:7764-7772.
3KO Young-joong,PARK Jin-woo,SEO Jung-yun.Improving text categorization using the importance of sentences[J].Information Processing and Management,2004(40):65-79.
4周法国,杨炳儒.句子相似度计算新方法及在问答系统中的应用[J].计算机工程与应用,2008,44(1):165-167. 被引量：45
5周强,施水才,李渝勤,吕学强.句子重述技术在中文文本摘要中的应用[J].情报学报,2008,27(6):897-901. 被引量：3
6赵欣欣,朱铁丹,刘玉树.不同粒度下的文档分类[J].计算机工程,2006,32(20):183-184. 被引量：1

二级参考文献33

1金旭,杨炳儒,菅志刚.自动文摘方法分析[J].计算机应用研究,2004,21(9):5-6. 被引量：8
2李良富,樊孝忠,李宏乔,顾益军.知识是如何驱动Q/A系统的[J].计算机工程与应用,2004,40(20):70-73. 被引量：8
3张奇,黄萱菁,吴立德.一种新的句子相似度度量及其在文本自动摘要中的应用[J].中文信息学报,2005,19(2):93-99. 被引量：34
4胡国全,陈家骏,戴新宇,尹存燕.一种基于实例的汉英机器翻译策略[J].计算机工程与设计,2005,26(4):900-903. 被引量：5
5骆正华,樊孝忠,刘林.本体论在自动问答系统中的应用[J].计算机工程与应用,2005,41(32):229-232. 被引量：5
6于海滨,秦兵,刘挺,郎君.命名实体识别和指代消解在文摘系统中的应用[J].计算机应用研究,2006,23(4):180-182. 被引量：7
7张亮,冯冲,陈肇雄,黄河燕.基于语句相似度计算的FAQ自动回复系统设计与实现[J].小型微型计算机系统,2006,27(4):720-723. 被引量：19
8刘挺,李维刚,张宇,李生.复述技术研究综述[J].中文信息学报,2006,20(4):25-32. 被引量：13
9傅间莲,陈群秀.基于规则和统计的中文自动文摘系统[J].中文信息学报,2006,20(5):10-16. 被引量：21
10杨思春.一种改进的句子相似度计算模型[J].电子科技大学学报,2006,35(6):956-959. 被引量：34

共引文献48

1陈小宾,葛新伟,林鸿飞.基于语义计算的公交移动问答系统[J].计算机工程与科学,2008,30(10):118-121. 被引量：1
2董刊生,方金云.基于向量距离的词序相似度算法[J].中文信息学报,2009,23(3):45-50. 被引量：10
3袁春兰,张琳.基于招生咨询域的问答系统中答案抽取的研究[J].电脑知识与技术,2009,5(5):3414-3416. 被引量：4
4薛慧芳.句子相似度计算初探[J].科技信息,2009(19):162-162. 被引量：2
5卢小平.自动编制文摘技术研究综述[J].现代情报,2009,29(10):221-225.
6李林,周一民.传递信息分类的句子间相似性度量[J].计算机工程与应用,2009,45(31):15-17.
7江耿豪.基于FAQ的自动答疑系统的设计与实现[J].计算机时代,2009(12):39-41. 被引量：4
8王满,徐朝军.网络课程资源自动量化评价研究[J].现代图书情报技术,2010(1):88-93. 被引量：7
9程倩倩,田大钢.基于基本要素方法的中文自动文本摘要模型[J].现代图书情报技术,2010(2):74-78. 被引量：2
10江耿豪.基于VisualProlog的自动答疑系统设计与实现[J].现代教育技术,2010,20(7):122-125. 被引量：3

1黄超,佘廉.文本案例推理技术在应急决策中的应用研究[J].情报理论与实践,2015,38(12):111-114. 被引量：6
2杨健,张晓玲,周少云.基于文本案例的推理技术综述[J].计算机应用与软件,2008,25(7):228-229. 被引量：1
3王国栋,杨博,邓志东,李明.一种基于TCBR与RBR融合推理的试飞支持信息系统[J].航空科学技术,2013(4):73-77. 被引量：1
4刘明霞,侯迎坤,杨德运.一种新的自然纹理分类方法[J].计算机工程与应用,2008,44(19):184-186. 被引量：1
5孙立新,罗高平,张怡梅.遥感影像分类的归类学习方法[J].测绘工程,1998,7(3):39-43. 被引量：2
6胡飞飞,徐键,洪丹轲,曾时博.移动化平台解决方案[J].电子技术与软件工程,2016(23):180-183. 被引量：1
7王萌,李春贵,徐超,何婷婷.主题与子事件发现的多文档自动文摘[J].计算机工程与应用,2011,47(18):130-134. 被引量：1
8杨文超.网络时代的知识载体——浅论计算机作为知识载体的作用[J].邢台职业技术学院学报,2003,20(1):24-25.
9付强,潘鹏,刘文江.浅论计算机作为知识载体的作用[J].中国科技信息,2005(6):30-30.
10蔡豪源.LSI文本挖掘技术剖析[J].农业图书情报学刊,2016,28(7):5-9. 被引量：1

西北大学学报（自然科学版）

2010年第6期

浏览历史

内容加载中请稍等...

文本案例相似度计算方法

参考文献6

二级参考文献33

共引文献48

相关作者

相关机构

相关主题

浏览历史