一种基于最大权匹配计算的信息检索方法被引量：6

Method of information retrieval based on computing maximum-weight-matching

下载PDF

导出

摘要基于《知网》的词汇语义计算方法,提出了一种基于向量空间模型的文本信息检索新方法。方法的基本技术思想是通过计算关键词的语义相似度,并采用最大权匹配方法来计算查询向量和文本向量的相似度,作为相关文本的检索依据。该方法基于全局最优,使文本和查询向量中各词条的相似度总和最大,从而可以从整体上提高文本信息检索的准确率。论文还通过原型实验对该方法的有效性进行了验证。 Based on the computation of words-semantic similarity-of ＂How-net＂,a new method of document information retrievingbased on the model of vector space has been proposed.The basic ideas of the method are that,firstly we compute the similaritybetween keywords by the words-senmntic similarity of ＂How-net＂,and seeomtly compute the similarity between the query vectorand the document vector based on computing the nmxin^um-weight-matching.This algorithm is based on the optimization on over-all situation and it might find the maxinmm sum of each pair terms＇ similarity between the query vector and the document vec-tor.The experiment result has demonstrated the validity of the algorithm.

作者朱征宇苑昆峰陈杏环

机构地区重庆大学计算机学院

出处《计算机工程与应用》 CSCD 北大核心 2007年第33期176-180,共5页 Computer Engineering and Applications

基金高等学校博士学科点专项科研基金(the Specialized Research Fund for the Doctoral Program of Higher Education under Grant No.20030611016) 重庆大学骨干教师基金(Chongqing University Fund for Key Teachers Grant No.2003A33)

关键词信息检索知网义原相似性计算最大权匹配 information retrieval How-net,similarity computing maximum-weight-matching

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1董振东,董强.“知网”网站[OL].http://www.keenage.com.
2刘群,李素建.基于《知网》的词汇语义相似度计[C]..第三届汉语词汇语义学研讨会.台北,2002-05..
3Salton G,Buckley B,Term-weighting approaches in automatic text retrieval [J],Information Processing and Management,1998,24 (5) : 513-523.
4杨小平,丁浩,黄都培.基于向量空间模型的中文信息检索技术研究[J].计算机工程与应用,2003,39(15):109-111. 被引量：31
5潘谦红,王炬,史忠植.基于属性论的文本相似度计算[J].计算机学报,1999,22(6):651-655. 被引量：63
6李素建.基于语义计算的语句相关度研究[J].计算机工程与应用,2002,38(7):75-76. 被引量：83
7龚劬.图论与网络最优化算法[M].重庆:重庆大学出版社,2000.87-96.
8史中植.知识发现[M].北京:清华大学出版社,2002.
9陆汝铃.知识科学与计算科学[M].北京:清华大学出版社,2002.

二级参考文献9

1穗志文.基于骨架依存树的语句相似度计算模型[J].计算语言学文集,1998,(3):176-184.
2Robert E Filman,Sangam Pant.Searching the Intemet[J].IEEE Intemet Computing, 1998;2(4) :59-69.
3Eric W Brown,James P Callan,W Bruce Croft.Fast Incremental Indexing for Full-Text Information Retrieval[C].In:Proceedings of the 20th VLDB Conference Santiago,Chile, 1994.
4Clifford A Lynch.Networked Information Resource Discovery:An Overview of Current Issues[J].IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS, 1995; 13 (8) : 1505-1522.
5Sahon G,McGill M J.Introduction to modern Information Retrieval[M]. New York : McGraw-Hill Book company, 1983.
6Ian H Witten.How to build Digital Library[M].Morgan Kaufmann Publishers, 2003.
7史忠植，高级人工智能，1997年
8Wong S K M，Proc 8th Annual ACMSIGIR Int Conf Research and Development in Information Retrieval，1985年，18页
9冯嘉礼,董占球.基于属性整合的知觉模式生成与识别模型[J].计算机研究与发展,1997,34(7):481-486. 被引量：30

共引文献178

1贾善崇,周兰江,张建安,周枫.融入多特征的汉-老双语对齐方法[J].中国水运（下半月）,2020,20(3):78-80. 被引量：2
2侯宇豪,杨维芳,马文骏,王卓,余懿韬,闫香蓉,闫浩文.一种利用VSM检索微地图的方法[J].测绘科学,2023,48(12):225-233.
3王常亮,闫利华,吴曦德.基于XML的智能答疑系统研究[J].赤峰学院学报（自然科学版）,2008,24(9):86-89.
4刘娟,荆一昕.基于兴趣特征的协作过滤模式研究[J].开封教育学院学报,2008,28(4):92-93.
5周粉,夏幼明.一种改进的基于知网的语义相似度计算方法[J].云南大学学报（自然科学版）,2008,30(S2):215-218. 被引量：1
6彭京,杨冬青,唐世渭,王腾蛟,高军.基于概念相似度的文本相似计算[J].中国科学（F辑:信息科学）,2009,39(5):534-544. 被引量：17
7高思丹,袁春风.语句相似度计算在主观题自动批改技术中的初步应用[J].计算机工程与应用,2004,40(14):132-135. 被引量：47
8晋耀红.基于语境框架的文本相似度计算[J].计算机工程与应用,2004,40(16):36-39. 被引量：26
9贝雨馨,崔荣一.文本分类中特征项权重的计算方法[J].延边大学学报（自然科学版）,2004,30(3):202-204. 被引量：9
10刘亚军,徐易.一种基于加权语义相似度模型的自动问答系统[J].东南大学学报（自然科学版）,2004,34(5):609-612. 被引量：36

同被引文献37

1高思丹,袁春风.语句相似度计算在主观题自动批改技术中的初步应用[J].计算机工程与应用,2004,40(14):132-135. 被引量：47
2刘亚军,徐易.一种基于加权语义相似度模型的自动问答系统[J].东南大学学报（自然科学版）,2004,34(5):609-612. 被引量：36
3金博,史彦军,滕弘飞.基于语义理解的文本相似度算法[J].大连理工大学学报,2005,45(2):291-297. 被引量：80
4吴健,吴朝晖,李莹,邓水光.基于本体论和词汇语义相似度的Web服务发现[J].计算机学报,2005,28(4):595-602. 被引量：218
5孟爱国,卜胜贤,李鹰,甘文.一种网络考试系统中主观题自动评分的算法设计与实现[J].计算机与数字工程,2005,33(7):147-150. 被引量：46
6李明琴,李涓子,王作英,陆大.语义分析和结构化语言模型[J].软件学报,2005,16(9):1523-1533. 被引量：7
7宋玲玲,李村合.基于链接结构分析的Web信息检索方法研究[J].现代情报,2007,27(2):133-135. 被引量：7
8李峰,李芳.中文词语语义相似度计算——基于《知网》2000[J].中文信息学报,2007,21(3):99-105. 被引量：106
9Park J S, Chen M S, Yu P S. An effective hashbased algorithm for mining association rules. Proceedings of the ACM SIGMOD International Conference on Management of Data, San Jose: CA, 1995 : 175 - 186.
10Park,J.S.,Chen,M.-S.,and Yu,P.S.1995. An effective hashbased algorithm for mining association rules. In Proceedings of the ACM SIGMOD International Conference on Management of Data, pages 175-186, San Jose, CA.

引证文献6

1俞扬信,严云洋.一种基于网页分割的Web信息检索方法[J].图书情报工作,2009,53(3):108-110. 被引量：3
2贾电如,李阳明.基于语句结构及语义相似度计算主观题评分算法的研究[J].信息化纵横,2009(5):5-7. 被引量：12
3沈达峰.基于网页分割的语义信息检索研究[J].西昌学院学报（自然科学版）,2009,23(4):57-61.
4赵晓,刘学锋,王晓霞.编译原理理论在C程序题自动评分系统中的应用[J].陕西科技大学学报（自然科学版）,2010,28(3):135-137. 被引量：3
5孟祥娜,秦玉平.一种基于分类和语义查询扩展的信息检索方法[J].信息技术,2010,34(9):31-33. 被引量：2
6秦添轶,林蝉,宋博宇,关毅.一种实体描述短文本相似度计算方法[J].智能计算机与应用,2015,5(2):34-37. 被引量：3

二级引证文献23

1俞扬信.基于语义相似度的信息检索研究[J].情报杂志,2009,28(9):172-175. 被引量：12
2梁晓诚,岳晓光,麦范金,赵子强,路英,王挺.基于自然语言处理的主观题评分算法研究[J].昆明理工大学学报（理工版）,2010,35(2):81-84. 被引量：10
3蔺跟荣.基于用户兴趣的个性化Web信息检索方法[J].电子设计工程,2010,18(7):60-62. 被引量：2
4赵晓,刘学锋,王晓霞.编译原理理论在C程序题自动评分系统中的应用[J].陕西科技大学学报（自然科学版）,2010,28(3):135-137. 被引量：3
5田甜,张振国.主观题自动阅卷技术研究[J].计算机工程与设计,2010,31(16):3697-3699. 被引量：13
6麦范金,岳晓光,赵子强,路英,王挺,岳砥柱.基于自然语言处理的智能评分系统[J].桂林理工大学学报,2010,30(3):426-430. 被引量：4
7俞扬信.基于扩展模糊概念网的信息检索结果个性化的研究[J].情报学报,2011,30(3):261-267. 被引量：2
8杜利峰,牛永洁.字符串相似度在自动评分系统中的应用[J].电子设计工程,2011,19(7):42-44. 被引量：11
9毛一岚,康锐,马麟,徐哲涵.装备修复性维修工作项目确定方法[J].北京航空航天大学学报,2011,37(8):1039-1043. 被引量：2
10袁军.主观题自动批改技术难点分析[J].煤炭技术,2011,30(11):250-252. 被引量：2

1李国佳,杨喜亮.基于知网义原信息量的词语相似度计算方法[J].软件导刊,2015,14(6):142-144. 被引量：4
2夏天.汉语词语语义相似度计算研究[J].计算机工程,2007,33(6):191-194. 被引量：63
3李永亮,黄曙光,鲍蕾.一种基于PageRank算法和知网的词义消歧方法[J].计算机应用与软件,2011,28(5):213-215. 被引量：4
4唐共波,于东,荀恩东.基于知网义原词向量表示的无监督词义消歧方法[J].中文信息学报,2015,29(6):23-29. 被引量：15
5田正军,张鸿彦.文本自动分类在邮件过滤系统中的应用[J].郑州经济管理干部学院学报,2005,20(2):90-92.
6杨佳,张金广,杨龙,江萍,魏晓莉.基于本体概念集合相似度的语义Web服务匹配[J].计算机技术与发展,2012,22(8):56-59. 被引量：1
7周绍钧,吕学强,李卓,都云程.基于多策略融合的专利术语自动抽取[J].计算机应用与软件,2015,32(2):28-32. 被引量：4
8李波,石慧霞,王毅.一种基于同义词发现的文本扩充算法[J].重庆理工大学学报（自然科学）,2014,28(2):76-81. 被引量：4
9李国佳.基于知网的中文词语相似度计算[J].智能计算机与应用,2015,5(3):49-52. 被引量：2
10张振幸,李金厚.一种基于义原重合度的词语相似度计算[J].信阳师范学院学报（自然科学版）,2010,23(2):296-299. 被引量：4

计算机工程与应用

2007年第33期

浏览历史

内容加载中请稍等...

一种基于最大权匹配计算的信息检索方法被引量：6

参考文献9

二级参考文献9

共引文献178

同被引文献37

引证文献6

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

一种基于最大权匹配计算的信息检索方法 被引量：6

参考文献9

二级参考文献9

共引文献178

同被引文献37

引证文献6

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

一种基于最大权匹配计算的信息检索方法被引量：6