基于泛化语义相似的科技文献混合推荐算法被引量：1

S&T Literature Hybrid Recommendation Algorithm Based on Generalized Semantic Similarity

下载PDF

导出

摘要文章从内涵和外延两个角度研究了科技文献相似性度量问题,首先从科技文献内涵的角度在文献特征词字符匹配基础上采用泛化方法将待推荐文献关键词与当前文献关键词及其父/子关键词进行匹配;然后从外延角度结合科技文献项目的特点将文献共引因素引入文献相似性度量;最后根据关键词泛化相似度和共引关联度定义混合相似度(HS)对候选科技文献进行排序推荐,理论分析和实验数据表明,该算法能够在一定程度上避免遗漏"特征词字符不同,但语义相似"科技文献的问题。 This paper studies the similarity measurement of Scientific and Technical （S ＆ T） literatures from the perspective of connotation and extension. The paper firstly uses the generalization method to match the keywords of the literatures to be recom- mended and the keywords of the current literatures and their father/son keywords based on the literature characteristic word string matching from the perspective of the connotation of S ＆ T literature. Then, the paper introduces the co-citation factors of the litera- tures into the literature similarity measurement in combination with the characteristics of the S ＆ T literatures from the perspective of extension. Finally, the paper sorts and recommends the candidate S ＆ T literatures in accordance with the keyword generalization similarity and the Hybrid Similarity （HS） defined by the co-citation correlation. The theoretical analysis and experimental data show that the algorithm can avoid omitting the problem of ＂different characteristic word string with similar semantics＂ in S ＆ T litera- tures.

作者徐勇陈建国胡凌云张林周善英

机构地区安徽财经大学管理科学与工程学院

出处《情报理论与实践》 CSSCI 北大核心 2013年第2期96-99,103,共5页 Information Studies:Theory & Application

基金教育部人文社会科学研究青年基金项目"科技文献推荐系统若干问题研究"(项目编号:09YJC870001) 教育部人文社会科学研究规划基金项目"云计算环境下企业数据外包服务中的用户隐私保护问题研究"(项目编号:12YJA630136)的成果

关键词科技文献语义关系相似性度量算法 S ＆ T literature semantic relationship similarity measurement algorithm

分类号 G350 [文化科学—情报学]

引文网络
相关文献

参考文献7

1David Goldberg,David Nichols,Oki Brian M,et al.Using collaborative filtering to weave an information tapestry[].Communications of the ACM.1992
2Rich E.User Modeling via Stereotypes[].Cognitive Science.1979
3Murthi BPS,,Sarkar S.The role of the management sciences in research on personalization[].Management Science.2003
4Belkin NJ,Croft WB.Information filtering and information retrieval: two sides of the same coin?[].Communications of the ACM.1992
5赵俊杰.一种用于关键词检索的快速字符串精确匹配算法[J].计算机系统应用,2010,19(2):189-191. 被引量：7
6张光前,雷彩华.基于内容分析法的国内电子商务推荐研究[J].知识管理论坛,2011(4):41-46. 被引量：1
7李凯齐,刁兴春,曹建军.基于信息增益的文本特征权重改进算法[J].计算机工程,2011,37(1):16-18. 被引量：9

二级参考文献20

1黎星星,黄小琴,朱庆生.电子商务推荐系统研究[J].计算机工程与科学,2004,26(5):7-10. 被引量：46
2余力,刘鲁,罗掌华.我国电子商务推荐策略的比较分析[J].系统工程理论与实践,2004,24(8):96-101. 被引量：45
3余力,刘鲁.电子商务个性化推荐研究[J].计算机集成制造系统,2004,10(10):1306-1313. 被引量：104
4余力,刘鲁,李雪峰.用户多兴趣下的个性化推荐算法研究[J].计算机集成制造系统,2004,10(12):1610-1615. 被引量：45
5陈涛,谢阳群.文本分类中的特征降维方法综述[J].情报学报,2005,24(6):690-695. 被引量：79
6王成,刘金刚.一种改进的字符串匹配算法[J].计算机工程,2006,32(2):62-64. 被引量：26
7杨薇薇,廖翔.一种改进的BM模式匹配算法[J].计算机应用,2006,26(2):318-319. 被引量：25
8张锋,常会友.使用BP神经网络缓解协同过滤推荐算法的稀疏性问题[J].计算机研究与发展,2006,43(4):667-672. 被引量：85
9潘景昌,孙玉辉,徐义明.一种简易的模糊匹配算法的实现[J].信息技术与信息化,2006(3):131-132. 被引量：5
10苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：386

共引文献13

1杨石,邹国奇,杨作为.一种扩展功能可选取的文本检索系统[J].大众科技,2011,13(10):22-24.
2赵航,杨天奇,赵小厦.基于特征噪声加权的特征权重算法改进[J].微型机与应用,2012,31(3):66-68.
3刘端阳,陆洋.一种有指导的文本特征加权改进算法[J].计算机工程,2012,38(8):128-130. 被引量：2
4徐勇,司凤山,吴延辉,陈建国,周善英.基于概念泛化的科技文献推荐算法[J].图书情报工作,2012,56(21):101-108. 被引量：3
5徐勇,华文立,沈小玲,司凤山,周善英.科技文献查询推荐系统设计[J].图书情报工作,2013,57(4):131-137.
6李映刚.一种改进的Sunday模式匹配算法[J].四川理工学院学报（自然科学版）,2013,26(2):78-81.
7汪海涛,张卓,杨晓元,林志强.基于优化特征加权支持向量机的隐写分析方法[J].计算机应用研究,2013,30(7):2105-2107. 被引量：9
8龚静,胡平霞,李春媚.一种用于文本分类的特征项权值计算方法的研究[J].惠州学院学报,2013,33(6):78-81.
9张令通,罗森林,陈燕颖.主机内文档自动搜索技术研究[J].科技通报,2014,30(3):108-112.
10胡雯雯,高俊波,施志伟,刘志远.基于词性特征的特征权重计算方法[J].计算机系统应用,2018,27(1):92-97. 被引量：1

同被引文献27

1Han J,Kamber M,Pei J.数据挖掘:概念与技术[M].第3版.范明,孟小峰译.北京:机械工业出版社,2012.
2Magerman T, Van Looy B, Song X. Exploring the Feasibility and Accuracy of Latent Semantic Analysis Based Text Mining Techniques to Detect Similarity Between Patent Documents and Scientific Publications [J]. Scientometrics, 2010, 82(2): 289-306.
3Wang W, Yu B. Text Categorization Based on Combination of Modified back Propagation Neural Network and Latent Semantic Analysis [J]. Neural Computing & Application, 2009, 18(8): 875-881.
4Olmos R, Le6n J A, Jorge-Botana G, et al. New Algorithms Assessing Short Summaries in Expository Texts Using Latent Semantic Analysis [J]. Behavior Research Methods, 2009, 41(3): 944-950.
5Law J, Bauin S, Courtial J P, et al. Policy and the Mapping of Scientific Change: A Co-word Analysis of Research into Environmental Acidification [J]. Scientometrics, 1988, 14(3):251-264.
6任建华,沈炎彬,孟祥福,等.基于词条之间关联关系的文档聚类[J/OL].[2014-12-11].计算机工程与应用.http://WWW.cnki.net/kcms/detail/11,2127.TP,20141211,1528.053.html.
7Steyvers M, Griffith T. Probabilistic Topic Models[A].// Latent Semantic Analysis: A Road to Meaning [M]. Laurence Erlbaum, 2006.
8Landauer T K, Foltz P W, Laham D. An Introduction to Latent Semantic Analysis [J]. Discourse Processes, 1998, 25(2-3): 259-284.
9Leydesdorff L. Similarity Measures, Author Cocitation Analysis, and Information Theory [J]. Journal of the American Society for Information Science & Technology (JASIST), 2005, 56(7): 769-772.
10Structured Dynamic. Linked Data FAQ [EB/OL]. [2014-07- 18]. http://structureddynamics.com/linked_data.html.

引证文献1

1赵夷平,毕强.关联数据在学术资源网相似文献发现中的应用研究[J].现代图书情报技术,2016(3):41-49. 被引量：5

二级引证文献5

1许鑫,江燕青,翟姗姗.面向语义出版的学术期刊数字资源聚合研究[J].图书情报工作,2016,60(17):122-129. 被引量：16
2齐云飞,赵宇翔,朱庆华.关联数据在数字图书馆移动视觉搜索系统中的应用研究[J].数据分析与知识发现,2017,1(1):81-90. 被引量：19
3陈果,吴微,肖璐.知识共聚:领域分析视角下的知识聚合模式[J].图书情报工作,2018,62(8):115-122. 被引量：8
4张影.基于数据关联与文本挖掘技术的图书馆文献资源开发利用研究[J].中国中医药图书情报杂志,2019,43(4):48-51. 被引量：3
5王颖.学术资源挖掘方法研究综述[J].现代情报,2021,41(12):164-177. 被引量：2

1李婧,陈旺虎,冯百明.提高Web服务匹配效率的服务过滤方法[J].计算机应用,2009,29(11):3139-3142. 被引量：3
2庄严,白振林,许云峰.基于蚁群算法的支持向量机参数选择方法研究[J].计算机仿真,2011,28(5):216-219. 被引量：33
3田振浩,邢清华,李龙跃.基于混合相似度的反导作战案例检索方法[J].装甲兵工程学院学报,2016,30(6):55-59. 被引量：5
4汤沛.基于云理论的数据预处理方法[J].新乡学院学报,2008,25(4):52-54. 被引量：1
5杨英华,魏玉龙,李召,秦树凯.基于子空间混合相似度的过程监测与故障诊断[J].仪器仪表学报,2013,34(4):935-941. 被引量：10
6滕少华,麦嘉俊,张巍,赵淦森.一种基于混合相似度的用户多兴趣推荐算法[J].江西师范大学学报（自然科学版）,2016,40(5):481-486. 被引量：3
7汤吴建.基于混合相似度的协同过滤推荐[J].软件导刊,2017,16(2):32-35.
8魏海坤,徐嗣鑫,宋文忠.神经网络的泛化理论和泛化方法[J].自动化学报,2001,27(6):806-815. 被引量：97
9童亮,王准.强化学习在机器人路径规划中的应用研究[J].计算机仿真,2013,30(12):351-355. 被引量：13
10张嵩,景华炯.基于Log-Gabor特征的非局部均值去噪算法及其加速方案研究[J].模式识别与人工智能,2015,28(3):266-274. 被引量：2

情报理论与实践

2013年第2期

浏览历史

内容加载中请稍等...

基于泛化语义相似的科技文献混合推荐算法被引量：1

参考文献7

二级参考文献20

共引文献13

同被引文献27

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于泛化语义相似的科技文献混合推荐算法 被引量：1

参考文献7

二级参考文献20

共引文献13

同被引文献27

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于泛化语义相似的科技文献混合推荐算法被引量：1