期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

题名相似度模型在文献数据质量控制中的应用

Research on the Application of Title Similarity Calculation Model in Quality Control of Characteristics Literature Data

下载PDF

导出

摘要针对特色文献资源建设面临采访预订单中元数据描述不标准、字段不齐全、输入不规范,采访渠道广泛等问题给查重工作带来的难度,本文提出了基于题名相似度的查重模型,将题名经过数据预处理后利用word2vec提取题名的特征向量,计算题名之间的余弦相似度解决文献的查重问题。实验结果表明该查重模型具有较好的效果,为图书馆馆藏特色文献资源建设提供了可行的借鉴。 Due to the problems such as non-standard metadata description,incomplete fields,non-standard input,and extensive interview channels in the interview booking for the construction of provincial characteristics of literature resources,the interview work is difficult in checking.This paper proposes a duplicate checking model based on title similarity,use word2vec to extract the feature vector of the title after data preprocessing,calculate cosine similarity between titles,finally solve the problem of title duplication of documents.The experimental results show that the checking model has a good effect,it provides a feasible reference for the construction of characteristic literature resources in library.

作者金光龙张光照张银玲 ZHANG Guanzhao;YANG Fan;ZHANG Yinling(Guizhou University of Finance and Economics,Library 550025)

机构地区贵州财经大学图书馆

出处《长江信息通信》 2024年第2期120-122,共3页 Changjiang Information & Communications

基金 2022年度贵州财经大学校级项目“基于Python的知识图谱构建与应用实验教学设计”(编号:2022KYYB14)。

关键词特色馆藏元素据题名查重 word2vec 余弦相似度 special collection metadata title check word2vec cosine similarity

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1郝俊勤,王丽明,李淑.促进图书馆特色馆藏建设之探讨[J].现代情报,2003,23(10):28-29. 被引量：37
2李红香.高校省情教育的逻辑演进及优化路径[J].教育文化论坛,2022,14(5):54-58. 被引量：1
3刘娟.山东省省情资料库简介[J].广西地方志,1998,0(6):60-62. 被引量：1
4昝方霞,赵海星.分类查重与馆藏书目数据质量控制刍议[J].现代情报,2007,27(4):139-140. 被引量：4
5张丽萍.图书馆编目查重的本土实证——ISBN号查重过程中存在的问题及解决方案[J].农业图书情报学刊,2009,21(1):77-80. 被引量：8
6闫新国,谢赤,朱玉国,杨敏佳.基于余弦相似度(CS)和最小生成树(MST)的基金市场复杂网络研究[J].财经理论与实践,2020,41(2):55-61. 被引量：9

二级参考文献30

1张立新.中文图书编目查重问题及处理方法[J].图书馆学刊,2005,27(4):79-80. 被引量：14
2张振亚,王进,程红梅,王煦法.基于余弦相似度的文本空间索引方法研究[J].计算机科学,2005,32(9):160-163. 被引量：55
3姜化林.计算机编目中查重工作的思考[J].湖南科技学院学报,2005,26(12):320-321. 被引量：8
4吴春.试谈网络环境下如何提高图书查重的准确率[J].图书馆工作与研究,2006(3):37-38. 被引量：8
5宋金燕,龙旭梅,曹咏梅.网络环境下图书编目查重工作实践[J].农业图书情报学刊,2007,19(3):141-142. 被引量：7
6陈南仿.对计算机编目查重问题的研究[J].科技情报开发与经济,2007,17(12):138-139. 被引量：6
7李庆文.图书分类查重方法新识[J].四川图书馆学报,2008(1):47-49. 被引量：5
8吴珍.图书编目查重工作的探讨[J].农业图书情报学刊,2008,20(2):123-125. 被引量：7
9张冬娘.浅谈ISBN升位对图书馆工作的影响[J].情报探索,2008(3):34-35. 被引量：6
10宋洪丽,阎海新.国际标准书号(ISBN)升位对图书馆采购工作的影响[J].图书馆学刊,2008,30(2):117-119. 被引量：3

共引文献54

1鄂丽君.高校图书馆特色馆藏建设的现状分析[J].图书馆建设,2009(12):19-23. 被引量：78
2李继萍.云南地方高校馆藏资源建设的发展趋向[J].玉溪师范学院学报,2010,26(7):66-68. 被引量：4
3王立峰,杜玉波.信息时代高校图书馆馆藏建设的挑战与对策[J].商业文化（学术版）,2009,0(4):142-142.
4石洁灵.论高校图书馆馆藏特色化建设——兼谈我院图书馆馆藏特色化[J].南阳师范学院学报,2004,3(11):120-122. 被引量：5
5魏欣,赵隽,张敬,温国华.高校图书馆数字化建设——浅论数字化特色资源的建设[J].图书馆工作与研究,2005(4):52-54. 被引量：41
6檀向群.浅析地方高校图书馆特色馆藏建设[J].池州师专学报,2006,20(5):151-152. 被引量：5
7夏有根,谢惠.地方高校图书馆特色馆藏建设策略[J].情报探索,2007(6):117-119. 被引量：20
8乔爱丽.从“核”入手，实现我馆特色馆藏期刊建设[J].贵图学刊,2008(1):28-29. 被引量：2
9金以明.图书馆特色馆藏资源建设[J].大学图书馆学报,2008,26(6):93-97. 被引量：131
10金春山.关于延边大学图书馆特色馆藏建设的思考[J].内蒙古科技与经济,2009(1):139-140.

1余侠.中文图书采购查重需重视的问题及质量提升策略[J].科技经济导刊,2018(32):139-139. 被引量：1
2张前永.基层公共图书馆“名人捐赠”的实践研究——以“寸草书屋”为例[J].山东图书馆学刊,2023(3):41-46.
3李湉.新媒体时代背景下记者采写的创新实践研究[J].视界观,2022(16):62-64.
4郭清秀.以地方文化浸润高校图书馆特色资源[J].文化产业,2023(23):84-86.
5李芳.中国—东盟文献资源战略保障体系研究——基于美国经验的启示[J].图书馆,2023(8):57-63.
6金慧娟.新媒体时代下新闻编辑记者做好采访报道的策略探讨[J].声屏花,2023(8):85-87.

长江信息通信

2024年第2期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部