机器学习在图书馆应用初探:以TensorFlow为例被引量：31

Machine Learning and Its application in Library:Take TensorFlow as an Example

下载PDF

导出

摘要机器学习是人工智能的重要分支,TensorFlow是谷歌第二代开源人工智能机器学习平台。此文重点介绍机器学习(主要是深度神经网络)的基本原理和利用TensorFlow进行机器学习的基本方法,探讨在图书馆领域应用的可能和场景。以《全国报刊索引》的自动分类问题作为实验对象,利用两台图形工作站,建立了TensorFlow深度学习模型,通过设定参数和阈值、系统调优等工作,实践了应用TensorFlow的完整过程,论证了其可行性。实验通过对170万余条题录数据进行训练和测试,克服了报刊索引数据过于简单与中国图书馆分类法的类目过于细致之间的矛盾,实现了大类近80%和四级分类总体近70%的准确率(其中TP类达到91%),得出基本可代替人工分类流程的结论,为全国报刊索引的分类流程的半自动化提供有力工具,从而可望大大节省人力成本。下一步将继续利用TensorFlow的优化功能,结合更多的字段属性,进行系统调优,力争做到自动分类90%以上的准确率。 Machine learning （ML） is a particular approach to artificial intelligence. TensorFlow is the second generation machine learning framework of Google. This paper focuses on the basic principles of ma- chine learning and the basic methods of machine learning by using TensorFlow. Its purpose is to explore the possibilities and scenarios of machine learning applications in library. A TensorFlow ML model is es- tablished and with the index data from National Index of Newspapers and Magazines, a complete process of automatic classification of records had been accomplished and proved feasible. Through the training process and testing of more than 170 million data records, the experiment has overcome the contradiction between the less comprehension of the index data and the trivial category labels, and reached nearly 80 ~ of the cate- gories and nearly 70% of the accuracy rate. It can be concluded that the approach is capable of taking into practice, at least to carry on a semi-automatic processing of classification, which is expected to significantly save labor costs. The next step will be optimizing the parameters and system tuning. We hope it can strive to achieve an accuracy of 90 % by automatic classification.

作者郭利敏刘炜吴佩娟张磊

机构地区上海图书馆

出处《大学图书馆学报》 CSSCI 北大核心 2017年第6期31-40,共10页 Journal of Academic Libraries

基金国家社会科学基金重大项目"面向大数据的数字图书馆移动视觉搜索机制及应用研究"(编号:15ZDB126)的研究成果之一

关键词智慧图书馆人工智能机器学习 'TensorFlow 自动分类神经网络 Smart Library Artificial Intelligence Machine Learning TensorFlow Automatic

分类号 G250 [文化科学—图书馆学]

引文网络
相关文献

参考文献7

1毛健,赵红东,姚婧婧.人工神经网络的发展及应用[J].电子设计工程,2011,19(24):62-65. 被引量：175
2沈敏,杨新涯,王楷.基于机器学习的高校图书馆用户偏好检索系统研究[J].图书情报工作,2015,59(11):143-148. 被引量：25
3王昊,严明,苏新宁.基于机器学习的中文书目自动分类研究[J].中国图书馆学报,2010,36(6):28-39. 被引量：37
4於坚秋.公共图书馆读者信息咨询服务分析与对策[J].图书情报论坛,2006(3):46-48. 被引量：8
5姚飞,纪磊,张成昱,陈武.实时虚拟参考咨询服务新尝试——清华大学图书馆智能聊天机器人[J].现代图书情报技术,2011(4):77-81. 被引量：100
6严轩,钟静.从数据来源分析入手的图书馆大数据应用系统研究——以“重庆图书馆大数据分析试验系统”为例[J].四川图书馆学报,2016(4):2-6. 被引量：6
7李艳,吕鹏,李珑.基于大数据挖掘与决策分析体系的高校图书馆个性化服务研究[J].图书情报知识,2016,33(2):60-68. 被引量：115

二级参考文献85

1武妍,王守觉.一种通过反馈提高神经网络学习性能的新算法[J].计算机研究与发展,2004,41(9):1488-1492. 被引量：15
2何琳,侯汉清,白振田,张雪英.基于标引经验和机器学习相结合的多层自动分类[J].情报学报,2006,25(6):725-729. 被引量：19
3清华大学图书馆馆藏目录[EB/OL].http://innopac.lib.tsinghua.edu.cn/screens/mainmenu.html.
4韩立群.人工神经网络[M].北京:北京邮电出版社,2006.
5Sebastiani F. Machine learning in automated text categorization [ J ]. ACM Computing Surveys, 2002, 34 ( 1 ) : 1 - 47.
6Maron M. Automatic indexing: An experimental inquiry[ J]. Journal of the Association for Computing Machinery, 1961, 8(3) : 404 -417.
7Gennari J H, Musen M A, Fergerson R W, et al. The evolution of protege: An environment for knowledge-based systems development [ J ]. International Journal of Human-Computer Studies, 2003, 58(1) : 89 - 123.
8Quinlan J R. Induction of decision tree [ J ]. Machine Learning, 1986,1(1) :81 - 106.
9Quinlan J R. C4.5 : Programs for machine leaning [M]. Los Altos, California: Morgan Kaufmann Publishers, Inc. , 1993.
10Hecht-Nielsen R. Theory of the back propagation neural network [ C ]. In Proceedings of International Joint Conference on Neural Networks, IEEE, 1989, 1:593 - 603.

共引文献453

1郑蕊.基于小程序的高校图书馆个性化服务深化研究[J].知识管理论坛,2019,0(5):310-319. 被引量：3
2苏瑞竹,赵梓璟.虚拟偶像在图书馆中的应用研究[J].图书馆界,2022(6):66-71.
3张新乐,于滋洋,李厚萱,刘焕军,张忠臣,赵明明,王翔.东北水稻叶片SPAD遥感光谱估算模型[J].中国农业大学学报,2020,25(1):66-75. 被引量：8
4刘泳奇,吴环宇,陈珂.智能建造技术在工程造价管理中的应用研究综述[J].建筑经济,2022,43(S01):245-252. 被引量：23
5柴晋,乔加飞,孙灏,梁占伟,张千.神经网络算法在脱硫系统优化中的应用进展[J].洁净煤技术,2021,27(S02):27-32. 被引量：3
6王园媛,李晓菲,陈涛,刘振华,王云月.云南省水稻白叶枯病BP神经网络测报技术研究[J].云南农业大学学报,2013,25(2):257-263. 被引量：6
7李津.浅议图书馆参考咨询服务创新策略[J].黑龙江科技信息,2008(9):86-86.
8余晓玲.当前读者的阅读心理初探[J].科技情报开发与经济,2008,18(31):34-35.
9张树中.图书馆参考咨询服务工作创新路径探析[J].河北科技图苑,2008,21(3):32-34. 被引量：4
10余晓玲.论社会转型期图书馆新型信息咨询服务模式的构建[J].新世纪图书馆,2009(3):40-41. 被引量：3

同被引文献456

1焦艳鹏,刘葳.知识获取、人工智能与图书馆精神[J].中国图书馆学报,2021,47(5):20-32. 被引量：15
2李迎.AI环境下高校图书馆用户知识地图及动态服务转化的优化设计[J].图书馆学刊,2020,0(2):81-86. 被引量：2
3王亚民,刘学胜.基于Hadoop平台的数字图书馆研究[J].图书情报工作,2011,55(S2):305-309. 被引量：4
4潘鹏程.图书馆智能咨询系统模型构建[J].图书馆学研究（应用版）,2010(6):82-84. 被引量：11
5齐亚双,李永先,薛伟莲.我国移动图书馆信息服务研究综述[J].图书馆学研究（应用版）,2010(11):7-9. 被引量：39
6谢元泰.新技术革命的挑战与图书馆的发展策略[J].四川图书馆学报,1985(3):17-20. 被引量：6
7张炎烈.图书馆藏书建设实践分析与图书采购系统工程[J].图书与情报,1983(4):52-56. 被引量：2
8张影.图书馆采编工作革新探析[J].图书情报工作,2013,57(S1):108-110. 被引量：13
9陈悦,陈超美,刘则渊,胡志刚,王贤文.CiteSpace知识图谱的方法论功能[J].科学学研究,2015,33(2):242-253. 被引量：6718
10邹凯,汪全莉.智能搜索引擎与数字图书馆个性化服务[J].情报科学,2004,22(7):874-877. 被引量：8

引证文献31

1曹树金,刘慧云.以读者为中心的智慧图书馆研究[J].图书情报工作,2019,63(1):23-29. 被引量：58
2穆雪漫,宫法明.机器学习在视频智能识别中的应用[J].电子技术与软件工程,2018(19):254-254.
3徐进.基于人工智能技术的图书馆情境感知推荐服务研究[J].图书馆学刊,2018,40(8):112-115. 被引量：5
4储节旺,汪敏.我国移动图书馆信息服务研究热点及趋势分析[J].现代情报,2019,39(3):15-23. 被引量：15
5刘桂琴.政府数据开放平台用户评论情感差异分析[J].数字图书馆论坛,2019(2):18-23. 被引量：13
6储节旺,汪敏.5G环境下移动信息服务创新初探[J].情报理论与实践,2019,42(3):29-35. 被引量：45
7周聪,张德林.基于机器学习的图书智能采编模式的构建[J].中华医学图书情报杂志,2018,27(12):43-49. 被引量：6
8沈玲.人工智能技术在图书馆中的应用研究综述[J].图书馆学刊,2019,41(4):134-142. 被引量：6
9储节旺,陈梦蕾.人工智能驱动图书馆变革[J].大学图书馆学报,2019,37(4):5-13. 被引量：46
10倪秀琴.5G背景下移动信息服务创新初探[J].数字技术与应用,2019,37(11):204-205.

二级引证文献319

1孙雅欣,崔新刚,李瑞秋,陈新红.整合医学视角下医学图书馆资源建设与服务[J].医学信息学杂志,2019,40(11):71-74. 被引量：1
2刘恩泽,罗彬.5G时代高校智慧图书馆变革探究[J].图书馆学刊,2020,0(1):9-12. 被引量：6
3郑卫光.融合与重构:智慧图书馆发展新形态[J].图书馆杂志,2020,39(1):56-60. 被引量：29
4郭宇,于文倩,刘梦婷,刘文晴.基于KANO模型的智慧图书馆用户数据资源需求研究[J].情报科学,2023,41(12):57-64.
5王福,李全.移动图书馆场景化服务及其优化研究[J].情报科学,2020,0(2):88-93. 被引量：11
6李琳.智慧图书馆个性化服务发展现状及优化方向探究[J].传媒论坛,2023,6(16):112-114. 被引量：4
7安娜.元宇宙视域下图书馆发展路径研究[J].传媒论坛,2023,6(14):111-114.
8崔秋丽.智慧社会背景下智慧馆员的角色研究[J].传媒论坛,2022,5(22):111-113. 被引量：2
9王栓栓,徐瑾.数智时代高职院校智慧图书馆建设探析[J].传媒论坛,2022,5(4):88-91. 被引量：2
10杨丽萍,黄丽芸,梁秀豪,刘晓蔚,韦维,梁星星,阳文林.基于人工智能构建以科技期刊为中心的学术生态体系[J].编辑学报,2023,35(S01):121-126.

1《全国报刊索引》第7届学术研讨会征文启事[J].图书馆杂志,2006,25(8).
2谢可昕.妈妈的头发[J].创新作文（初中版）,2017,0(9):21-21.
3姚洁.新零售趋势下的实体零售企业创新路径[J].江苏经贸职业技术学院学报,2017(6):13-14. 被引量：7
4李志远,许娟红,魏涛,钱刚.基于Workbench工装夹具设计与优化分析[J].机电工程技术,2017,46(11):14-16. 被引量：6
5伍薇,陈银龙.长三角标准数据差异性探究[J].中国标准化,2017(10):60-63.
6程琦.基于DNS日志分析调度及优化设计与实现[J].福建电脑,2017,33(11):101-103. 被引量：1
7张永梅,贾辉,唐轶轩,姚振,王丽.设备(资产)运维精益管理系统优化及应用[J].无线互联科技,2017,14(19):122-124. 被引量：1
8徐璐.我国旅游管理研究的知识来源与结构——基于文献计量法的分析[J].中小企业管理与科技,2017,1(33):27-28.
9曾庆秦.农村地区幼儿园美术教学中材料的统合利用[J].美术教育研究,2017(10):84-85. 被引量：3
10王聪聪,向颖羿.“学霸君”:助力个性化教育帮普通学生逆袭[J].科学之友,2017,0(9):33-35.

大学图书馆学报

2017年第6期

浏览历史

内容加载中请稍等...

机器学习在图书馆应用初探:以TensorFlow为例被引量：31

参考文献7

二级参考文献85

共引文献453

同被引文献456

引证文献31

二级引证文献319

相关作者

相关机构

相关主题

浏览历史

机器学习在图书馆应用初探:以TensorFlow为例 被引量：31

参考文献7

二级参考文献85

共引文献453

同被引文献456

引证文献31

二级引证文献319

相关作者

相关机构

相关主题

浏览历史

机器学习在图书馆应用初探:以TensorFlow为例被引量：31