期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

从数据挖掘偏差到文献计量偏差被引量：1

From Data Mining Bias to Bibliometrics Bias

下载PDF

导出

摘要 [目的/意义]互联网的迅猛发展使得信息量增速不断加快。作为从海量数据中发现有用知识的有力手段,数据挖掘成为近年的研究热点。然而在数据挖掘过程中,输出值和真实值之间往往存在着一定的差距,即数据挖掘偏差。[方法/过程]通过相关研究综述了数据挖掘偏差的概念、研究进展以及发展方向,并以数据挖掘的基本步骤类比文献计量的基本步骤,进而提出文献计量偏差的基本概念。从文献来源选取、文献数据预处理、文献计量方法选取和计量结果解读4个角度重点论述了文献计量偏差的主要表现方式和解决办法。[结果/结论]文章旨在呼吁未来该领域的相关研究关注文献计量偏差及其带来的负向影响,并期望相关研究能够通过科学方法避免文献计量偏差,从而得到更为准确和可靠的结论。 [ Purpose/significance ] The amount of information increases greatly with the rapid development of the Internet. As an effective method to discover knowledge from the oceans of data, data mining has become a research hotspot in recent years. However, there are always gaps between the outputs and the actual values in the process of data mining, which is called data mining bias. [ Method/process] Through detailed literature review about the conception, research breakthroughs, and future de- velopment directions of data mining bias, this paper compares the basic steps of data mining and bibliometrics to put up the concept of bibliometrics bias. The main presentation forms and solutions of bibliometrics are discussed from the perspectives of bibliographic data resources, pre-processing, method selections, and result interpretations. [ Result/conclusion] The paper aims to call for re- searchers in this domain to pay more attentions to bibliometrics bias and its negative influences, expecting that related studies can avoid these biases through scientific methods to get more accurate and reliable results.

作者王冰璐步一徐扬刘姝雯

机构地区北京大学信息管理系印第安纳大学信息学与计算机学院

出处《情报理论与实践》 CSSCI 北大核心 2017年第10期41-46,共6页 Information Studies:Theory & Application

关键词数据挖掘数据挖掘偏差文献计量学文献计量偏差 data mining data mining bias bibliometrics bibliometrics bias

分类号 G353.1 [文化科学—情报学]

引文网络
相关文献

参考文献16

1步一,刘天祎,赵丹群,黄文彬.国外作者共引分析研究评述[J].情报杂志,2015,34(12):48-53. 被引量：13
2董琳.使用文献计量方法开展学科评价[J].情报杂志,2009,28(9):65-68. 被引量：14
3何荣利.三种文献计量方法比较研究[J].图书与情报,1996(2):59-60. 被引量：3
4王永红.定量专利分析的样本选取与数据清洗[J].情报理论与实践,2007,30(1):93-96. 被引量：30
5朱德志.数据挖掘中的数据质量检验[J].金融电子化,2007(7):55-56. 被引量：3
6邱均平.文献计量学的定义及其研究对象[J].中国图书馆学报,1986,14(2):71-71. 被引量：39
7叶深溪,许为民.文献计量学在科研评价中的应用进展[J].图书馆论坛,2003,23(4):12-14. 被引量：14
8朱锁玲,唐惠燕,倪峰,陈蓉蓉,施文.大数据时代我国文献计量应用研究现状及对策[J].情报科学,2016,34(8):116-121. 被引量：11
9刘红煦,曲建升.情报学定量研究现状与趋势分析[J].情报理论与实践,2015,38(12):10-14. 被引量：15
10王全跃,朱海涛,马瑞霞,赵丹,王锐敏.基于数据挖掘的ADS-B航迹数据偏差分析方法研究[J].科技创新与应用,2014,4(13):35-36. 被引量：2

二级参考文献181

1玄兆国,陈斌.情报研究定量方法纵横谈[J].情报理论与实践,1988,11(2):31-34. 被引量：5
2周发勤.科学学向定量化发展——介绍《科学度规学》杂志[J].自然辩证法通讯,1980,2(3):78-79. 被引量：3
3肖勇.论情报学的数学计量化研究[J].图书情报工作,2004,48(6):30-40. 被引量：13
4袁文秀,余恒鑫.关于网络信息生态的若干思考[J].情报科学,2005,23(1):144-147. 被引量：47
5孙瑞英.从定性、定量到内容分析法——图书、情报领域研究方法探讨[J].现代情报,2005,25(1):2-6. 被引量：64
6戴立信,金碧辉.催化不对称合成[J].中国基础科学,2005,7(3):15-17. 被引量：3
7唐懿芳 ,钟达夫 ,张师超 .数据清洗前的预处理方法[J].广西科学,2005,12(2):118-122. 被引量：3
8娄策群.学术机构科研能力评价的文献计量指标与模型[J].情报理论与实践,1995,18(5):14-17. 被引量：17
9芮肯法,殷建庆.热轧平整机对带钢轧制延伸率的控制和计算[J].江苏冶金,2005,33(4):10-11. 被引量：3
10周建中,李晓轩.国外科研资助机构的学科评估及其启示[J].科研管理,2005,26(5):121-126. 被引量：27

共引文献283

1韩露,李金花,肖羽乔,付屹鸥,姚铭霞.基于CiteSpace的癌症患者生育决策研究热点的可视化分析[J].中国优生与遗传杂志,2024,32(6):1298-1302.
2于显枫,赵记军.CNKI期刊视域下降解地膜研究态势文献计量分析[J].中国农学通报,2020,0(8):119-126. 被引量：3
3饶雷振,吴宇澄,曾军,林先贵.基于文献计量分析的污染物共代谢研究态势及发展趋势[J].应用与环境生物学报,2023,29(3):775-782. 被引量：5
4张盼盼.基于CNKI的我国海绵城市研究文献计量分析[J].人民长江,2020(S01):16-19. 被引量：4
5步一,薛睿,孟凡,黄文彬.知识图谱的关键技术及其在情报学中的应用[J].情报学进展,2022(1):349-384. 被引量：1
6程静.我国居民消费研究热点探析及展望——基于2000—2020年CSSCI文献计量分析[J].经济与社会发展,2021,19(6):37-48.
7郑玲,葛红,申鹏飞.数据挖掘技术在电厂汽轮机性能分析预测系统中的应用[J].中国电力教育,2005(z2):215-217.
8胡卫兵,王骏涛,胡明文.数据挖掘与土木工程的健康监测及诊断[J].振动工程学报,2004,17(z1):300-304. 被引量：1
9柯东林.利用数据挖掘技术建立数字化高校图书馆[J].科技资讯,2007,5(2).
10陈瑞芳.不同医学高校学报文献计量指标的比较与分析[J].编辑学报,2010,22(S1):159-161.

同被引文献14

1崔雷,刘伟,闫雷,张晗,侯跃芳,黄莹娜,张浩.文献数据库中书目信息共现挖掘系统的开发[J].现代图书情报技术,2008(8):70-75. 被引量：548
2郑杭生.学术话语权与中国社会学发展[J].中国社会科学,2011(2):27-34. 被引量：182
3孙贵平,商丽浩.国际话语权与中国高等教育研究:基于2007-2017年的计量分析[J].黑龙江高教研究,2019,37(1):6-11. 被引量：1
4李信,陆伟,李旭晖.一种新兴的学科领域历史根源探究方法:RPYS[J].图书情报工作,2016,60(20):70-76. 被引量：24
5李庚香.树立文化自信,打造“文化软实力学”[J].河南社会科学,2017,25(1):1-10. 被引量：2
6程结晶,丁慢慢,朱彦君.国外信息管理领域知识流的新兴趋势及可视化分析[J].现代情报,2017,37(4):170-177. 被引量：18
7Chaomei Chen.Science Mapping:A Systematic Review of the Literature[J].Journal of Data and Information Science,2017,2(2):1-40. 被引量：734
8李悦,苏成,贾佳,许震,田瑞强.基于科学计量的世界人工智能领域发展状况分析[J].计算机科学,2017,44(12):183-187. 被引量：25
9王婧媛,吴爱芝,王延飞.基于情报感知的领域内容演化脉络分析——以信息服务为例[J].图书情报知识,2019,0(6):93-101. 被引量：5
10刘迪,张会来.我国高校意识形态话语权研究的现状、热点和趋势——基于CNKI数据库(2006-2019年)的文献计量分析[J].思想教育研究,2020(5):142-147. 被引量：4

引证文献1

1赵蓉英,朱伟杰,常茹茹,刘卓著.话语权研究可视化分析:溯源、审视与演进[J].图书情报工作,2022,66(11):3-13. 被引量：5

二级引证文献5

1邱均平,胡博,徐中阳,肖博轩.基于DTM模型的国内外话语权研究主题挖掘及比较分析[J].情报理论与实践,2023,46(2):24-34. 被引量：11
2赵蓉英,朱伟杰,王筱宇.从学术影响力到学术话语权:学术期刊四维评价理论框架[J].中国科技期刊研究,2023,34(5):576-583. 被引量：17
3初景利,王珏.面向信息资源管理学科的话语体系构建思考[J].图书与情报,2024(1):38-47. 被引量：4
4赵蓉晖,张勇晨.中国语言学国际话语权现状及建构方略——跨学科话语权反思与重构[J].云南师范大学学报（哲学社会科学版）,2024,56(2):52-60.
5杨芳芳,宋雪雁,张伟民.国内信息茧房研究热点与演进趋势:兼论静态和动态双重视角[J].情报科学,2024,42(5):169-176. 被引量：2

1注释体例[J].当代美国评论,2017,1(1):119-121.
2吴杰娴.阅读教学的高效性——提问的技巧[J].学子（理论版）,2017,0(17):44-44.
3罗荣胜.对初中政治“合作、探究、自主”学习模式的新研究[J].考试周刊,2017,0(13):142-142.
4李建英.药品包装设计方法[J].医药导报,2017,36(A01):105-106. 被引量：1
5游修龄.从大型农书体系的比较试论《农政全书》的特色和成就[J].中国农史,1983,2(3):9-18. 被引量：7
6文慧.数据科学家:玩转数据的职场新宠[J].黄金时代（上半月）,2017,0(9):20-21.
7高录军,刘玲,张积慧,郝毫刚,李晓平,唐军,刘雨,赵丽丹.兽药大数据平台的应用架构研究[J].中国兽药杂志,2017,51(10):62-67. 被引量：4
8王丽春.小学英语支架式教学设计中多模态资源的选择和优化[J].南京晓庄学院学报,2017,33(4):35-40.
9顾生贵,邓延安,何涛.肃南县第五次荒漠化与沙化外业监测遇到的问题及改进对策[J].环境与发展,2017,29(7):159-160. 被引量：1
10姜春武,刘恩.国内青檀研究现状——基于CNKI的文献计量分析[J].林业科技通讯,2017(9):38-41. 被引量：2

情报理论与实践

2017年第10期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部