基于人名消歧的自引统计研究被引量：1

Personal Name Disambiguation-based Research on Self-citation Statistics

下载PDF

导出

摘要为解决中文检索系统中重名问题带来的自引统计不准确问题,设计了一种基于规则的人名消歧算法,包括作者机构、作者名、学科分类和来源期刊规则,以实现人名消歧,进而辅助自引统计。实验表明,对比基于KMeans的聚类算法,基于规则的人名消歧算法较为有效,综合测评指标F值最高达到0.87,可供自引统计模块使用。 The paper aims at solving the problem of self-citation statistics inaccuracy due to personal name duplication in Chinese retrieval system, designs a rule-based personal name disambiguation algorithm, including rules of authors’ organization, author name, discipline category and source journal, to realize the disambiguation of personal name and then to assist self-citation statistics.The experiment result shows that the rule-based personal name disambiguation algorithm is more effective than KMeans-based clustering algorithm, its comprehensive assessment index F tops at 0.87; it can be used for statistic module of self-citation.

作者尹相权曾姗糜凯

机构地区北京师范大学图书馆

出处《情报探索》 2015年第5期57-59,67,共4页 Information Research

关键词自引统计人名消歧聚类规则 self-citation statistics personal name disambiguation cluster rule

分类号 G252.7 [文化科学—图书馆学]

引文网络
相关文献

参考文献6

1姚建文,黄筱玲,吴丽萍.论去除论文引用泡沫——基于客观公正评价科技人才的视角[J].情报理论与实践,2013,36(8):11-14. 被引量：6
2马海收,刘媛媛,郑菲,谢华玲.基于ISI Web of Knowledge引证检索服务统计软件设计与实现[J].情报杂志,2012,31(2):148-152. 被引量：12
3谢新洲,夏晨曦,柯贤能.科技查新行业发展现状及面临的问题分析[J].图书情报工作,2009,53(12):9-12. 被引量：36
4袁润,周金元,卢章平.科技查新信息管理系统的设计与实现[J].现代情报,2007,27(7):152-155. 被引量：33
5战玉华,程爱平,钱俊雯,刘蜀仁.代检代查服务系统的开发及应用[J].图书情报工作,2005,49(11):73-75. 被引量：20
6李晓东,卢振波.论文查收查引工具软件的设计与实现[J].大学图书馆学报,2005,23(1):49-50. 被引量：31

二级参考文献30

1李自然,鄢小清,周进.基于VB的SQL-Server数据库与Word文档的数据交互[J].航空计算技术,2004,34(2):44-47. 被引量：3
2马景娣,田稷.基于J2EE的科技查新综合信息系统的设计与实现[J].现代图书情报技术,2004(8):77-78. 被引量：18
3王小琼.中国科技查新工作的发展前景及对策[J].农业图书情报学刊,2005,17(10):77-80. 被引量：12
4依云.关于科技查新[J].苏南科技开发,2006(1):40-40. 被引量：4
5马景娣,缪家鼎.对科技查新工作的再审视[J].现代情报,2006,26(5):138-140. 被引量：18
6沈洪杰,沈洪伟.基于科技查新项目的专题情报服务[J].图书馆学研究,2006(6):66-68. 被引量：17
7王志强.用系统工程的方法搞好科技查新工作[J].图书馆工作与研究,2006(5):65-67. 被引量：4
8王文平,程冰,黄达.科技查新工作创新发展的问题与对策[J].现代情报,2006,26(9):15-17. 被引量：28
9谢新洲,滕跃,吴淑燕,等.科技查新机构分布与查新机构评价指标体系的研究.北京:北京大学新闻与传播学院,2002.
10教育部科技发展中心.2004年教育部部级查新机构年检通报.[2008-11-04].http://www.cutech.edu.cn/cn/kjcg/cgex/webinfo/2005/08/1180054675637133.htm.

共引文献115

1朱玉奴,孙丽娟,王慧.高校图书馆查收查引服务发展现状的量化研究[J].图书馆建设,2020(S01):206-208. 被引量：5
2张云坤,严大香.基于AJAX的科技查新档案管理系统设计[J].科技情报开发与经济,2008,18(19):71-73. 被引量：8
3彭晓庆.科技查新档案管理系统的分析与设计[J].上海高校图书情报工作研究,2008,18(3):37-38. 被引量：12
4张云坤.基于AJAX的科技查新管理系统[J].大学图书情报学刊,2008,26(6):30-32. 被引量：12
5梁红妮,胡小飞.论文查收查引服务的分析与探讨[J].情报理论与实践,2009,32(4):96-99. 被引量：40
6李腾.基于ASP.NET技术的科技查新网上受理系统的设计与实现[J].情报探索,2009(10):74-76. 被引量：5
7冯君.高校图书馆开展科技查新服务新思路[J].江苏科技信息,2009(12):9-10. 被引量：5
8韩子军,李修波,隋移山.高校图书馆建立学术成果评价中心的设想[J].现代情报,2009,29(12):89-91. 被引量：3
9丁德臣.杂合DEA和SOM的科技查新质量评价研究[J].图书情报工作,2010,54(8):46-50. 被引量：11
10吴素坤,闫江,王超,董政娥.科技查新员职业倦怠成因及对策[J].图书情报工作,2010,54(11):92-95. 被引量：23

同被引文献10

1陈晨,王厚峰.基于社会网络的跨文本同名消歧[J].中文信息学报,2011,25(5):75-82. 被引量：13
2袁军鹏,俞征鹿,苏成,马峥,杨志清,宿洁.作者重名辨识研究进展[J].数字图书馆论坛,2011(10):60-65. 被引量：9
3朱亮亮.利用改进的K-means算法实现文献著者人名消歧[J].软件导刊,2013,12(5):63-66. 被引量：10
4任景华.利用优化的DBSCAN算法进行文献著者人名消歧[J].图书馆理论与实践,2014(12):61-65. 被引量：10
5阳怡林,陈刚,周杰,李弼程.人名消歧研究综述[J].信息工程大学学报,2016,17(4):478-483. 被引量：1
6付媛,朱礼军,韩红旗.姓名消歧方法研究进展[J].情报工程,2016,2(1):53-58. 被引量：14
7张雄,陈福才,黄瑞阳.基于融合特征相似度的实体消歧方法研究[J].计算机应用研究,2017,34(2):347-350. 被引量：7
8线岩团,余正涛,洪旭东,张磊,郭剑毅.基于特征加权重叠度的中文实体协同消歧方法[J].中文信息学报,2017,31(2):36-41. 被引量：6
9李孟亚.基于融合特征的中文图书作者人名消歧方法研究[J].电脑知识与技术,2018,14(4Z):182-184. 被引量：2
10阳怡林,周杰,李弼程.基于聚类集成的人名消歧算法[J].计算机应用研究,2016,33(9):2716-2720. 被引量：6

引证文献1

1翟晓瑞,韩红旗,张运良,李仲.基于稀疏分布式表征的英文著者姓名消歧研究[J].计算机应用研究,2019,36(12):3534-3538. 被引量：7

二级引证文献7

1仇国华,赵华.一种论文作者重名消歧方法[J].软件导刊,2020,19(3):111-115.
2沈喆,王毅,姚毅凡,成颖.面向学术文献的作者名消歧方法研究综述[J].数据分析与知识发现,2020,4(8):15-27. 被引量：10
3吴柯烨,闵超,孙建军,权昭瑄.面向特定科研任务的著者姓名消歧方法[J].情报学报,2021,40(7):734-744. 被引量：4
4阮光册,涂世文,田欣,张莉.多特征融合的英文科技文献增量式人名消歧应用研究[J].情报杂志,2021,40(9):147-153. 被引量：3
5马传香,吕友.基于集成学习的论文作者消歧研究[J].长江信息通信,2021,34(11):23-26.
6沈喆,王毅,鞠秀芳,成颖.基于先精确后召回策略的作者名消歧模型研究[J].情报学报,2022,41(4):350-363. 被引量：2
7曹思萌,李春旺.作者名称增量消歧研究综述[J].数据分析与知识发现,2022,6(5):10-19. 被引量：1

1陈秀娥.《内燃机学报》自引统计与分析[J].内燃机学报,1997,15(3):375-382.
2张静,张志强,赵亚娟.基于专利发明人人名消歧的研发团队识别研究[J].知识管理论坛,2016(3):217-225. 被引量：3
3白海燕.ORCID在机构知识库中的整合介绍[J].现代图书情报技术,2015(3):8-17. 被引量：6
4任景华.利用优化的DBSCAN算法进行文献著者人名消歧[J].图书馆理论与实践,2014(12):61-65. 被引量：10
5刘刚.北京图书馆大型计算机中文检索系统向读者开放试运行[J].北京图书馆馆刊,1996,5(1):138-138.
6王丽君,高迎,王锡钢.中文检索系统中查询的扩展[J].小型微型计算机系统,2002,23(7):894-896. 被引量：3
7吴春玉.中文全文检索系统主题词标引[J].情报科学,2004,22(6):720-722.
8崔雷,侯跃芳,张晗.论影响因子及其在科研绩效评价中的应用[J].医学情报工作,2003,24(4):241-245. 被引量：23
9战学刚,林鸿飞,姚天顺.Infolite中文检索系统[J].小型微型计算机系统,2000,21(9):989-992. 被引量：9
10王天铎.SCI和CSCD、CSTPCD收录中国科技期刊的IF值的回归分析[J].中国科技期刊研究,2005,16(1):38-44. 被引量：4

情报探索

2015年第5期

浏览历史

内容加载中请稍等...

基于人名消歧的自引统计研究被引量：1

参考文献6

二级参考文献30

共引文献115

同被引文献10

引证文献1

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于人名消歧的自引统计研究 被引量：1

参考文献6

二级参考文献30

共引文献115

同被引文献10

引证文献1

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于人名消歧的自引统计研究被引量：1