基于聚类的人名消歧研究综述被引量：2

A Summary:Research Name Disambiguation of Clustering

下载PDF

导出

摘要人名消歧问题属于文本聚类范围,但有其自身的特殊性,即参与聚类的文本集采用向量空间模型表示以后具有较高的维度,导致数据在聚类过程中效率低下、计算内存开销过高。为了深入分析人名消歧研究中聚类算法的整体应用情况,从中国知网期刊数据库收集2006-2018年10月相关文献进行了统计和分析,介绍了利用聚类算法进行人名消歧研究的一般流程,阐述了聚类算法在人名消歧研究的应用、聚类评价指标和聚类结果评价,详细介绍相关研究成果及代表文献,为研究人员提供参考和借鉴。 Name disambiguation belongs to the scope of text clustering,but it has its own particularity:the set of text clustering represented by vector space model has a higher dimension,which leads to inefficiency and high computational memory in clustering process. In order to deeply analyze the overall application of clustering algorithm in the research of name disambiguation,the paper collected the related literature from the database of CNKI from October 2006 to October 2018 to statistics and analyze. Also,introduces the general process of using clustering algorithm in the researching name disambiguation,expounds the application of clustering evaluation in researching name disambiguation,clustering evaluation and evaluation of clustering result. Finally,the paper introduces in detail research results and representative literature,which provides reference for researchers of name disambiguation.

作者展金梅陈君涛 ZHAN Jinmei;CHEN Juntao(Qiongtai Normal University,Haikou 571127,China;Hainan College of Economics and Business,Haikou 571127,China)

机构地区琼台师范学院海南经贸职业技术学院

出处《现代信息科技》 2019年第10期88-91,共4页 Modern Information Technology

基金海南省高等学校科学研究项目:聚类集成算法在中文文本中人名消歧的应用研究(项目编号:Hnky2018-78)资助,属其阶段性研究成果之一

关键词聚类人名消歧研究综述 clustering name disambiguation research summary

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1章顺瑞,游宏梁.基于层次聚类算法的中文人名消歧[J].现代图书情报技术,2010(11):64-68. 被引量：12
2熊李艳,赵毅,黄卫春,钟茂生,黄晓辉.基于句义结构分析的中文人名消歧[J].计算机应用研究,2016,33(10):2898-2901. 被引量：3
3任景华.利用优化的DBSCAN算法进行文献著者人名消歧[J].图书馆理论与实践,2014(12):61-65. 被引量：10
4杨欣欣,李培峰,朱巧明,王英帅.一种基于改进的K-means算法的人名消歧系统的设计与实现[J].计算机与数字工程,2010,38(8):10-12. 被引量：5
5阳怡林,周杰,李弼程.基于聚类集成的人名消歧算法[J].计算机应用研究,2016,33(9):2716-2720. 被引量：6
6林翠萍,吴扬扬.采用改进最长公共子序列的人名消歧[J].华侨大学学报（自然科学版）,2016,37(2):201-206. 被引量：5
7朱翔,史晓东,陈毅东.基于层次聚类的中文人名消歧方法研究[J].心智与计算,2010,0(4):236-241. 被引量：1
8张菲菲,李宗海,周晓辉,李晓戈.基于层次聚类的跨文本中文人名消歧研究[J].计算机工程与应用,2014,50(6):106-111. 被引量：8
9李广一,王厚峰.基于多步聚类的汉语命名实体识别和歧义消解[J].中文信息学报,2013,27(5):29-34. 被引量：17
10阳怡林,周杰,李弼程,席耀一.基于分步聚类的人名消歧算法[J].数据采集与处理,2016,31(1):213-222. 被引量：3

二级参考文献98

1张猛,王大玲,于戈.一种基于自动阈值发现的文本聚类方法[J].计算机研究与发展,2004,41(10):1748-1753. 被引量：16
2刘远超,王晓龙,刘秉权.一种改进的k-means文档聚类初值选择算法[J].高技术通讯,2006,16(1):11-15. 被引量：23
3ICTCLAS-分词-中文分词-汉语分词[EB/OL].[2009-07-18].http://ictclas.org/.
4罗会兰,孔繁胜,李一啸.聚类集成中的差异性度量研究[J].计算机学报,2007,30(8):1315-1324. 被引量：36
5CHOI J D,L EE K,LOGINOV A,et al.Efficient and precise data race detection for multithreaded object-oriented programs[C]//Proceeding of the 2002 ACM SIGPLAN Conference on Programming Language Design and Implementation.Berlin,2002:258-269.
6Fleischman M.B,Hovy E.Multi-document Person Name Resolution[C]//Proceedings of ACL-42 Reference Resolution Workshop,Barcelona,Spain,2004,7.
7Chen Y,Martin J.Towards Robust Unsupervised Personal Name Disambiguation[C]//Proceedings of the EMNLP and CoNLL,Prague,2007:190-198.
8Artiles J,Gonzalo J,Sekine S.The SemEval-2007 WePS Evaluation:Establishing a benchmark for the Web People Search Task[C]//Proceedings of the 4th International Workshop on Semantic Evaluations 2007,Prague,June,2007:64-69.
9Shingo O,Issei S,Minoru Y.Person Name Disambiguation in Web Pages Using Social Network[J].Compound Words and Latent Topics.PAKDD,2008:260-271.
10Malin B, Airoldi E, Carley K M. A Network Analysis Model for Disambiguation of Names in Lists[ J]. Computational & Mathematical Organization Theory, 2005,11 (2) :119 - 139.

共引文献46

1余传明,钟韵辞,林奥琛,安璐.基于网络表示学习的作者重名消歧研究[J].数据分析与知识发现,2020,4(2):48-59. 被引量：10
2肖晶,梁冰,张晓丹,吕世炅.一种面向篇级数据的作者名消歧规则和算法[J].现代图书情报技术,2012(5):55-59. 被引量：10
3汤亚芬.先秦古汉语典籍中的人名自动识别研究[J].现代图书情报技术,2013(7):63-68. 被引量：15
4窦天芳,张成昱,张蓓,邹志华.ResearcherID现状分析及应用启发[J].图书情报工作,2014,58(4):40-45. 被引量：17
5范午攸.一种针对已知作者的姓名消歧方法[J].图书馆杂志,2018,37(12):56-63. 被引量：6
6于东,荀恩东.基于Word Embedding语义相似度的字母缩略术语消歧[J].中文信息学报,2014,28(5):51-59. 被引量：6
7郭喜跃,周琴,陈前军.基于CRF与规则的工程领域命名实体识别方法[J].软件导刊,2014,13(11):28-30. 被引量：2
8朱云霞.中文文献题录数据作者重名消解问题研究[J].图书情报工作,2014,58(23):143-148. 被引量：8
9任景华.利用优化的DBSCAN算法进行文献著者人名消歧[J].图书馆理论与实践,2014(12):61-65. 被引量：10
10许华,刘茂福,姜丽,顾进广.基于语言规则的病症菌实体抽取[J].武汉大学学报（理学版）,2015,61(2):151-155. 被引量：8

同被引文献11

1余传明,钟韵辞,林奥琛,安璐.基于网络表示学习的作者重名消歧研究[J].数据分析与知识发现,2020,4(2):48-59. 被引量：10
2杨南.谈中国人名汉语拼音的书写方式[J].编辑学报,1995,7(3):156-157. 被引量：6
3张菲菲,李宗海,周晓辉,李晓戈.基于层次聚类的跨文本中文人名消歧研究[J].计算机工程与应用,2014,50(6):106-111. 被引量：8
4闫蓉.浅析中英文姓名互译中的混乱现象[J].长春理工大学学报（社会科学版）,2014,27(3):127-129. 被引量：1
5任景华.利用优化的DBSCAN算法进行文献著者人名消歧[J].图书馆理论与实践,2014(12):61-65. 被引量：10
6林翠萍,吴扬扬.采用改进最长公共子序列的人名消歧[J].华侨大学学报（自然科学版）,2016,37(2):201-206. 被引量：5
7阳怡林,周杰,李弼程.基于聚类集成的人名消歧算法[J].计算机应用研究,2016,33(9):2716-2720. 被引量：6
8熊李艳,赵毅,黄卫春,钟茂生,黄晓辉.基于句义结构分析的中文人名消歧[J].计算机应用研究,2016,33(10):2898-2901. 被引量：3
9沈喆,王毅,姚毅凡,成颖.面向学术文献的作者名消歧方法研究综述[J].数据分析与知识发现,2020,4(8):15-27. 被引量：10
10吴柯烨,闵超,孙建军,权昭瑄.面向特定科研任务的著者姓名消歧方法[J].情报学报,2021,40(7):734-744. 被引量：4

引证文献2

1陈君涛,展金梅.聚类集成技术在中文人名消歧中的应用研究[J].信息系统工程,2020(4):76-77.
2汤哲冲,方志坚,贾子杰.基于图神经网络的姓名消歧算法[J].智能计算机与应用,2024,14(3):54-60.

1孟祥鹏.活血化瘀法在中医内科临床中的应用研究[J].全科口腔医学电子杂志,2019,6(22):170-170. 被引量：4
2吴瑞津.分一分[J].小说月刊（下半月）,2018,0(10):258-258.
3潘虹.3D打印技术对产品设计创新开发的研究[J].计算机产品与流通,2019,8(7):116-116. 被引量：4
4梁林生,陈海凤,何俊.2018年度晚造玉林市水稻品种区试结果评价[J].广西农学报,2019,34(1):11-15. 被引量：2
5马秀芳,候雯.幼儿园绩效考核中的问题与对策建议[J].新教育时代电子杂志（学生版）,2019(8):7-7.
6魏振钢,郑东辉,魏兆强.聚类算法结果的可视化分析方法[J].中国海洋大学学报（自然科学版）,2019,49(9):146-150.
7李林.下岗失业人员再就业技能培训的相关思考[J].当代旅游（下旬刊）,2018,0(12):00217-00217. 被引量：1
8舒莉,吴萍,胡永胜,田慧中,郑君涛,刘伟.受试者工作特征曲线分析评价体格检查在腰椎间盘突出症的诊断价值[J].循证医学,2019,19(3):147-151. 被引量：8
9钮永莉,武斌.基于改进粒子群和K-Means的文本聚类算法研究[J].兰州文理学院学报（自然科学版）,2019,33(4):44-47. 被引量：8
10张静,张志强.实行“捕诉合一”应解决的几个问题[J].检察调研与指导,2018,0(5):24-26.

现代信息科技

2019年第10期

浏览历史

内容加载中请稍等...

基于聚类的人名消歧研究综述被引量：2

参考文献10

二级参考文献98

共引文献46

同被引文献11

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于聚类的人名消歧研究综述 被引量：2

参考文献10

二级参考文献98

共引文献46

同被引文献11

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于聚类的人名消歧研究综述被引量：2