基于关联规则的Wikidata人物名称数据分析——以诺贝尔文学奖得主为主题被引量：3

Data Analysis of Wikidata Person Names Based on Association Rules Mining:A Case Study of the Theme of the Nobel Prize Winner

原文传递

导出

摘要 [目的 /意义]挖掘不同名称数据之间的关联关系,将关于某一实体或主题的领域知识表现出来,这对实现不同层次、不同粒度的知识体系的解构和重构、提供满足多种需求的知识服务工作具有重要的研究意义。[方法/过程]提出一种基于人物实体数据运行关联规则挖掘实验的研究框架,通过对人物实体条目的抽取、预处理及属性识别与分类等处理方法,利用R语言得到人物实体集的关联规则,实现多种名称数据的关联,最后从Wikidata知识库提取113位诺贝尔文学奖得主的实体条目进行实证分析。[结果 /结论]分析右部为地点名称、机构名称、时间名称和主题名称等4种不同类型规则的关联特征,实现不同名称数据类型的关系挖掘问题。本研究可为知识的揭示、聚合和关联提供新的视角,探索了数据挖掘技术在名称数据中的应用。：[Purpose/significance] Mining the relationship among different name data to show a domain or subject knowledge of a particular entity, which to achieve different levels, different dimensions of the knowledge system deconstruction and reconstruction, to provide a variety of needs to meet the knowledge service work has important research significance.[Method/process] This paper presents a research framework based on the association experiment of association rules of character entity operation. Through the extraction of object entity entries, preprocessing and attribute recognition and classification, the paper uses R to get the association of human entity rules, to achieve a variety of name data association, and finally extracts 113 Nobel Prize winner entity entries from the Wikidata knowledge base for empirical analysis.[Result/conclusion] The relationship between four different types of rules, such as place name, institution name, time name and subject name, is analyzed, and the relationship mining problem of different name data types is realized. This study provides a new perspective for knowledge disclosure, aggregation and association, and explores the application of data mining technology in name data.

作者贾君枝冯婕

机构地区山西大学经济与管理学院

出处《图书情报工作》 CSSCI 北大核心 2017年第12期122-128,共7页 Library and Information Service

基金国家社会科学基金重点项目"基于关联数据的中文名称规范档语义描述及数据聚合研究"(项目编号:15ATQ004)研究成果之一

关键词名称数据关联规则 APRIORI算法知识揭示 Wikidata name data association rule mining Apriori knowledge exploration Wikidata

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献4

1刘炜,张春景,夏翠娟.万维网时代的规范控制[J].中国图书馆学报,2015,41(3):22-33. 被引量：29
2贾君枝,薛秋红.Wikidata的特点、数据获取与应用[J].图书情报工作,2016,60(17):136-141. 被引量：10
3黄刘生,陈华平,王洵,陈国良.A Fast Algorithm for Mining Association Rules[J].Journal of Computer Science & Technology,2000,15(6):619-624. 被引量：17
4宋旭东,翟坤,高卫东.关联规则评价指标的研究[J].微计算机信息,2007,23(04X):174-176. 被引量：6

二级参考文献54

1罗可,郗东妹.采掘有效的关联规则[J].小型微型计算机系统,2005,26(8):1374-1379. 被引量：12
2宋旭东,翟坤,董丕明,高卫东,齐善友.基于J2EE架构的信息查询系统的研究与应用[J].微计算机信息,2006,22(05X):131-133. 被引量：7
3云明向.论书目控制理论在网络信息资源组织中的利用[J].四川图书馆学报,2006(6):32-34. 被引量：10
4Agrawal R,Srikant R.Mining sequential patterns[].Proceedings of the International Conference on Data Engineering.1995
5Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large databases[].Proceedings of the ACM SIGMOD International Conference on Management of Data.1993
6Agrawal R,Srikant R.Fast algorithms for mining association rules in large databases[].Research Report RJ.1994
7Agrawal R,Mannila H,Srikant R,et al.Fast discovery of association rules[].Advances in Knowledge Discovery and Data Mining.1996
8Houtsma M,Swami A.Set-oriented mining of association rules[].Research Report RJ.1993
9Reitz J M.Online dictionary of library and information science[EB/OL].[2015-03-31].http://www.abc-clio.com/ODLIS/odlis_A.aspx.
10国际图联书目记录的功能需求研究组.书目记录的功能需求最终报告[EB/OL].[2015-01-12].http://www.ifla.org/VII/s13/frbr/frbr-zh.pdf.

共引文献57

1李娜娜,宋洁,顾军华,郭树军.灾害天气关联模式挖掘技术研究[J].河北工业大学学报,2005,34(2):68-73. 被引量：2
2刘晓冰,翟坤,宋旭东,蒙秋男.钢铁企业交叉销售模型的研究与应用[J].系统工程,2008,26(9):9-14. 被引量：3
3郭红涛,郭永红,郭朝彬.数据挖掘技术在物流信息系统中的应用[J].科技信息,2009(4):262-263. 被引量：3
4陈超祥,丁健龙,华成,金林樵.基于频繁叶模式的XML最大频繁查询模式挖掘算法[J].计算机应用与软件,2009,26(6):85-87.
5周国涛,金银秋.基于关联规则挖掘的Web用户分类研究[J].中原工学院学报,2009,20(3):51-55. 被引量：2
6李文林,屠强,郭立中,陈涤平,陆建峰,赵国平,刘琴.周仲瑛诊治系统性红斑狼疮病案的用药特色分析——基于信息熵的关联规则方法[J].辽宁中医杂志,2010,37(5):769-771. 被引量：4
7付小伟,张保英.浅谈关联规则在读者借阅规律中的应用[J].企业技术开发（下半月）,2010(3):39-40.
8吕桃霞,刘培玉.一种基于矩阵的强关联规则生成算法[J].计算机应用研究,2011,28(4):1301-1303. 被引量：17
9范黎林,林卫.矩阵约束下的频繁项集挖掘方法研究[J].计算机工程与应用,2011,47(21):133-136. 被引量：1
10陈智,梁娟.基于GM(1,1)模型的元规则挖掘研究[J].微计算机信息,2012,28(4):175-176. 被引量：1

同被引文献26

1宋文.统一医学语言系统及其应用[J].情报理论与实践,2005,28(5):518-522. 被引量：6
2钱雪忠,孔芳.关联规则挖掘中对Apriori算法的研究[J].计算机工程与应用,2008,44(17):138-140. 被引量：38
3张涛,宗文红,田国栋.电子健康档案的发展与现状综述[J].中国卫生信息管理杂志,2011,8(3):83-86. 被引量：11
4罗爱民,黄力,罗雪山.信息系统互操作性评估方法研究[J].计算机技术与发展,2009,19(7):17-19. 被引量：12
5郑西川.临床信息学:从数据管理到循证医学支持[J].医学信息学杂志,2012,33(2):34-37. 被引量：4
6彭希羡,赵宇翔,朱庆华.基于关联规则挖掘的iConferences研究主题[J].情报学报,2013,32(12):1303-1314. 被引量：8
7崔妍,包志强.关联规则挖掘综述[J].计算机应用研究,2016,33(2):330-334. 被引量：152
8李艳,吕鹏,李珑.基于大数据挖掘与决策分析体系的高校图书馆个性化服务研究[J].图书情报知识,2016,33(2):60-68. 被引量：116
9刘成山,李玉,王洁良.大数据在图书情报领域的研究现状及趋势分析[J].情报理论与实践,2016,39(4):20-26. 被引量：17
10陈炎龙,段红玉.基于改进Hadoop云平台的海量文本数据挖掘[J].湖南师范大学自然科学学报,2016,39(3):84-88. 被引量：11

引证文献3

1高登文.图书情报数据挖掘处理平台设计[J].现代电子技术,2019,42(8):25-28. 被引量：2
2张玥,倪珺珉,王坚,宋小康,赵宇翔.基于关联规则挖掘的健康信息学主题分析——以dHealth会议为例[J].信息资源管理学报,2020,10(6):90-100. 被引量：5
3刘鹏鹏,赵占芳,王楠.基于标记属性图的Wikidata人物关系可视化数据分析[J].新一代信息技术,2021,4(12):13-18.

二级引证文献7

1赵光,刘益兵,王人颢,齐晓林,张红萍,王志萍.中外大学附属医院图书情报学领域数据挖掘研究现状对比分析与应对[J].新一代信息技术,2022,5(4):114-117. 被引量：1
2李红华.基于数据挖掘的图书信息管理系统设计与实现[J].现代科学仪器,2020(2):24-27.
3郑会,何静,李鹏.医疗诊断与预测中的增量式Apriori方法研究[J].计算机时代,2021(8):53-56. 被引量：3
4吴鹏,诗童,凌晨.基于微博平台的新冠疫苗主题发现研究[J].情报科学,2022,40(7):12-18. 被引量：4
5陈明红,李思婷,曾贝欣.老年人网络健康信息替代搜索行为影响因素及关联路径研究——从被替代搜索者视角[J].信息资源管理学报,2022,12(5):41-52. 被引量：4
6班航,王忠群.基于情境聚类扩展用户画像的旅游景点推荐方法[J].安庆师范大学学报（自然科学版）,2023,29(2):75-79. 被引量：1
7聂亚青,吴庭璋,王若佳,翟兴.基于BERTopic模型的健康信息学主题挖掘与发展演化研究[J].情报科学,2024,42(4):98-110. 被引量：1

1彭丽芳,何春江.关联规则挖掘在优化高校馆藏结构中的应用[J].科技情报开发与经济,2008,18(25):11-13. 被引量：1
2李寿星,杨丽君.谈谈时间的表示法[J].编辑学报,2001,13(5):268-269. 被引量：4
3林秋萍.满足用户的心理需求:手机应用发展的融合方向[J].传媒,2017(10):47-49. 被引量：2
4吕品,张永.基于大数据技术的科技成果数据库建设研究[J].统计与管理,2017,0(6):137-138. 被引量：2
5陈军飞,邓梦华,王慧敏.水利大数据研究综述[J].水科学进展,2017,28(4):622-631. 被引量：41
6周宇,廖思琴.科学数据语义描述研究述评[J].图书情报工作,2017,61(12):136-144. 被引量：4
7王小梅,邓启平,李国鹏,吴树仙,冷伏海,朱涛.ESI研究前沿的科学图谱及在纳米领域的应用[J].图书情报工作,2017,61(12):106-112. 被引量：14
8方安,胡佳慧,王军辉,任慧玲,葛红梅,梁芳,胡铁军.会议规范文档建设与功能实现[J].数字图书馆论坛,2017(7):30-34. 被引量：3
9吴卫玲,张小梅.谈科技期刊青年编辑应具备的能力[J].科技视界,2017(7):251-251.

图书情报工作

2017年第12期

浏览历史

内容加载中请稍等...

基于关联规则的Wikidata人物名称数据分析——以诺贝尔文学奖得主为主题被引量：3

参考文献4

二级参考文献54

共引文献57

同被引文献26

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于关联规则的Wikidata人物名称数据分析——以诺贝尔文学奖得主为主题 被引量：3

参考文献4

二级参考文献54

共引文献57

同被引文献26

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于关联规则的Wikidata人物名称数据分析——以诺贝尔文学奖得主为主题被引量：3