期刊文献+

基于关联规则的Wikidata人物名称数据分析——以诺贝尔文学奖得主为主题 被引量:3

Data Analysis of Wikidata Person Names Based on Association Rules Mining:A Case Study of the Theme of the Nobel Prize Winner
原文传递
导出
摘要 [目的 /意义]挖掘不同名称数据之间的关联关系,将关于某一实体或主题的领域知识表现出来,这对实现不同层次、不同粒度的知识体系的解构和重构、提供满足多种需求的知识服务工作具有重要的研究意义。[方法/过程]提出一种基于人物实体数据运行关联规则挖掘实验的研究框架,通过对人物实体条目的抽取、预处理及属性识别与分类等处理方法,利用R语言得到人物实体集的关联规则,实现多种名称数据的关联,最后从Wikidata知识库提取113位诺贝尔文学奖得主的实体条目进行实证分析。[结果 /结论]分析右部为地点名称、机构名称、时间名称和主题名称等4种不同类型规则的关联特征,实现不同名称数据类型的关系挖掘问题。本研究可为知识的揭示、聚合和关联提供新的视角,探索了数据挖掘技术在名称数据中的应用。 :[Purpose/significance] Mining the relationship among different name data to show a domain or subject knowledge of a particular entity, which to achieve different levels, different dimensions of the knowledge system deconstruction and reconstruction, to provide a variety of needs to meet the knowledge service work has important research significance.[Method/process] This paper presents a research framework based on the association experiment of association rules of character entity operation. Through the extraction of object entity entries, preprocessing and attribute recognition and classification, the paper uses R to get the association of human entity rules, to achieve a variety of name data association, and finally extracts 113 Nobel Prize winner entity entries from the Wikidata knowledge base for empirical analysis.[Result/conclusion] The relationship between four different types of rules, such as place name, institution name, time name and subject name, is analyzed, and the relationship mining problem of different name data types is realized. This study provides a new perspective for knowledge disclosure, aggregation and association, and explores the application of data mining technology in name data.
作者 贾君枝 冯婕
出处 《图书情报工作》 CSSCI 北大核心 2017年第12期122-128,共7页 Library and Information Service
基金 国家社会科学基金重点项目"基于关联数据的中文名称规范档语义描述及数据聚合研究"(项目编号:15ATQ004)研究成果之一
关键词 名称数据 关联规则 APRIORI算法 知识揭示 Wikidata name data association rule mining Apriori knowledge exploration Wikidata
  • 相关文献

参考文献4

二级参考文献54

  • 1罗可,郗东妹.采掘有效的关联规则[J].小型微型计算机系统,2005,26(8):1374-1379. 被引量:12
  • 2宋旭东,翟坤,董丕明,高卫东,齐善友.基于J2EE架构的信息查询系统的研究与应用[J].微计算机信息,2006,22(05X):131-133. 被引量:7
  • 3云明向.论书目控制理论在网络信息资源组织中的利用[J].四川图书馆学报,2006(6):32-34. 被引量:10
  • 4Agrawal R,Srikant R.Mining sequential patterns[].Proceedings of the International Conference on Data Engineering.1995
  • 5Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large databases[].Proceedings of the ACM SIGMOD International Conference on Management of Data.1993
  • 6Agrawal R,Srikant R.Fast algorithms for mining association rules in large databases[].Research Report RJ.1994
  • 7Agrawal R,Mannila H,Srikant R,et al.Fast discovery of association rules[].Advances in Knowledge Discovery and Data Mining.1996
  • 8Houtsma M,Swami A.Set-oriented mining of association rules[].Research Report RJ.1993
  • 9Reitz J M.Online dictionary of library and information science[EB/OL].[2015-03-31].http://www.abc-clio.com/ODLIS/odlis_A.aspx.
  • 10国际图联书目记录的功能需求研究组.书目记录的功能需求最终报告[EB/OL].[2015-01-12].http://www.ifla.org/VII/s13/frbr/frbr-zh.pdf.

共引文献57

同被引文献26

引证文献3

二级引证文献7

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部