期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
知识图谱赋能下的历史人物数据平台构建实践——以宋庆龄文献数据中心平台建设为例 被引量:1
1
作者 韩春磊 徐卓韵 《图书馆杂志》 CSSCI 北大核心 2024年第6期114-123,93,共11页
线上数据平台已成为历史人物文献史料研究的重要载体,其借助数字化、知识化充分保护文献、挖掘史料的内在价值,能为广大研究者和历史爱好者提供强有力的数据支撑和便捷的文献服务。本研究在梳理历史人物数据库和数字人文下知识图谱的相... 线上数据平台已成为历史人物文献史料研究的重要载体,其借助数字化、知识化充分保护文献、挖掘史料的内在价值,能为广大研究者和历史爱好者提供强有力的数据支撑和便捷的文献服务。本研究在梳理历史人物数据库和数字人文下知识图谱的相关研究基础之上,提出并分析了构建历史人物数据平台的两大关键问题:多源异构文献数据的结构化和多模态信息下的知识图谱构建,并通过数据分类统计、元数据结构化设计、Schema构建、知识抽取、实体融合5个环节解决了上述问题,实现了文献聚合、文献检索、文献可视化等功能,并以宋庆龄为研究对象进行实证研究,所设计的数据平台构建流程为图书馆智慧化领域研究提供了切实可行的方案实例。 展开更多
关键词 历史人物 数据平台 元数据 知识图谱
下载PDF
基于异质图神经网络预训练的多标签文档分类研究
2
作者 吴家伟 方全 +1 位作者 胡骏 钱胜胜 《计算机科学》 CSCD 北大核心 2024年第1期143-149,共7页
多标签文档分类是一种将文档实例与相关标签相关联的技术,近年来受到越来越多研究者的关注。现有的多标签文档分类方法尝试探索文本之外的信息的融合,如文档元数据或标签结构。然而,这些方法要么简单地利用元数据的语义信息,要么没有考... 多标签文档分类是一种将文档实例与相关标签相关联的技术,近年来受到越来越多研究者的关注。现有的多标签文档分类方法尝试探索文本之外的信息的融合,如文档元数据或标签结构。然而,这些方法要么简单地利用元数据的语义信息,要么没有考虑标签的长尾分布,因此忽略了文档及其元数据之间的高阶关系和标签的分布规律等信息,从而影响到多标签文档分类的准确性。因此,文中提出一种新的基于异质图神经网络预训练的多标签文档分类方法。该方法通过构造文档与其元数据的异质图,采用两种对比学习预训练方法捕获文档与其元数据之间的关系,并通过平衡标签长尾分布的损失函数来提高多标签文档分类的准确性。在基准数据集上的实验结果表明,所提方法的准确率比Transformer提高了8%,比BertXML提高了4.75%,比MATCH提高了1.3%。 展开更多
关键词 多标签文档分类 元数据 异质图神经网络 预训练 长尾分布
下载PDF
基于知识图谱的标准文献多维知识发现研究 被引量:3
3
作者 范昊 郑小川 +1 位作者 热孜亚·艾海提 李珊珊 《情报理论与实践》 CSSCI 北大核心 2023年第9期175-184,共10页
[目的/意义]我国经济迈入高质量发展阶段,标准文献在新发展格局中起着基础引领作用。基于知识图谱进行标准文献多维知识发现,能够创新标准文献的资源利用方式,提高利用效率。[方法/过程]结合标准文献内容结构特征和标准文献情报需求,提... [目的/意义]我国经济迈入高质量发展阶段,标准文献在新发展格局中起着基础引领作用。基于知识图谱进行标准文献多维知识发现,能够创新标准文献的资源利用方式,提高利用效率。[方法/过程]结合标准文献内容结构特征和标准文献情报需求,提炼多维知识发现需求。通过对标准文献编写规范、标准文献元数据、标准文献内容等进行系统化的分析,完善和构建标准文献本体模型,最后选取版权领域进行知识发现实例探索。[结果/结论]面向用户情报需求,提出了“标准文献—机构—人员—术语—结构—内容”六维知识发现框架,并聚焦标准文献的通用内容与结构,构建了“元数据—结构—内容”3层标准文献本体模型,包含15个概念、21个对象属性,可一定程度上支撑六维知识发现,包括关联标准文献、潜在机构人员合作关系、术语不一致发现、结构重用、内容关联发现等应用。文章提出的3层标准文献本体模型拓展并细化了标准文献实体类型,基于知识图谱的多维知识发现框架能够为标准文献开发利用提供新方向。 展开更多
关键词 标准文献 知识图谱 知识发现 本体 元数据
下载PDF
面向共享的地学数据语义标签提取与推荐方法 被引量:2
4
作者 王敬悦 王卷乐 +2 位作者 韩保民 张敏 李凯 《中国科技资源导刊》 2023年第2期83-93,共11页
地球科学数据具有丰富的语义信息,这为探索地学奥妙带来广阔空间的同时,也为数据共享带来了挑战。缺少语义的认知和关联使得用户难以从复杂、海量、多源、异构的地球科学数据中发现符合自身需求的数据。以中国科学院《地球大数据科学工... 地球科学数据具有丰富的语义信息,这为探索地学奥妙带来广阔空间的同时,也为数据共享带来了挑战。缺少语义的认知和关联使得用户难以从复杂、海量、多源、异构的地球科学数据中发现符合自身需求的数据。以中国科学院《地球大数据科学工程》的共享数据集为研究对象,对数据文本进行分词和标签提取,实现数据形式的统一,以达到多源异构数据的规范化管理。研究表明,通过对数据集实现标签提取、标签推荐以及知识图谱的构建,可促进海量地球科学数据的管理和精准服务。研究结果可为更多的科学数据共享平台提供借鉴。 展开更多
关键词 地球科学 数据共享 语义标签 相似推荐 知识图谱 元数据
下载PDF
支持范围查询的低冗余知识图谱管理 被引量:4
5
作者 王飞 钱铁云 +1 位作者 刘斌 彭智勇 《计算机研究与发展》 EI CSCD 北大核心 2019年第8期1758-1771,共14页
随着越来越多的数据以知识图谱的形式进行组织和发布,知识图谱的管理引起了大量的关注.现有知识图谱管理方法存在2个明显的缺陷:1)逻辑存储建模产生了大量的数据冗余,无法有效地支持连续属性的范围查询;2)语义存储建模代价昂贵,不能有... 随着越来越多的数据以知识图谱的形式进行组织和发布,知识图谱的管理引起了大量的关注.现有知识图谱管理方法存在2个明显的缺陷:1)逻辑存储建模产生了大量的数据冗余,无法有效地支持连续属性的范围查询;2)语义存储建模代价昂贵,不能有效地适应查询的动态演化.提出了聚簇对象代理模型(cluster object deputy model, CODM)进行知识和元知识的建模管理.该模型具有2个特点,分别是模式化的逻辑存储建模和轻量级的语义存储建模.CODM设计了基于集合编辑距离的模式聚簇算法将知识图谱转化为模式数据,实现了数据的模式化存储,支持了面向属性数据类型的索引特化.此外,CODM构建类的层次系统建模实体之间的各种语义关联,采用对象指针实现了轻量级的泛化语义关联物化.实验结果证明:CODM不仅能够极大地减少数据冗余和有效地支持范围查询,而且加速了复杂查询的处理效率. 展开更多
关键词 知识图谱 元数据建模 范围查询 模式化存储 聚簇对象代理模型
下载PDF
知识图谱构建中的语义标准问题研究 被引量:22
6
作者 袁满 褚冰 陈萍 《情报理论与实践》 CSSCI 北大核心 2020年第3期131-137,共7页
[目的/意义]随着知识图谱在互联网领域中的成功应用,使得知识图谱的应用迅速向垂直领域传播与扩散,越来越得到垂直领域的重视。我国各个领域经历了40多年的信息化建设,导致了一大批阻碍信息共享的"信息孤岛",其根本原因是领... [目的/意义]随着知识图谱在互联网领域中的成功应用,使得知识图谱的应用迅速向垂直领域传播与扩散,越来越得到垂直领域的重视。我国各个领域经历了40多年的信息化建设,导致了一大批阻碍信息共享的"信息孤岛",其根本原因是领域没有给予标准化足够的重视。无独有偶,40年后的今天,领域又一次无法回避知识表示中的标准化难题!目前知识图谱构建主要关注点在于知识图谱的构建技术,却很少考虑知识图谱构建中的语义标准化问题。[方法/过程]文章在对国内外语义知识标准化相关内容研究的基础上,提出了领域知识图谱构建中应当遵循的五层标准体系模型,该模型融合了国内外领域相关的元数据与本体标准,揭示出知识图谱构建中以元数据标准为核心的重要思想,指导领域选择标准词汇的方法,使得领域所构建的知识图谱实现标准化,从而为知识的共享与互操作奠定基础。[结果/结论]在石油术语知识图谱构建过程以该标准体系模型作指导,实现了石油术语知识图谱标准构建,从而验证了标准体系模型的合理性与正确性,文中提出的观点和标准体系模型具有创新性。 展开更多
关键词 本体 知识图谱 元数据标准 标准化 语义关联
下载PDF
专家证据文档识别无向图模型
7
作者 毛存礼 余正涛 +2 位作者 吴则建 郭剑毅 线岩团 《软件学报》 EI CSCD 北大核心 2013年第11期2734-2746,共13页
专家证据文档识别是专家检索的关键步骤.融合专家候选文档独立页面特征以及页面之间的关联关系,提出了一个专家证据文档识别无向图模型.该方法首先分析各类专家证据文档中的词、URL链接、专家元数据等独立页面特征以及候选专家证据文档... 专家证据文档识别是专家检索的关键步骤.融合专家候选文档独立页面特征以及页面之间的关联关系,提出了一个专家证据文档识别无向图模型.该方法首先分析各类专家证据文档中的词、URL链接、专家元数据等独立页面特征以及候选专家证据文档间的链接和内容等关联关系;然后将独立页面特征以及页面之间的关联关系融入到无向图中构建专家证据文档识别无向图模型;最后利用梯度下降方法学习模型中特征的权重,并利用吉布斯采样方法进行专家证据文档识别.通过对比实验验证了该方法的有效性.实验结果表明,该方法有较好的效果. 展开更多
关键词 专家证据文档 专家检索 独立页面特征 专家元数据 无向图模型
下载PDF
知识组织方法和技术的演变及应用 被引量:2
8
作者 夏翠娟 《晋图学刊》 2021年第6期1-9,共9页
在数智时代,图书馆作为社会文化记忆装置的文化记忆机构之一,其重要任务除了支撑社会记忆的长期保存,为科研教育、文化传播提供文献基础设施以外,还要提供支撑泛在计算的数据基础设施。知识组织、信息素养、阅读推广、信息处理、数据治... 在数智时代,图书馆作为社会文化记忆装置的文化记忆机构之一,其重要任务除了支撑社会记忆的长期保存,为科研教育、文化传播提供文献基础设施以外,还要提供支撑泛在计算的数据基础设施。知识组织、信息素养、阅读推广、信息处理、数据治理等是图书馆的核心竞争力,其中知识组织的方法和技术,是数智时代图书馆员应该具备的核心专业能力之一。本报告介绍了数据基础设施技术需求和规范,将知识组织方法和技术的发展分成三个阶段:分类主题法、元数据法、知识本体法,分别介绍其发展过程、特点和应用场景。重点介绍了本体方法的相关技术和应用流程、本体模型和词表的设计原则及应用案例,以及如何利用知识组织方法和技术适应数据基础设施的建设需求和技术规范。 展开更多
关键词 知识组织 元数据 关联数据 知识图谱
下载PDF
科学事件知识图谱构建研究 被引量:9
9
作者 白如江 周彦廷 +1 位作者 王效岳 王志民 《情报理论与实践》 CSSCI 北大核心 2020年第9期107-114,124,共9页
[目的/意义]在新的信息背景下,以文献为单元的知识组织方式已经无法满足用户的需求,对科学文献的语义化与结构化的知识组织研究成为目前图情领域研究的热点之一。[方法/过程]文章通过提出科学事件的概念,在现有科研元数据以及知识元框... [目的/意义]在新的信息背景下,以文献为单元的知识组织方式已经无法满足用户的需求,对科学文献的语义化与结构化的知识组织研究成为目前图情领域研究的热点之一。[方法/过程]文章通过提出科学事件的概念,在现有科研元数据以及知识元框架的理论基础上,构建了科学事件元数据模型,将科学元事件划分为科学事件主语、科学事件谓语、科学事件宾语三个部分。利用LTP语言云根据本文所构建的科学事件元数据模型,对图情领域的科学文献进行科学事件的语义化与结构化知识组织,将所得数据存入图数据库Neo4j中并构建了以图情领域为例的科学事件知识图谱。[结果/结论]实验结果证实了文章所提方法可行有效。 展开更多
关键词 知识元 元数据 知识元描述模型 科学文献 知识图谱
下载PDF
遥感卫星特定领域大规模知识图谱构建关键技术 被引量:9
10
作者 谢榕 罗知微 +1 位作者 王雨晨 陈文 《无线电工程》 2017年第4期1-6,共6页
针对遥感卫星数据应用中的信息整合、系统集成等问题,提出建立遥感卫星特定领域大规模知识图谱的总体框架及其关键技术。在该技术框架中,构建基于国际卫星标准的标准化卫星数据集成元数据模型,并通过语义计算、语义映射与知识进化等手... 针对遥感卫星数据应用中的信息整合、系统集成等问题,提出建立遥感卫星特定领域大规模知识图谱的总体框架及其关键技术。在该技术框架中,构建基于国际卫星标准的标准化卫星数据集成元数据模型,并通过语义计算、语义映射与知识进化等手段进一步建立完备一致的遥感知识空间语义模型,在此基础上形成遥感卫星特定领域知识图谱及其应用模式。研究成果为海量卫星数据应用服务的语义集成与互操作、共享平台建设提供新思路、新方法与新技术。 展开更多
关键词 对地观测数据 元数据模型 语义模型 知识图谱 语义 FCA-概念格 机器学习 应用模式
下载PDF
基于人名抽取的新闻人物关系分析
11
作者 丁梅 肖松 +1 位作者 刘少俊 彭洋 《软件导刊》 2018年第10期174-177,182,227,共6页
新闻是碎片化、微观的信息,在一定数量的前提下可以提取出宏观、原先未知的知识,如新闻人物分布规律、热点人物界定。利用R语言和哈工大"语言云"工具从2015-2016年台湾《联合报》新闻元数据中抽取10 000个人名,使用MongoDB和D... 新闻是碎片化、微观的信息,在一定数量的前提下可以提取出宏观、原先未知的知识,如新闻人物分布规律、热点人物界定。利用R语言和哈工大"语言云"工具从2015-2016年台湾《联合报》新闻元数据中抽取10 000个人名,使用MongoDB和D3.js对查询结果进行可视化,形成知识图谱。研究发现,新闻人物的分布在普通人群中高度集中化(0.943‰)、在新闻人物之间两极化(2.3%),因此急需建立规范的人名库,以便进一步完善人名抽取逻辑。 展开更多
关键词 人名抽取 MONGODB 元数据 新闻人物 知识图谱
下载PDF
面向智能服务的数字馆藏资源组织与存储研究——以文博机构为例 被引量:3
12
作者 冯秋燕 李川 朱学芳 《图书馆论坛》 CSSCI 北大核心 2021年第9期58-67,共10页
新型智能技术为智能服务的落地提供了可能性。文博机构拥有庞大的数字馆藏资源,如何开发利用直接影响机构的智能服务质量。文章引入元数据、本体、自然语言处理(NLP)、图数据库等技术研究文博机构文物数字馆藏资源的组织与存储,将文物... 新型智能技术为智能服务的落地提供了可能性。文博机构拥有庞大的数字馆藏资源,如何开发利用直接影响机构的智能服务质量。文章引入元数据、本体、自然语言处理(NLP)、图数据库等技术研究文博机构文物数字馆藏资源的组织与存储,将文物及其关系以网状结构存储至后台,有利于泛在语义检索、可视分析等智能服务的实现。以铜器文物为实例数据,验证研究思路的可行性,为其他类型文物的组织与存储提供借鉴。 展开更多
关键词 智能服务 元数据 本体 图数据库 文物 数字馆藏资源 资源组织 资源存储
下载PDF
基于二分图的个性化图像标签推荐算法 被引量:2
13
作者 赵天龙 刘峥 +1 位作者 韩慧健 张彩明 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第6期1193-1205,共13页
传统的图像标签推荐方法通过对图像视觉内容的分析计算标签与图像的相关度,完成标签推荐任务.而社会网络图像具有丰富的元数据,例如图像所属群组、地理位置等,充分利用这些元数据对于提高标签推荐的准确性具有积极意义.提出一种基于二... 传统的图像标签推荐方法通过对图像视觉内容的分析计算标签与图像的相关度,完成标签推荐任务.而社会网络图像具有丰富的元数据,例如图像所属群组、地理位置等,充分利用这些元数据对于提高标签推荐的准确性具有积极意义.提出一种基于二分图的个性化图像标签推荐算法,通过充分挖掘图像、群组、地理位置与标签的关系,针对用户提供的少量标签进行个性化图像标签推荐.该算法建立了图像-标签、群组-标签、地理位置-标签等三个二分图模型,考虑到每个标签的重要性不同,引入TF-IDF(Term Frequency-Inverse Document Frenquency)技术对标签进行加权处理.利用二分图将初始标签分值进行信息扩散,计算出最终标签分值向量,并将该向量中分值较高的标签作为推荐结果.实验结果表明,融合了图像与群组、地理位置等元数据的个性化图像标签推荐结果的NDCG(Normalized Discounted Cumulative Gain)值优于仅单方面考虑图像、群组以及地理位置的标签推荐结果. 展开更多
关键词 图像元数据 标签偏好 二分图 个性化标签推荐 标签排序
下载PDF
基于语义相似性的跨模态图文内容筛选存储机制研究
14
作者 刘渝 郭婵 +2 位作者 冯树耀 周可 肖志立 《计算机研究与发展》 EI CSCD 北大核心 2021年第2期338-355,共18页
随着多媒体数据的爆发式增长,云端数据呈现出大规模多模态混合并存的特性.服务于数据分析的传统存储系统因为缺乏数据的语义管理而面临读取延时超长的挑战.针对图像和文本2种模态数据,在传统存储系统之上提出一种跨模态图文数据内容筛... 随着多媒体数据的爆发式增长,云端数据呈现出大规模多模态混合并存的特性.服务于数据分析的传统存储系统因为缺乏数据的语义管理而面临读取延时超长的挑战.针对图像和文本2种模态数据,在传统存储系统之上提出一种跨模态图文数据内容筛选存储机制(cross-modal image and text content sifting storage,CITCSS),用于提供大规模在线相似性内容筛选服务,从存储系统层面缓解数据分析时必须从存储中读出所有数据的读带宽压力.机制分为离线与在线2个阶段.离线阶段中,引入基于自监督的生成对抗式Hash方法,系统利用这种方法生成语义元数据.然后,将元数据注入独立的元数据空间.最后,根据相似性Hash码间汉明距离能够度量语义距离的特点,利用Neo4j图数据库构建Hash元数据图谱,并在语义图谱中建立Hash码与存储路径之间的映射.在线阶段中,用户发送与分析相关的图像或文本,存储系统首先转化数据为Hash码.然后,在筛选半径内通过Hash元数据图谱寻找相似节点,进而找到相似文件的底层存储路径返回筛选数据.实验结果表明,与传统语义存储系统相比,CITCSS在召回率超过98%的性能下,读取延迟相对降低了99.07%~99.77%. 展开更多
关键词 语义管理 Hash码元数据 元数据图谱 存储机制 读带宽
下载PDF
一种基于图形数据库的元数据关系管理方法 被引量:1
15
作者 李刚 《信息与电脑》 2020年第13期132-136,共5页
为了加快政府数据开发共享,提升治理能力,政府部门将对正在使用的系统进行整合,形成多个专题数据库对外开放利用,如果出现数据问题就需要对问题元数据进行追溯,以解决源头业务系统问题。基于此,本文提出一种基于图形数据库的元数据关系... 为了加快政府数据开发共享,提升治理能力,政府部门将对正在使用的系统进行整合,形成多个专题数据库对外开放利用,如果出现数据问题就需要对问题元数据进行追溯,以解决源头业务系统问题。基于此,本文提出一种基于图形数据库的元数据关系管理方法,用于解决无法对元数据进行实时追溯的问题。 展开更多
关键词 元数据 图形数据库 关系管理
下载PDF
非遗数字资源从元数据到语义知识图谱一体化构建
16
作者 王伟 许鑫 《新世纪图书馆》 2024年第10期58-66,共9页
文章探讨了非遗数字资源从元数据到语义知识图谱的转化,旨在提高构建效率的同时实现非遗数字资源的知识融通和有序化管理。通过两阶段映射的方法,将非遗数字资源元数据映射为本体,然后进一步将本体映射为知识图谱,完成从非遗数字资源元... 文章探讨了非遗数字资源从元数据到语义知识图谱的转化,旨在提高构建效率的同时实现非遗数字资源的知识融通和有序化管理。通过两阶段映射的方法,将非遗数字资源元数据映射为本体,然后进一步将本体映射为知识图谱,完成从非遗数字资源元数据到本体与语义知识图谱一体化构建。研究表明,在已有非遗数字资源元数据的基础上,该方法可以有效提高本体与知识图谱构建效率,实现非遗数字资源元数据、本体和知识图谱一体化构建。 展开更多
关键词 非遗数字资源 元数据 本体 知识图谱 知识融通
下载PDF
基于语义的元数据索引查询方法
17
作者 刘美桃 《图书情报工作》 CSSCI 北大核心 2009年第6期115-117,110,共4页
针对现有元数据索引方法因其固有的缺陷而难以应用于复杂的语义网络,提出一种新的基于语义的元数据索引查询方法。该方法以RDF图为数据模型,在路径索引的基础上,为元数据建立索引,并通过路径表达式实现元数据的查询。它能有效的促进领... 针对现有元数据索引方法因其固有的缺陷而难以应用于复杂的语义网络,提出一种新的基于语义的元数据索引查询方法。该方法以RDF图为数据模型,在路径索引的基础上,为元数据建立索引,并通过路径表达式实现元数据的查询。它能有效的促进领域知识的共享和语义表达,提高元数据的检索效率和查准率,为用户和应用提供语义查询和信息汇集能力。 展开更多
关键词 语义元数据 元数据索引 RDF图 元数据查询
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部