期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
知识图谱中实体相似度计算研究 被引量:15
1
作者 李阳 高大启 《中文信息学报》 CSCD 北大核心 2017年第1期140-146,154,共8页
实体相似度的计算有诸多应用,例如,电商平台的相似商品推荐,医疗疗效分析中的相似病人组等。在知识图谱的实体相似度计算中,给出了每个实体的属性值,并对部分实体进行相似度的标注,要求能得到其他实体之间的相似度。该文把该问题归结为... 实体相似度的计算有诸多应用,例如,电商平台的相似商品推荐,医疗疗效分析中的相似病人组等。在知识图谱的实体相似度计算中,给出了每个实体的属性值,并对部分实体进行相似度的标注,要求能得到其他实体之间的相似度。该文把该问题归结为监督学习问题,提出一种通用的实体相似度计算方法,通过清洗噪声数据,对数值、列表以及文本等不同数据类型进行预处理,使用SVM,Logistic回归等分类模型、Random Forest等集成学习模型以及排序学习模型进行建模,得到了较好的结果。 展开更多
关键词 实体相似度 监督学习 分类模型 集成学习
下载PDF
一种基于实体描述和知识向量相似度的跨语言实体对齐模型 被引量:2
2
作者 康世泽 吉立新 +1 位作者 刘树新 丁悦航 《电子学报》 EI CAS CSCD 北大核心 2019年第9期1841-1847,共7页
跨语言实体对齐旨在找到不同语言知识图谱中指向现实世界同一事物的实体.传统的跨语言实体对齐方法通常仅依靠知识图谱内部的结构信息,但实际上一些知识图谱提供的实体描述信息也可以被利用.本文提出了一种结合知识图谱的内部结构和实... 跨语言实体对齐旨在找到不同语言知识图谱中指向现实世界同一事物的实体.传统的跨语言实体对齐方法通常仅依靠知识图谱内部的结构信息,但实际上一些知识图谱提供的实体描述信息也可以被利用.本文提出了一种结合知识图谱的内部结构和实体描述信息共同进行跨语言实体对齐的模型.该模型首先通过训练基于知识图谱结构信息的知识向量找到可能被对齐的实体对,再结合实体描述信息利用改进后的共享参数模型选出最终的对齐实体,最后通过迭代对齐的方法重复前两个步骤找到更多的对齐实体直到训练结束.实验结果表明,与基准算法相比,本文所提模型在跨语言实体对齐任务上可以取得相对不错的结果. 展开更多
关键词 跨语言实体对齐 知识向量 跨语言实体描述相似
下载PDF
基于本体的概念相似度计算方法研究 被引量:12
3
作者 李荣 杨冬 刘磊 《计算机研究与发展》 EI CSCD 北大核心 2011年第S3期312-317,共6页
相似度计算是本体映射过程中的一个重要步骤,首先给出相关术语的定义,并针对本体映射中计算概念相似度时计算量过大问题,提出了一种综合的概念相似度计算方法,即根据概念名称的相似度筛选出最相关的概念,产生概念的候选概念集,然后只对... 相似度计算是本体映射过程中的一个重要步骤,首先给出相关术语的定义,并针对本体映射中计算概念相似度时计算量过大问题,提出了一种综合的概念相似度计算方法,即根据概念名称的相似度筛选出最相关的概念,产生概念的候选概念集,然后只对概念与候选概念集中的概念分别计算基于属性、基于结构的概念相似度,进行相似度的合并,其中基于属性的概念相似度计算包括数据类型属性和对象类型属性的相似度计算,基于结构的概念相似度计算包括父概念、子概念和兄弟概念的相似度计算,最后通过实例验证了改进方法具有较高的精度,并指出未来可能的研究方向. 展开更多
关键词 语义网 本体 本体映射 本体实体相似度 概念相似
下载PDF
顾及环境相似的多特征组合实体匹配方法 被引量:7
4
作者 吴建华 《地理与地理信息科学》 CSSCI CSCD 北大核心 2010年第4期1-6,共6页
实体匹配是指通过相似性指标识别出不同来源地图数据中同名实体并建立实体对应关系的过程,它是地图数据融合与更新中的关键技术和难点之一,匹配效果的好坏直接关系到后续应用的正确性。现有的实体匹配方法大多只利用实体自身的几何或属... 实体匹配是指通过相似性指标识别出不同来源地图数据中同名实体并建立实体对应关系的过程,它是地图数据融合与更新中的关键技术和难点之一,匹配效果的好坏直接关系到后续应用的正确性。现有的实体匹配方法大多只利用实体自身的几何或属性特征进行匹配,很少顾及实体周边环境的相似性,使得一些匹配实例不足以得到正确的匹配结果。针对该点不足,首次引入点、线实体环境相似度,并提出顾及环境相似的多特征组合匹配方法,有效地提高了实体匹配精度;通过双向匹配与聚类合并策略,解决了部分线实体一对多、多对多的匹配问题。 展开更多
关键词 实体相似度 匹配策略 数据融合 GIS
下载PDF
基于类别模板挖掘的百科相关实体构建
5
作者 覃华峥 胡忠顺 +1 位作者 阳德青 肖仰华 《计算机工程》 CAS CSCD 北大核心 2016年第9期180-185,191,共7页
针对现有百科数据知识零散,而人工构建相关实体代价过高,难以大规模构造的问题,提出一种基于相关实体类别模板的实体归类与相关度排序算法,用于对零散的百科实体进行自动的归类整理。利用类别相似的实体对应的页面中所引用的实体,挖掘... 针对现有百科数据知识零散,而人工构建相关实体代价过高,难以大规模构造的问题,提出一种基于相关实体类别模板的实体归类与相关度排序算法,用于对零散的百科实体进行自动的归类整理。利用类别相似的实体对应的页面中所引用的实体,挖掘出与查询实体相关的实体类别模板,并把相关实体直接通过其类别映射进模板中,再对模板中的实体进行相关度排序。实验结果表明,与基于聚类的算法相比,该算法能够取得更准确的实体归类整理效果,与先进行相关度排序再归类的方法相比有更低的时间复杂度,可降低人工构建百科相关实体的代价。 展开更多
关键词 信息检索 模板挖掘 实体相似度 noisy—or模型 实体相关
下载PDF
敦煌壁画叙词表关联数据实体语义相似度计算方法与实验 被引量:6
6
作者 高劲松 付家炜 李珂 《图书情报工作》 CSSCI 北大核心 2021年第8期97-106,共10页
[目的/意义]随着文化遗产数字化和人文计算研究范式的兴起,人文领域学者在参与数字人文研究过程中对于文化遗产数据资源的利用需求日益突显.多源、异构文化遗产信息资源的语义融合与互操作成为当前数字人文数据基础设施建设中的关键问题... [目的/意义]随着文化遗产数字化和人文计算研究范式的兴起,人文领域学者在参与数字人文研究过程中对于文化遗产数据资源的利用需求日益突显.多源、异构文化遗产信息资源的语义融合与互操作成为当前数字人文数据基础设施建设中的关键问题,而行之有效的实体语义相似度计算方法则成为实现这一目标的重要手段.[方法/过程]以敦煌壁画叙词表关联数据为例,在分析该数据集本体模型与数据框架的基础上,针对其内容分布与结构特征提出一种多粒度匹配与加权运算相结合的实体语义相似度计算方法,并选取敦煌壁画叙词表关联数据中“飞天”相关实体为实验对象,引入属性特征、编辑距离等多种现有实体语义相似度计算方法进行对比实验.[结果/结论]实验结果表明,本文提出的基于多粒度匹配的实体语义相似度计算方法,能够更好地适应敦煌壁画叙词表关联数据的内容与结构特征,在计算结果准确性方面比同类方法具有更好的表现,是推动数字人文背景下异构人文信息资源的数据互联与知识共享的又一可行思路. 展开更多
关键词 敦煌壁画 关联数据 多粒 语义相似 实体相似度
原文传递
顾及地理实体的地名信息检索方法研究 被引量:6
7
作者 周静 张书亮 张小波 《地球信息科学学报》 CSCD 北大核心 2015年第11期1362-1369,共8页
随着在线电子地图应用的普及,地名信息检索已成为相关研究领域的热点,并取得了丰富的研究成果。然而,这些研究主要侧重于检索效率和文本关键词匹配质量的提高,并未顾及实际应用需求和地名信息检索方法的矛盾。本文通过分析地理实体和地... 随着在线电子地图应用的普及,地名信息检索已成为相关研究领域的热点,并取得了丰富的研究成果。然而,这些研究主要侧重于检索效率和文本关键词匹配质量的提高,并未顾及实际应用需求和地名信息检索方法的矛盾。本文通过分析地理实体和地名的特征及关系,提出将二者相融合来研究地名信息检索的形式和方法,从数据特征和应用场景的角度出发,提出顾及地理实体的地名信息检索模式,并实现对其的结构化表达,在该检索模式中将地理实体的属性特征和空间关系作为检索特征项;以检索模式为基础提出了基于地理实体相似度计算的地名信息检索模型,并深入研究了文本型属性与数值型属性综合的属性相似度计算方法,以及定性空间过滤与定量距离计算综合的空间关系相似度计算方法;最后,通过实验验证了顾及地理实体的地名信息检索方法的可行性和检索质量。实验结果表明,该检索方法既能实现精细化和空间化的检索需求,也能保证检索结果的准确度。 展开更多
关键词 地理实体 地名信息检索 地理实体相似度 属性特征 空间关系
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部