期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
面向实体链接的多特征图模型实体消歧方法 被引量:12
1
作者 高艳红 李爱萍 段利国 《计算机应用研究》 CSCD 北大核心 2017年第10期2909-2914,共6页
实体链接技术是将文本中的实体指称表述项正确链接到知识库中实体的过程,其中命名实体消歧的准确性直接影响实体链接的准确性。针对中文实体链接中命名实体的消歧,提出一种融合多种特征的解决方案。首先,以中文维基百科为知识库支撑,从... 实体链接技术是将文本中的实体指称表述项正确链接到知识库中实体的过程,其中命名实体消歧的准确性直接影响实体链接的准确性。针对中文实体链接中命名实体的消歧,提出一种融合多种特征的解决方案。首先,以中文维基百科为知识库支撑,从实体指称表述项的上下文和候选实体在维基百科的内容描述两个方面抽取多种语义特征并计算语义相似度;然后将语义相似度融合到构建的图模型中,基于PageRank算法计算该图模型的最终平稳分布;最后对候选实体排序,选取top1实体作为消歧后的实体链接结果。实验通过与仅围绕名称表述特征进行消歧的基线系统相比,F值提升了9%,并且高于其他实体链接技术实验的F值,表明该方法在解决中文实体链接技术的命名实体消歧问题上取得了较好的整体效果。 展开更多
关键词 中文实体链接 实体消歧 语义特征 图模型
下载PDF
基于图的中文集成实体链接算法 被引量:8
2
作者 刘峤 钟云 +2 位作者 李杨 刘瑶 秦志光 《计算机研究与发展》 EI CSCD 北大核心 2016年第2期270-283,共14页
实体链接(entity linking)是知识库扩容的核心关键技术,传统的实体链接方法通常受制于本地知识库的知识水平,而且忽略共现实体间的语义相关性.提出了一种基于图的中文集成实体链接方法,不仅能够充分利用知识库中实体间的结构化关系,而... 实体链接(entity linking)是知识库扩容的核心关键技术,传统的实体链接方法通常受制于本地知识库的知识水平,而且忽略共现实体间的语义相关性.提出了一种基于图的中文集成实体链接方法,不仅能够充分利用知识库中实体间的结构化关系,而且能够通过增量证据挖掘获取外部知识,从而实现对同一文本中出现的多个歧义实体的批量实体链接.在开放域公开测试语料上的实验结果表明,所提出的实体相关图构造方法、增量证据挖掘方法和实体语义一致性判据是有效的,算法整体性能一致且显著地优于当前的主流算法. 展开更多
关键词 集成实体链接 知识库扩容 知识图谱 实体相关图 中文信息处理
下载PDF
融合多特征的中文集成实体链接方法
3
作者 冯钧 柳菁铧 孔盛球 《计算机与现代化》 2019年第1期69-74,94,共7页
实体链接技术是将文本中的实体指称项正确链接到知识库中实体对象的过程,对知识库扩容起着关键作用。针对传统的实体链接方法主要利用上下文相似度等表层特征,而且忽略共现实体间的语义相关性,提出一种融合多特征的集成实体链接方法。... 实体链接技术是将文本中的实体指称项正确链接到知识库中实体对象的过程,对知识库扩容起着关键作用。针对传统的实体链接方法主要利用上下文相似度等表层特征,而且忽略共现实体间的语义相关性,提出一种融合多特征的集成实体链接方法。首先结合同义词表、同名词表产生候选实体集,然后从多角度抽取语义特征,并将语义特征融合到构建的实体相关图中,最后对候选实体排序,选取top1实体作为链接目标。在NLP&CC2013中文微博实体链接评测数据集上进行实验,获得90.97%的准确率,与NLP&CC2013中文微博实体链接评测的最优系统相比,本文系统具有一定的优势。 展开更多
关键词 中文集成实体链接 知识图谱 实体消歧
下载PDF
一个中文实体链接语料库的建设 被引量:7
4
作者 舒佳根 惠浩添 +1 位作者 钱龙华 朱巧明 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第2期321-327,共7页
鉴于现有中文实体链接基准语料库的缺乏,在ACE2005中文语料库和中文维基百科的基础上,通过自动构造和人工标注的方法,构建一个中文实体链接语料库及其相关的中文知识库。与传统的英文实体链接语料库不同,构造的中文实体链接语料库是基... 鉴于现有中文实体链接基准语料库的缺乏,在ACE2005中文语料库和中文维基百科的基础上,通过自动构造和人工标注的方法,构建一个中文实体链接语料库及其相关的中文知识库。与传统的英文实体链接语料库不同,构造的中文实体链接语料库是基于实体而非单个实体指称(Mention)。中文实体链接语料库的构建,将为中文实体链接研究提供一个可用的基准平台。 展开更多
关键词 中文 实体链接 语料库
下载PDF
基于多源知识和Ranking SVM的中文微博命名实体链接 被引量:7
5
作者 陈万礼 昝红英 吴泳钢 《中文信息学报》 CSCD 北大核心 2015年第5期117-124,共8页
命名实体是文本中承载信息的重要单元,正确分析存在歧义的命名实体对文本的理解起着关键性作用。该文提出基于多源知识和Ranking SVM的中文微博命名实体链接,结合同义词词典、百科资源等知识产生初始候选实体集合,同时从文本中抽取多种... 命名实体是文本中承载信息的重要单元,正确分析存在歧义的命名实体对文本的理解起着关键性作用。该文提出基于多源知识和Ranking SVM的中文微博命名实体链接,结合同义词词典、百科资源等知识产生初始候选实体集合,同时从文本中抽取多种组合特征,利用Ranking SVM对候选实体集合进行排序,从而得到目标实体。在NLP&CC20141中文微博实体链接评测数据集上进行了实验,获得了89.40%的平均准确率,与NLP&CC2014中文微博实体链接评测取得最好成绩的系统相比,本文的系统具有一定的优势。 展开更多
关键词 命名实体 中文微博实体链接 同义词词典 百科资源 RANKING SVM 语义特征
下载PDF
基于局部注意力机制的中文短文本实体链接 被引量:6
6
作者 张晟旗 王元龙 +3 位作者 李茹 王笑月 王晓晖 闫智超 《计算机工程》 CAS CSCD 北大核心 2021年第11期77-83,92,共8页
实体链接是加强语义理解和连接知识信息与文本的有效方法,但目前多数模型对上下文语境的精准理解受限于文本长度,面向短文本的实体链接任务存在实体边界识别错误和实体语义理解错误的问题。针对中文短文本的实体链接任务,构建基于局部... 实体链接是加强语义理解和连接知识信息与文本的有效方法,但目前多数模型对上下文语境的精准理解受限于文本长度,面向短文本的实体链接任务存在实体边界识别错误和实体语义理解错误的问题。针对中文短文本的实体链接任务,构建基于局部注意力机制的实体链接模型。在实体消歧的过程中,通过对待消歧文本与实体的知识描述文本进行拼接,将短文本转换为长文本,同时引入局部注意力机制,缓解长距离依赖问题并强化局部的上下文信息。实验结果表明,相比于传统加入BIO标注方法的模型,该模型在CCKS2019和CCKS2020数据集上的F1值分别提升了4.41%和1.52%。 展开更多
关键词 实体链接 上下文 语义理解 中文短文本 局部注意力机制
下载PDF
基于实体—关系模型的档案类资源本体构建研究——以复旦大学图书馆藏当代中国社会生活资料为例 被引量:4
7
作者 苗青 许磊 薛崧 《图书馆杂志》 CSSCI 北大核心 2021年第2期46-54,共9页
档案类资源因多以汇集资料形式存在,且文件之间存在层级结构关系,故难以采用图书馆和博物馆对资源的描述方式。本文以复旦大学馆藏当代中国社会生活资料为例,通过对档案领域本体OAD和EAC-CPF的研究,并对BIBFRAME2.0模型适用档案类资源... 档案类资源因多以汇集资料形式存在,且文件之间存在层级结构关系,故难以采用图书馆和博物馆对资源的描述方式。本文以复旦大学馆藏当代中国社会生活资料为例,通过对档案领域本体OAD和EAC-CPF的研究,并对BIBFRAME2.0模型适用档案类资源的可行性进行分析,最终选择以BIBFRAME2.0为基础,引入OAD本体中的部分语义词构建适合档案类资源多层级结构描述的本体模型,为以关联数据方式整合馆藏资源奠定基础。 展开更多
关键词 档案 本体 实体—关系 关联数据 当代中国社会生活资料
下载PDF
中文专家实体主页识别方法研究
8
作者 李丽娜 余正涛 +2 位作者 王亚盛 毛存礼 郭剑毅 《广西师范大学学报(自然科学版)》 CAS 北大核心 2011年第1期157-161,共5页
专家实体主页识别是专家检索的一个重要的组成部分,本文提出了一种基于J48的机器学习算法来对中文专家实体主页进行分类识别。首先,人工收集中文专家实体及对应的专家主页面2 113个,针对中文专家实体特点,定义与链接和网页内容特征相关... 专家实体主页识别是专家检索的一个重要的组成部分,本文提出了一种基于J48的机器学习算法来对中文专家实体主页进行分类识别。首先,人工收集中文专家实体及对应的专家主页面2 113个,针对中文专家实体特点,定义与链接和网页内容特征相关的专家实体特征,并对这些特征进行提取,形成训练数据集。然后,采用不同学习算法对在不同特征上的页面进行主页识别,寻找最有效的分类特征和主页识别学习算法。最后,对不同特征、不同算法进行测试,实验结果表明,采用J48算法,结合链接与网页内容特征,中文专家实体主页识别取得了较好的效果,其识别准确率达到了81.05%。 展开更多
关键词 中文专家实体 主页识别 链接特征 网页特征 J48
下载PDF
基于多源知识的中文微博命名实体链接 被引量:3
9
作者 昝红英 吴泳钢 +1 位作者 贾玉祥 牛桂玲 《山东大学学报(理学版)》 CAS CSCD 北大核心 2015年第7期9-16,共8页
命名实体在文本中是承载信息的重要单元,而微博作为一种分享简短实时信息的社交网络平台,其文本长度短、不规范,而且常有新词出现,这就需要对其命名实体进行准确的理解,以提高对文本信息的正确分析。提出了基于多源知识的中文微博命名... 命名实体在文本中是承载信息的重要单元,而微博作为一种分享简短实时信息的社交网络平台,其文本长度短、不规范,而且常有新词出现,这就需要对其命名实体进行准确的理解,以提高对文本信息的正确分析。提出了基于多源知识的中文微博命名实体链接,把同义词词典、百科资源等知识与词袋模型相结合实现命名实体的链接。在NLP&CC2013中文微博实体链接评测数据集进行了实验,获得微平均准确率为92.97%,与NLP&CC2013中文实体链接评测最好的评测结果相比,提高了两个百分点。 展开更多
关键词 命名实体 中文微博实体链接 同义词词典 百科资源 词袋模型
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部