期刊文献+
共找到83篇文章
< 1 2 5 >
每页显示 20 50 100
A Hybrid Method of Coreference Resolution in Information Security 被引量:1
1
作者 Yongjin Hu Yuanbo Guo +1 位作者 Junxiu Liu Han Zhang 《Computers, Materials & Continua》 SCIE EI 2020年第8期1297-1315,共19页
In the field of information security,a gap exists in the study of coreference resolution of entities.A hybrid method is proposed to solve the problem of coreference resolution in information security.The work consists... In the field of information security,a gap exists in the study of coreference resolution of entities.A hybrid method is proposed to solve the problem of coreference resolution in information security.The work consists of two parts:the first extracts all candidates(including noun phrases,pronouns,entities,and nested phrases)from a given document and classifies them;the second is coreference resolution of the selected candidates.In the first part,a method combining rules with a deep learning model(Dictionary BiLSTM-Attention-CRF,or DBAC)is proposed to extract all candidates in the text and classify them.In the DBAC model,the domain dictionary matching mechanism is introduced,and new features of words and their contexts are obtained according to the domain dictionary.In this way,full use can be made of the entities and entity-type information contained in the domain dictionary,which can help solve the recognition problem of both rare and long entities.In the second part,candidates are divided into pronoun candidates and noun phrase candidates according to the part of speech,and the coreference resolution of pronoun candidates is solved by making rules and coreference resolution of noun phrase candidates by machine learning.Finally,a dataset is created with which to evaluate our methods using information security data.The experimental results show that the proposed model exhibits better performance than the other baseline models. 展开更多
关键词 coreference resolution hybrid method RULES BiLSTM-Attention-CRF information security
下载PDF
Augmenting Trigger Semantics to Improve Event Coreference Resolution
2
作者 宦敏 徐昇 李培峰 《Journal of Computer Science & Technology》 SCIE EI CSCD 2023年第3期600-611,共12页
Due to the small size of the annotated corpora and the sparsity of the event trigger words, the event coreference resolver cannot capture enough event semantics, especially the trigger semantics, to identify coreferen... Due to the small size of the annotated corpora and the sparsity of the event trigger words, the event coreference resolver cannot capture enough event semantics, especially the trigger semantics, to identify coreferential event mentions. To address the above issues, this paper proposes a trigger semantics augmentation mechanism to boost event coreference resolution. First, this mechanism performs a trigger-oriented masking strategy to pre-train a BERT (Bidirectional Encoder Representations from Transformers)-based encoder (Trigger-BERT), which is fine-tuned on a large-scale unlabeled dataset Gigaword. Second, it combines the event semantic relations from the Trigger-BERT encoder with the event interactions from the soft-attention mechanism to resolve event coreference. Experimental results on both the KBP2016 and KBP2017 datasets show that our proposed model outperforms several state-of-the-art baselines. 展开更多
关键词 event coreference resolution trigger semantics augmentation information interaction
原文传递
基于图神经网络的法律文本共指消解模型
3
作者 刘冬 张晓 《无线电通信技术》 北大核心 2024年第3期587-596,共10页
共指消解是确定上下文中的代词或名词短语所指的具体对象或实体,是自然语言处理(Natural Language Processing,NLP)的基本任务之一,对理解文本语义具有重要意义。现有的方法主要集中在一般领域的代词、所有格和名词短语的解析上,针对法... 共指消解是确定上下文中的代词或名词短语所指的具体对象或实体,是自然语言处理(Natural Language Processing,NLP)的基本任务之一,对理解文本语义具有重要意义。现有的方法主要集中在一般领域的代词、所有格和名词短语的解析上,针对法律领域的研究较少。为了更好地学习法律文本中的知识,并消除共同指代现象,提出一种基于图神经网络的法律文本共指消解模型(Graph Neural Network for Coreference Resolution,CR-GNN)。所提CR-GNN可以促进法律文本挖掘中的一系列后续任务。利用预训练语言模型和双向门控循环单元(Bidirectional Gate Recurrent Unit,BiGRU)对法律文本进行编码;使用基于元任务的动态图卷积网络(Meta Dynamic Graph Convolutional Network,MDGCN)整合实体之间的引用关系;使用前馈神经网络(Feed-Forward Neural Network,FFNN)和Biaffine模型为候选对进行加权评估。CR-GNN可以有效识别实体之间的引用关系,并对实体依赖关系进行建模。在法庭记录文件数据集上进行大量实验,结果表明所提CR-GNN模型达到89.76%的F1分数,均高于现有基准模型。 展开更多
关键词 自然语言处理 共指消解 法律文本 预训练语言模型 图神经网络
下载PDF
基于指代消解的民间文学文本实体关系抽取
4
作者 魏静 岳昆 +1 位作者 段亮 王笳辉 《河南师范大学学报(自然科学版)》 CAS 北大核心 2024年第1期84-92,共9页
民间文学是中华文化的重要组成部分,具有重要的研究价值。随着人工智能的快速发展,数字化技术成为修复民间文学残缺作品、构建民间文学领域知识图谱等实际应用的重要方式.然而,民间文学文本中指示代词多、实体关系重叠,使得民间文学文... 民间文学是中华文化的重要组成部分,具有重要的研究价值。随着人工智能的快速发展,数字化技术成为修复民间文学残缺作品、构建民间文学领域知识图谱等实际应用的重要方式.然而,民间文学文本中指示代词多、实体关系重叠,使得民间文学文本关系抽取困难.为此,提出一种基于指代消解的实体关系联合抽取方法CR_RSAN,使用指代消解获取指示代词和对应实体的位置信息,并利用该信息设计指示代词替换算法和调整文本序列标注方法,以此强化模型获取文本语义特征的能力.此外,使用同时编码实体和关系信息的序列标注方法以缓解文本实体关系重叠问题.对比实验选用目前主流方法的模型作为基线,并相继在民间文学文本上进行实验,CR_RSAN在精确率、召回率和F1值等方面分别提高了13.39个百分点、14.29个百分点和14.98个百分点. 展开更多
关键词 民间文学 关系抽取 指代消解 注意力 序列标注
下载PDF
基于生成对抗网络的越南语新闻事件共指关系识别方法
5
作者 汪翠 余正涛 梁晨 《中文信息学报》 CSCD 北大核心 2024年第2期79-86,共8页
事件共指关系识别旨在分析事件描述之间是否从不同的角度对同一件真实事件展开论述。但是,在同一篇新闻报道中往往存在不同事件句之间具有相似上下文但不具有共指关系的噪声情况,其会对共指关系识别模型造成干扰。为解决以上问题,该文... 事件共指关系识别旨在分析事件描述之间是否从不同的角度对同一件真实事件展开论述。但是,在同一篇新闻报道中往往存在不同事件句之间具有相似上下文但不具有共指关系的噪声情况,其会对共指关系识别模型造成干扰。为解决以上问题,该文提出了基于生成对抗网络的越南语新闻事件共指关系识别方法,采用触发词的上下文信息作为事件句的最小特征表示,在生成对抗网络的基础上构建噪声数据过滤机制进行信息实例与噪声实例的区分。在越南语事件数据集和公开数据集上的实验表明,该神经网络模型能有效进行噪声数据过滤,相对于传统的事件共指关系识别方法有明显的优势。 展开更多
关键词 越南语新闻 事件共指关系识别 生成对抗网络
下载PDF
工业互联网安全知识图谱构建研究综述 被引量:1
6
作者 常钰 王钢 +2 位作者 朱鹏 孔令飞 何京恒 《计算机科学与探索》 CSCD 北大核心 2024年第2期279-300,共22页
工业互联网安全知识图谱能够在丰富安全概念语义关系、提高安全知识库质量和增强安全态势可视化分析能力等方面发挥重要作用,已经成为认知、溯源和防护针对新能源工业控制系统攻击的关键。但是,与通用领域知识图谱构建相比,工业互联网... 工业互联网安全知识图谱能够在丰富安全概念语义关系、提高安全知识库质量和增强安全态势可视化分析能力等方面发挥重要作用,已经成为认知、溯源和防护针对新能源工业控制系统攻击的关键。但是,与通用领域知识图谱构建相比,工业互联网安全知识图谱构建的各个环节仍然存在许多问题,影响了其实际应用效果。介绍了工业互联网安全知识图谱的概念、意义和其与通用知识图谱的区别;概括了工业互联网安全知识图谱本体构建的相关工作及其作用;重点研究了在工业互联网安全背景下,构建知识图谱的三个关键环节,即命名实体识别、关系抽取和共指消解的相关工作。对于每个环节,详细报告了该环节在领域背景下的发展历史和研究现状,深入分析了该环节面临的领域特有挑战,如非连续实体识别问题、候选词提取问题和缺乏领域高质量数据集等,并针对特有挑战展望了该环节未来的研究方向,为进一步提升工业互联网安全知识图谱的质量和实用性,从而更有效地应对新兴威胁和攻击提供借鉴和启示。 展开更多
关键词 工业互联网安全 知识图谱 命名实体识别 关系抽取 共指消解
下载PDF
一种端到端的事件共指消解方法
7
作者 刘浏 蒋国权 +3 位作者 环志刚 刘姗姗 刘茗 丁鲲 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第1期82-88,共7页
事件共指消解任务主要是判断不同事件提及是否指向同一件事件。事件共指消解不仅能有效缓解事件抽取任务中存在的信息冗余问题,而且为事件内容补全提供了有效途径。尽管许多学者利用深度学习方法对事件共指消解进行了大量研究。但是大... 事件共指消解任务主要是判断不同事件提及是否指向同一件事件。事件共指消解不仅能有效缓解事件抽取任务中存在的信息冗余问题,而且为事件内容补全提供了有效途径。尽管许多学者利用深度学习方法对事件共指消解进行了大量研究。但是大部分事件共指消解模型中仍然存在显式信息表示不足、论元噪声引入以及共指事件分布稀疏等问题。针对上述问题,提出了一种利用显式论元信息和重构事件链的端到端事件共指消解方法。首先,使用名为OneIE事件抽取模型提取事件的触发词和论元以获取事件的结构化信息;随后,使用Transformer编码器对事件提及上下文进行表示,并将置信分数引入论元信息编码以缓解其可能带来的误差传递;同时,采用门控机制对论元在触发词的水平和垂直方向上的信息进行分解,并根据论元和触发词的相关系数融合两个方向的信息,过滤论元中的噪声;然后,使用前馈网络计算事件提及对共指得分;最后,通过重构事件链验证事件提及的合法性以纠正由共指事件稀疏性带来的模型训练结果偏差。为了验证方法的有效性,本文基于数据集ACE2005进行实验。结果表明,本文模型在端到端事件共指消解任务上具有一定的先进性,其中CoNLL和AVG指标平均高出基线模型5.67%和6.24%。 展开更多
关键词 事件共指消解 自然语言处理 预训练语言模型
下载PDF
Learning Noun Phrase Anaphoricity in Coreference Resolution via Label Propagation 被引量:1
8
作者 周国栋 孔芳 《Journal of Computer Science & Technology》 SCIE EI CSCD 2011年第1期34-44,共11页
Knowledge of noun phrase anaphoricity might be profitably exploited in coreference resolution to bypass the resolution of non-anaphoric noun phrases. However, it is surprising to notice that recent attempts to incorpo... Knowledge of noun phrase anaphoricity might be profitably exploited in coreference resolution to bypass the resolution of non-anaphoric noun phrases. However, it is surprising to notice that recent attempts to incorporate automatically acquired anaphoricity information into coreferenee resolution systems have been far from expectation. This paper proposes a global learning method in determining the anaphoricity of noun phrases via a label propagation algorithm to improve learning-based coreference resolution. In order to eliminate the huge computational burden in the label propagation algorithm, we employ the weighted support vectors as the critical instances in the training texts. In addition, two kinds of kernels, i.e instances to represent all the anaphoricity-labeled NP , the feature-based RBF (Radial Basis Function) kernel and the convolution tree kernel with approximate matching, are explored to compute the anaphoricity similarity between two noun phrases. Experiments on the ACE2003 corpus demonstrate the great effectiveness of our method in anaphoricity determination of noun phrases and its application in learning-based coreference resolution. 展开更多
关键词 coreference resolution anaphoricity determination label propagation RBF kernel convolution tree kernel
原文传递
基于Siamese-BERT-wwm模型的航空安全事故因果事件的同指消解
9
作者 王红 王阳 吴浩正 《计算机应用与软件》 北大核心 2023年第7期55-60,共6页
针对航空安全事故因果事件的抽取结果复杂难以快速确定事故发展过程的问题,提出一种将孪生神经网络(Siamese Network)与BERT-wwm模型相结合的因果事件同指消解方法。该方法在孪生神经网络中将事件句分别输入到相同权重的两个BERT-wwm模... 针对航空安全事故因果事件的抽取结果复杂难以快速确定事故发展过程的问题,提出一种将孪生神经网络(Siamese Network)与BERT-wwm模型相结合的因果事件同指消解方法。该方法在孪生神经网络中将事件句分别输入到相同权重的两个BERT-wwm模型,经平均池化得到句子级语义向量,再通过Softmax分类器进行同指判断并消解,在同指消解的基础上采用逆遍历去冗余,实现了航空安全事故因果链的构建。实验结果表明,该方法有效提高了航空安全事故因果关系的可解释性,为多事故的关联分析奠定了基础。 展开更多
关键词 航空安全事故 因果事件 同指消解 孪生神经网络 BERT-wwm
下载PDF
基于上下文共指实体依赖的文档级关系抽取
10
作者 夏正新 苏翀 刘勇 《数据采集与处理》 CSCD 北大核心 2023年第5期1226-1234,共9页
文档级关系提取(Document relationship extraction,DRE)旨在多条句子中识别实体间的关系,而实体可能对应于跨越句子边界的多次提及,其中代词实体提及是因句子之间连接而普遍存在的语法现象,也是影响句子推理的一个重要因素。然而,以往... 文档级关系提取(Document relationship extraction,DRE)旨在多条句子中识别实体间的关系,而实体可能对应于跨越句子边界的多次提及,其中代词实体提及是因句子之间连接而普遍存在的语法现象,也是影响句子推理的一个重要因素。然而,以往的研究大多侧重于普通实体提及之间的关系,却很少关注代词实体提及的共指和关系捕获。本文提出了基于上下文共指实体依赖(Contextual coreference entity dependency,CCED)的文档级关系抽取模型,即通过融合普通实体和代词实体表示来构建共指实体依赖关系的上下文图结构,并在图上进行实体对间的全局交互推理,从而对实体关系的相互依赖进行建模。分别在公共数据集DocRED、DialogRE和MPDD上对CCED模型进行评估,结果显示在DocRED数据集上,与表现最好的基线模型DocuNet-BERT相比,CCED模型在测试集上的Ign F_(1)性能提高0.55%,F_(1)性能提高0.35%。在DialogRE和MPDD数据集上,与表现最好的基线模型COLN相比,CCED模型在DialogRE测试集上的F_(1)性能提高1.02%,在MPDD测试集上的ACC性能提高1.19%。实验结果验证了新模型对于文档级关系抽取的有效性。 展开更多
关键词 关系提取 实体提及 共指消解 图推理 上下文图结构
下载PDF
门控机制融合多种特征的中文事件共指消解 被引量:1
11
作者 环志刚 蒋国权 +2 位作者 张玉健 刘浏 刘姗姗 《计算机科学》 CSCD 北大核心 2023年第3期291-297,共7页
事件共指消解是很多自然语言处理任务的基础,旨在识别文本中指代相同真实事件的事件提及。由于中文语法相比英文更复杂,捕获英文文本特征的方法在中文事件共指消解中效果并不明显。为解决文档内中文事件共指,提出了一种门控机制神经网络... 事件共指消解是很多自然语言处理任务的基础,旨在识别文本中指代相同真实事件的事件提及。由于中文语法相比英文更复杂,捕获英文文本特征的方法在中文事件共指消解中效果并不明显。为解决文档内中文事件共指,提出了一种门控机制神经网络(Gated Mechanism Neural Network, GMNN)。针对中文具有主语省略、结构松散等特点,引入事件基本属性作为符号特征。在此基础上,提出了一种新的门控去噪机制,对符号特征向量进行微调,过滤符号特征中的噪声,提取在特定上下文语境中的有用信息,进而提高共指事件的识别率。在ACE2005中文数据集上进行了实验,结果表明,GMNN的AVG分数提升了2.66,有效地提高了中文事件共指消解的效果。 展开更多
关键词 中文事件共指消解 门控机制 神经网络 预训练语言模型 符号特征
下载PDF
基于核心句的端到端事件共指消解
12
作者 环志刚 蒋国权 +2 位作者 张玉健 刘浏 丁鲲 《计算机科学》 CSCD 北大核心 2023年第11期185-191,共7页
大多数先前的事件共指消解模型都属于成对相似度模型,通过编码两个事件提及的表示并计算相似度来判断是否共指。但是,当两个事件提及在文档内出现的位置接近时,编码其中一个事件提及的上下文表示会引入另一事件的信息,从而降低模型的性... 大多数先前的事件共指消解模型都属于成对相似度模型,通过编码两个事件提及的表示并计算相似度来判断是否共指。但是,当两个事件提及在文档内出现的位置接近时,编码其中一个事件提及的上下文表示会引入另一事件的信息,从而降低模型的性能。针对此问题,提出了一种基于核心句的端到端事件共指消解模型(End-to-end Event Coreference Resolution Based on Core Sentence,ECR-CS),该模型自动抽取事件信息并按照预先设置好的模板为每个事件提及构造核心句,利用核心句的表示代替事件提及的表示。由于核心句中只包含单个事件的信息,因此所提模型可以在编码事件表示时消除其他事件信息的干扰。此外,受到事件信息抽取工具的性能限制,构造的核心句可能会丢失事件的部分重要信息,提出利用事件在文档中的上下文表示来进行出弥补。所提模型引入了一种门控机制,将上下文嵌入向量分解为分别与核心句嵌入向量平行和正交的两个分量,平行分量可以认为是与核心句信息维度相同的信息,正交分量则是核心句中不包含的新信息。通过上下文信息和核心句信息的相关度,控制正交分量中被用来补充核心句中缺失的重要信息的新信息的量。在ACE2005数据集上进行实验,结果表明,相比最先进的模型,ECR-CS的CoNLL和AVG分数分别提升了1.76和1.04。 展开更多
关键词 事件共指消解 门控机制 神经网络 预训练语言模型 事件核心句
下载PDF
基于事件共指消解的多源情报融合方法
13
作者 环志刚 蒋国权 +2 位作者 周泽云 陈涛 严浩 《计算机工程与设计》 北大核心 2023年第10期3124-3131,共8页
情报数据存在多源异构、关联缺失、重复冗余等问题,有限的数据处理能力已经无法满足不断增长的数据获取能力。事件共指消解任务旨在将互为共指关系的事件识别为同一事件并进行融合处理。对融合多源情报进行研究,提出一种端到端的事件共... 情报数据存在多源异构、关联缺失、重复冗余等问题,有限的数据处理能力已经无法满足不断增长的数据获取能力。事件共指消解任务旨在将互为共指关系的事件识别为同一事件并进行融合处理。对融合多源情报进行研究,提出一种端到端的事件共指消解方法。从情报文本中自动抽取情报事件;编码整个情报文档得到待消解事件的表示,计算每对事件提及的共指得分,以此构建文档内事件共指链;通过算法利用文档内事件共指链融合多源情报文档中的共指事件。实验结果表明,提出方法对消除冗余信息、简化情报文本、融合情报信息具有明显增益。 展开更多
关键词 多源情报 信息融合 端到端 事件共指消解 文档内 跨文档 神经网络
下载PDF
指代消解综述 被引量:12
14
作者 孔芳 周国栋 +1 位作者 朱巧明 钱培德 《计算机工程》 CAS CSCD 北大核心 2010年第8期33-36,共4页
给出指代消解的基本概念,从指代消解的语料资源、评测系统和算法3个方面出发,介绍指代消解的国内外研究现状,分析制约指代消解的3个关键问题:结构化句法信息的自动获取和表示,深层次语义信息的自动获取和使用,跨文本指代消解,基于分析... 给出指代消解的基本概念,从指代消解的语料资源、评测系统和算法3个方面出发,介绍指代消解的国内外研究现状,分析制约指代消解的3个关键问题:结构化句法信息的自动获取和表示,深层次语义信息的自动获取和使用,跨文本指代消解,基于分析结果给出国际上指代消解的研究趋势。 展开更多
关键词 自然语言处理 指代消解 信息抽取
下载PDF
一种基于图划分的无监督汉语指代消解算法 被引量:19
15
作者 周俊生 黄书剑 +1 位作者 陈家骏 曲维光 《中文信息学报》 CSCD 北大核心 2007年第2期77-82,共6页
指代消解是自然语言处理领域中的一个重要问题。针对当前中文指代标注训练语料非常缺乏的现状,本文提出一种无监督聚类算法实现对名词短语的指代消解。引入图对名词短语的指代消解问题进行建模,将指代消解问题转化为图划分问题,并引入... 指代消解是自然语言处理领域中的一个重要问题。针对当前中文指代标注训练语料非常缺乏的现状,本文提出一种无监督聚类算法实现对名词短语的指代消解。引入图对名词短语的指代消解问题进行建模,将指代消解问题转化为图划分问题,并引入一个有效的模块函数实现对图的自动划分,使得指代消解过程并不是孤立地对每一对名词短语分别进行共指决策,而是充分考虑了多个待消解项之间的相关性,并且避免了阈值选择问题。通过在ACE中文语料上的人称代词消解和名词短语消解实验结果表明,该算法是一种有效可行的无监督指代消解算法。 展开更多
关键词 人工智能 自然语言处理 聚类 指代消解 模块函数
下载PDF
语义Web中对象共指的消解研究 被引量:7
16
作者 胡伟 柏文阳 瞿裕忠 《软件学报》 EI CSCD 北大核心 2012年第7期1729-1744,共16页
随着语义Web的快速发展,语义Web数据大幅增长.在语义Web中,单个对象很可能由多个不同的标识符(例如URI)指称.语义Web中,对象共指的消解是识别语义Web中指称相同对象的不同标识符,并消除描述这些标识符的RDF(resource description framew... 随着语义Web的快速发展,语义Web数据大幅增长.在语义Web中,单个对象很可能由多个不同的标识符(例如URI)指称.语义Web中,对象共指的消解是识别语义Web中指称相同对象的不同标识符,并消除描述这些标识符的RDF(resource description framework)数据之间不一致性的过程,它对于语义Web数据的融合、搜索、浏览等具有重要作用.首先,形式化定义了语义Web中对象共指的消解问题;然后,从对象共指识别使用的特征、数据冲突的消解方式、对象共指消解方法的适用范围、现有原型系统和基准测试集这5个方面调研了最新的研究进展;最后,讨论了尚存的挑战,并展望未来可能的研究发展方向. 展开更多
关键词 对象共指 共指消解 实例匹配 语义WEB 数据融合
下载PDF
基于最大熵模型的英文名词短语指代消解 被引量:19
17
作者 钱伟 郭以昆 +1 位作者 周雅倩 吴立德 《计算机研究与发展》 EI CSCD 北大核心 2003年第9期1337-1343,共7页
提出了一种新颖的基于语料库的英文名词短语指代消解算法 该算法不仅能解决传统的代词和名词 /名词短语间的指代问题 ,还能解决名词短语间的指代问题 同时 ,利用最大熵模型 ,可以有效地综合各种互不相关的特征 算法在MUC 7公开测试语料... 提出了一种新颖的基于语料库的英文名词短语指代消解算法 该算法不仅能解决传统的代词和名词 /名词短语间的指代问题 ,还能解决名词短语间的指代问题 同时 ,利用最大熵模型 ,可以有效地综合各种互不相关的特征 算法在MUC 7公开测试语料上F值达到了 6 0 2 % ,极为接近文献记载的该语料库上F值的最优结果 6 1 8% 展开更多
关键词 最大熵 名词短语指代消解 自然语言处理
下载PDF
基于深度学习的维吾尔语名词短语指代消解 被引量:7
18
作者 李敏 禹龙 +2 位作者 田生伟 吐尔根.依布拉音 赵建国 《自动化学报》 EI CSCD 北大核心 2017年第11期1984-1992,共9页
针对维吾尔语名词短语指代现象,提出了一种利用栈式自编码深度学习算法进行基于语义特征的指代消解方法.通过对维吾尔语名词短语指称性的研究,提取出利于消解任务的13项特征.为提高特征对文本语义的表达,在特征集中引入富含词汇语义及... 针对维吾尔语名词短语指代现象,提出了一种利用栈式自编码深度学习算法进行基于语义特征的指代消解方法.通过对维吾尔语名词短语指称性的研究,提取出利于消解任务的13项特征.为提高特征对文本语义的表达,在特征集中引入富含词汇语义及上下文位置关系的Word embedding.利用深度学习机制无监督的提取隐含的深层语义特征,训练Softmax分类器进而完成指代消解任务.该方法在维吾尔语指代消解任务中的准确率为74.5%,召回率为70.6%,F值为72.4%.实验结果证明,深度学习模型较浅层的支持向量机更合适于本文的指代消解任务,对Word embedding特征项的引入,有效地提高了指代消解模型的性能. 展开更多
关键词 深度学习 栈式自编码神经网络 指代消解 WORD EMBEDDING 维吾尔语
下载PDF
基于中心理论的指代消解研究 被引量:6
19
作者 孔芳 朱巧明 +1 位作者 周国栋 钱培德 《计算机科学》 CSCD 北大核心 2009年第6期219-222,共4页
系统分析了在中心理论指导下语义角色在指代消解中的应用。首先使用性能良好的语义角色标注工具AS-SERT自动进行语义角色的识别,然后将识别出的语义角色信息与代词类别特征相组合进行指代消解。以中心理论为基础来表示、使用语义角色信... 系统分析了在中心理论指导下语义角色在指代消解中的应用。首先使用性能良好的语义角色标注工具AS-SERT自动进行语义角色的识别,然后将识别出的语义角色信息与代词类别特征相组合进行指代消解。以中心理论为基础来表示、使用语义角色信息。从ACE 2003语料库上的实验结果可以看到,引入语义角色后,与基准系统相比,系统的F值提高了2.2%。特别是代词的指代消解,从实验结果可以看到,性能得到了大大提升。 展开更多
关键词 指代消解 语义角色 中心理论
下载PDF
集成多种背景语义知识的共指消解 被引量:7
20
作者 郎君 忻舟 +2 位作者 秦兵 刘挺 李生 《中文信息学报》 CSCD 北大核心 2009年第3期3-9,109,共8页
共指消解是信息抽取中一个重要子任务。近年来,许多学者尝试利用统计机器学习的方法来进行共指消解并取得了一定的进展。背景知识作为新的研究热点已经被越来越多地利用在自然语言处理的各个领域。该文集成多种背景语义知识作为基于二... 共指消解是信息抽取中一个重要子任务。近年来,许多学者尝试利用统计机器学习的方法来进行共指消解并取得了一定的进展。背景知识作为新的研究热点已经被越来越多地利用在自然语言处理的各个领域。该文集成多种背景语义知识作为基于二元分类的共指消解框架的特征,分别在WordNet、维基百科上提取背景知识,同时利用句子中的浅层语义关系、常见文本模式以及待消解词上下文文本特征。并利用特征选择算法自动选择最优的特征组合,同时对比同样的特征下最大熵模型与支持向量机模型的表现。在ACE数据集上实验结果表明,通过集成各种经过特征选择后的背景语义知识,共指消解的结果有进一步提高。 展开更多
关键词 计算机应用 中文信息处理 共指消解 背景语义知识 WORDNET 维基百科
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部