期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
一种端到端的事件共指消解方法
1
作者 刘浏 蒋国权 +3 位作者 环志刚 刘姗姗 刘茗 丁鲲 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第1期82-88,共7页
事件共指消解任务主要是判断不同事件提及是否指向同一件事件。事件共指消解不仅能有效缓解事件抽取任务中存在的信息冗余问题,而且为事件内容补全提供了有效途径。尽管许多学者利用深度学习方法对事件共指消解进行了大量研究。但是大... 事件共指消解任务主要是判断不同事件提及是否指向同一件事件。事件共指消解不仅能有效缓解事件抽取任务中存在的信息冗余问题,而且为事件内容补全提供了有效途径。尽管许多学者利用深度学习方法对事件共指消解进行了大量研究。但是大部分事件共指消解模型中仍然存在显式信息表示不足、论元噪声引入以及共指事件分布稀疏等问题。针对上述问题,提出了一种利用显式论元信息和重构事件链的端到端事件共指消解方法。首先,使用名为OneIE事件抽取模型提取事件的触发词和论元以获取事件的结构化信息;随后,使用Transformer编码器对事件提及上下文进行表示,并将置信分数引入论元信息编码以缓解其可能带来的误差传递;同时,采用门控机制对论元在触发词的水平和垂直方向上的信息进行分解,并根据论元和触发词的相关系数融合两个方向的信息,过滤论元中的噪声;然后,使用前馈网络计算事件提及对共指得分;最后,通过重构事件链验证事件提及的合法性以纠正由共指事件稀疏性带来的模型训练结果偏差。为了验证方法的有效性,本文基于数据集ACE2005进行实验。结果表明,本文模型在端到端事件共指消解任务上具有一定的先进性,其中CoNLL和AVG指标平均高出基线模型5.67%和6.24%。 展开更多
关键词 事件共指消解 自然语言处理 预训练语言模型
下载PDF
基于核心句的端到端事件共指消解
2
作者 环志刚 蒋国权 +2 位作者 张玉健 刘浏 丁鲲 《计算机科学》 CSCD 北大核心 2023年第11期185-191,共7页
大多数先前的事件共指消解模型都属于成对相似度模型,通过编码两个事件提及的表示并计算相似度来判断是否共指。但是,当两个事件提及在文档内出现的位置接近时,编码其中一个事件提及的上下文表示会引入另一事件的信息,从而降低模型的性... 大多数先前的事件共指消解模型都属于成对相似度模型,通过编码两个事件提及的表示并计算相似度来判断是否共指。但是,当两个事件提及在文档内出现的位置接近时,编码其中一个事件提及的上下文表示会引入另一事件的信息,从而降低模型的性能。针对此问题,提出了一种基于核心句的端到端事件共指消解模型(End-to-end Event Coreference Resolution Based on Core Sentence,ECR-CS),该模型自动抽取事件信息并按照预先设置好的模板为每个事件提及构造核心句,利用核心句的表示代替事件提及的表示。由于核心句中只包含单个事件的信息,因此所提模型可以在编码事件表示时消除其他事件信息的干扰。此外,受到事件信息抽取工具的性能限制,构造的核心句可能会丢失事件的部分重要信息,提出利用事件在文档中的上下文表示来进行出弥补。所提模型引入了一种门控机制,将上下文嵌入向量分解为分别与核心句嵌入向量平行和正交的两个分量,平行分量可以认为是与核心句信息维度相同的信息,正交分量则是核心句中不包含的新信息。通过上下文信息和核心句信息的相关度,控制正交分量中被用来补充核心句中缺失的重要信息的新信息的量。在ACE2005数据集上进行实验,结果表明,相比最先进的模型,ECR-CS的CoNLL和AVG分数分别提升了1.76和1.04。 展开更多
关键词 事件共指消解 门控机制 神经网络 预训练语言模型 事件核心句
下载PDF
门控机制融合多种特征的中文事件共指消解
3
作者 环志刚 蒋国权 +2 位作者 张玉健 刘浏 刘姗姗 《计算机科学》 CSCD 北大核心 2023年第3期291-297,共7页
事件共指消解是很多自然语言处理任务的基础,旨在识别文本中指代相同真实事件的事件提及。由于中文语法相比英文更复杂,捕获英文文本特征的方法在中文事件共指消解中效果并不明显。为解决文档内中文事件共指,提出了一种门控机制神经网络... 事件共指消解是很多自然语言处理任务的基础,旨在识别文本中指代相同真实事件的事件提及。由于中文语法相比英文更复杂,捕获英文文本特征的方法在中文事件共指消解中效果并不明显。为解决文档内中文事件共指,提出了一种门控机制神经网络(Gated Mechanism Neural Network, GMNN)。针对中文具有主语省略、结构松散等特点,引入事件基本属性作为符号特征。在此基础上,提出了一种新的门控去噪机制,对符号特征向量进行微调,过滤符号特征中的噪声,提取在特定上下文语境中的有用信息,进而提高共指事件的识别率。在ACE2005中文数据集上进行了实验,结果表明,GMNN的AVG分数提升了2.66,有效地提高了中文事件共指消解的效果。 展开更多
关键词 中文事件共指消解 门控机制 神经网络 预训练语言模型 符号特征
下载PDF
基于事件共指消解的多源情报融合方法
4
作者 环志刚 蒋国权 +2 位作者 周泽云 陈涛 严浩 《计算机工程与设计》 北大核心 2023年第10期3124-3131,共8页
情报数据存在多源异构、关联缺失、重复冗余等问题,有限的数据处理能力已经无法满足不断增长的数据获取能力。事件共指消解任务旨在将互为共指关系的事件识别为同一事件并进行融合处理。对融合多源情报进行研究,提出一种端到端的事件共... 情报数据存在多源异构、关联缺失、重复冗余等问题,有限的数据处理能力已经无法满足不断增长的数据获取能力。事件共指消解任务旨在将互为共指关系的事件识别为同一事件并进行融合处理。对融合多源情报进行研究,提出一种端到端的事件共指消解方法。从情报文本中自动抽取情报事件;编码整个情报文档得到待消解事件的表示,计算每对事件提及的共指得分,以此构建文档内事件共指链;通过算法利用文档内事件共指链融合多源情报文档中的共指事件。实验结果表明,提出方法对消除冗余信息、简化情报文本、融合情报信息具有明显增益。 展开更多
关键词 多源情报 信息融合 端到端 事件共指消解 文档内 跨文档 神经网络
下载PDF
集成多种背景语义知识的共指消解 被引量:7
5
作者 郎君 忻舟 +2 位作者 秦兵 刘挺 李生 《中文信息学报》 CSCD 北大核心 2009年第3期3-9,109,共8页
共指消解是信息抽取中一个重要子任务。近年来,许多学者尝试利用统计机器学习的方法来进行共指消解并取得了一定的进展。背景知识作为新的研究热点已经被越来越多地利用在自然语言处理的各个领域。该文集成多种背景语义知识作为基于二... 共指消解是信息抽取中一个重要子任务。近年来,许多学者尝试利用统计机器学习的方法来进行共指消解并取得了一定的进展。背景知识作为新的研究热点已经被越来越多地利用在自然语言处理的各个领域。该文集成多种背景语义知识作为基于二元分类的共指消解框架的特征,分别在WordNet、维基百科上提取背景知识,同时利用句子中的浅层语义关系、常见文本模式以及待消解词上下文文本特征。并利用特征选择算法自动选择最优的特征组合,同时对比同样的特征下最大熵模型与支持向量机模型的表现。在ACE数据集上实验结果表明,通过集成各种经过特征选择后的背景语义知识,共指消解的结果有进一步提高。 展开更多
关键词 计算机应用 中文信息处理 共指消解 背景语义知识 WORDNET 维基百科
下载PDF
基于中心语匹配的共指消解 被引量:5
6
作者 张牧宇 黎耀炳 +1 位作者 秦兵 刘挺 《中文信息学报》 CSCD 北大核心 2011年第3期3-8,共6页
共指消解是自然语言处理的核心任务之一。在传统机器学习方法使用的平面特征基础上,该文提出一种利用中心语信息的新方法。该方法首先引进一种基于简单平面特征的实例匹配算法用于共指消解。在此基础上,又引入了先行语与照应语的中心语... 共指消解是自然语言处理的核心任务之一。在传统机器学习方法使用的平面特征基础上,该文提出一种利用中心语信息的新方法。该方法首先引进一种基于简单平面特征的实例匹配算法用于共指消解。在此基础上,又引入了先行语与照应语的中心语字符串作为新特征,并提出一种竞争模式对将中心语约束融合进实例匹配算法,提升了消解效果。该方法与其他只使用平面特征的传统机器学习方法相比,能充分地利用每一个训练实例的特征信息,进一步融合中心语字符串特征使消解效果更加准确。 展开更多
关键词 中心语匹配 实例匹配 共指消解
下载PDF
基于决策树的汉语代词共指消解 被引量:4
7
作者 王智强 李蕾 王枞 《北京邮电大学学报》 EI CAS CSCD 北大核心 2006年第4期1-5,共5页
提出一种统计与规则相结合的决策树算法进行汉语代词共指消解,利用规则过滤掉属性冲突的反例,一定程度上弥补了决策树算法忽略属性关联性的缺点.采用Chinese Treebank作为语料进行测试,手工标注其中的共指关系和特征向量;首先用规则过滤... 提出一种统计与规则相结合的决策树算法进行汉语代词共指消解,利用规则过滤掉属性冲突的反例,一定程度上弥补了决策树算法忽略属性关联性的缺点.采用Chinese Treebank作为语料进行测试,手工标注其中的共指关系和特征向量;首先用规则过滤,然后采用C4.5决策树算法选择先行语.实验结果显示,消解成功率为82.59%,其中人称代词和指示代词的成功率分别为87.60%和75.21%. 展开更多
关键词 自然语言理解 共指消解 汉语代词 决策树 过滤规则
下载PDF
基于特征分选策略的中文共指消解方法 被引量:2
8
作者 李渝勤 甘润生 +1 位作者 杨永红 施水才 《计算机工程》 CAS CSCD 北大核心 2011年第18期180-182,共3页
针对基于机器学习的中文共指消解中不同类别名词短语特征向量的使用差异,提出一种基于特征分选策略的方法。该方法在选择特征向量时对人称代词和普通名词短语分别处理,充分利用不同名词短语的已有特征进行共指消解,并减少部分无效特征... 针对基于机器学习的中文共指消解中不同类别名词短语特征向量的使用差异,提出一种基于特征分选策略的方法。该方法在选择特征向量时对人称代词和普通名词短语分别处理,充分利用不同名词短语的已有特征进行共指消解,并减少部分无效特征在共指消解过程中产生的"噪声"。实验结果表明,该中文共指消解方法能提高共指消解的性能,F值达到80.72%。 展开更多
关键词 共指消解 特征选择 自然语言处理 支撑向量机 数据词典
下载PDF
共指消解研究方法综述 被引量:9
9
作者 宋洋 王厚峰 《中文信息学报》 CSCD 北大核心 2015年第1期1-12,共12页
共指消解作为自然语言处理中的一个重要问题一直受到学术界的重视。二十多年来,基于规则的和基于统计的不同方法被提出,在一定程度上推进了该问题研究的发展,并取得了大量研究成果。该文首先介绍了共指消解问题的基本概念,并采用形式化... 共指消解作为自然语言处理中的一个重要问题一直受到学术界的重视。二十多年来,基于规则的和基于统计的不同方法被提出,在一定程度上推进了该问题研究的发展,并取得了大量研究成果。该文首先介绍了共指消解问题的基本概念,并采用形式化的方法对该问题做了描述;然后,针对国内外近年来在共指消解研究中的方法进行了总结;之后,对共指消解中重要的特征问题进行了分析与讨论;最后,历数了共指消解的各种国际评测,并对未来可能的研究方向进行了展望。 展开更多
关键词 共指消解 消解 导学习 导学习
下载PDF
信息安全领域内实体共指消解技术研究 被引量:1
10
作者 张晗 胡永进 +1 位作者 郭渊博 陈吉成 《通信学报》 EI CSCD 北大核心 2020年第2期165-175,共11页
针对信息安全领域内的共指消解问题,提出了一个混合型方法。该方法在原来BiLSTM-attention-CRF模型的基础上引入领域词典匹配机制,将其与文档层面的注意力机制相结合,作为一种新的基于字典的注意力机制,来解决从文本中提取候选词时对稀... 针对信息安全领域内的共指消解问题,提出了一个混合型方法。该方法在原来BiLSTM-attention-CRF模型的基础上引入领域词典匹配机制,将其与文档层面的注意力机制相结合,作为一种新的基于字典的注意力机制,来解决从文本中提取候选词时对稀有实体以及长度较长的实体识别能力稍弱的问题,并通过总结领域文本特征,将提取出的待消解候选词根据词性分别采用规则与机器学习的方式进行消解,以提高准确性。通过在安全领域数据集的实验,分别从共指消解以及提取候选词并分类2个方面证明了方法的优越性。 展开更多
关键词 共指消解 混合型方法 领域词典匹配机制 BiLSTM-attention-CRF模型 信息安全
下载PDF
基于最大熵模型的共指消解研究 被引量:4
11
作者 庞宁 杨尔弘 《中文信息学报》 CSCD 北大核心 2008年第2期24-27,54,共5页
共指是突发事件新闻报道中的常见现象。良好的处理共指现象,是进行信息提取的基本必要过程。本文采用最大熵模型对汉语突发事件新闻报道中的共指现象进行消解,目的是提取出突发事件新闻报道中指向同一实体的名词、代词和名词短语。根据... 共指是突发事件新闻报道中的常见现象。良好的处理共指现象,是进行信息提取的基本必要过程。本文采用最大熵模型对汉语突发事件新闻报道中的共指现象进行消解,目的是提取出突发事件新闻报道中指向同一实体的名词、代词和名词短语。根据问题特点,算法选择了8类特征作为模型的特征,该模型在20万字的新闻语料上进行训练,在10万字规模的语料上进行测试,最终的测试得到系统的F值为64.5%。 展开更多
关键词 计算机应用 中文信息处理 最大熵模型 共指消解
下载PDF
多种语义特征在突发事件新闻中的共指消解研究 被引量:3
12
作者 庞宁 杨尔弘 《中文信息学报》 CSCD 北大核心 2014年第1期26-32,共7页
提高突发事件应对的关键在于快速地收集和提取相关新闻报道中的有用信息,共指消解是信息提取研究的重要子任务。该文采用最大熵模型对汉语突发事件新闻报道中的共指现象进行消解,综合对比了语义类特征、语义角色特征,以及基于维基百科... 提高突发事件应对的关键在于快速地收集和提取相关新闻报道中的有用信息,共指消解是信息提取研究的重要子任务。该文采用最大熵模型对汉语突发事件新闻报道中的共指现象进行消解,综合对比了语义类特征、语义角色特征,以及基于维基百科的语义相关特征,重定向特征及上下文特征在测试集上的效果。实验结果表明,除单纯使用语义角色特征会使系统F值下降1.31%以外,其余各种语义知识对共指消解模型的结果均有所提高。 展开更多
关键词 中文信息处理 突发事件 共指消解 语义特征 最大熵模型
下载PDF
自然语言文本共指消解性能评测算法研究 被引量:1
13
作者 史树敏 黄河燕 刘东升 《计算机科学》 CSCD 北大核心 2008年第9期168-171,177,共5页
在自然语言文本处理中,共指研究处于基础且关键的一环,它的有效解决将为众多的语言工程处理问题提供有力支持,因此对于共指消解性能的评测就显得尤为重要。针对共指消解任务的几种评测算法进行了深入研究,分析各种方法优缺点,指出CEAF... 在自然语言文本处理中,共指研究处于基础且关键的一环,它的有效解决将为众多的语言工程处理问题提供有力支持,因此对于共指消解性能的评测就显得尤为重要。针对共指消解任务的几种评测算法进行了深入研究,分析各种方法优缺点,指出CEAF方法是目前缺乏用于指代任务处理开放语料情况下,较适合汉语自然语言文本共指消解性能评价的一种方法。 展开更多
关键词 共指消解评测 MUC-6算法 B-CUBE算法 ACE-value评测 CEAF算法
下载PDF
基于汉语框架语义的共指消解研究 被引量:1
14
作者 吕国英 武宇娟 +3 位作者 李茹 张月平 关勇 郭少茹 《计算机工程》 CAS CSCD 北大核心 2020年第10期74-80,87,共8页
基于框架语义的推理是实现语篇理解、问答系统等任务中语义理解的一种有效手段,框架语义推理通过构建汉语篇章句子框架之间的联系寻找推理路径,但框架元素内部的表述共指阻碍了框架之间联系的建立。针对该问题,提出一种基于框架特征的... 基于框架语义的推理是实现语篇理解、问答系统等任务中语义理解的一种有效手段,框架语义推理通过构建汉语篇章句子框架之间的联系寻找推理路径,但框架元素内部的表述共指阻碍了框架之间联系的建立。针对该问题,提出一种基于框架特征的共指消解方法,该方法通过融合汉语框架语义信息并采用多种分类算法实现共指消解。框架语义篇章语料集上的实验结果表明,将汉语框架特征应用于分类器上能够较好地提升共指消解结果,且支持向量机的分类效果优于朴素贝叶斯、决策树等分类算法。 展开更多
关键词 汉语框架网 框架语义 共指消解 框架元素
下载PDF
基于ART网络的无指导中文共指消解方法
15
作者 李世奇 赵铁军 +1 位作者 陈晨 刘鹏远 《高技术通讯》 EI CAS CSCD 北大核心 2009年第9期926-932,共7页
提出了一种基于自适应谐振理论(ART)网络的无指导中文名词短语共指消解方法。该方法充分利用名词短语自身特征,通过改变网络参数动态调节聚类数量,有效地解决了目前聚类共指消解中输出类别数目难以确定的难题。另外采用了一种基于信息... 提出了一种基于自适应谐振理论(ART)网络的无指导中文名词短语共指消解方法。该方法充分利用名词短语自身特征,通过改变网络参数动态调节聚类数量,有效地解决了目前聚类共指消解中输出类别数目难以确定的难题。另外采用了一种基于信息增益率的特征选择方法,减少了区分度较弱特征给聚类所带来的干扰。该方法在保证了识别正确率的前提下,不依赖人工标注语料,可直接应用于跨领域的真实文本。最后在ACE中文语料上进行了相关实验,并取得了较好的结果。 展开更多
关键词 共指消解 导学习 自适应谐振理论(ART) 自然语言处理
下载PDF
基于分类信心重排序的中文共指消解研究
16
作者 冯元勇 孙乐 +1 位作者 董静 李文波 《中文信息学报》 CSCD 北大核心 2007年第6期22-28,共7页
共指消解是自然语言处理的核心问题之一。本文针对分步消解中分类器全局信息的不足,依据分类信心对全体提及配对进行排序,优先根据可靠的分类结果对提及进行聚集或分离。实验表明,该算法在多个学习框架下显著地改善了系统的整体性能。
关键词 计算机应用 中文信息处理 中文共指消解 提及配对分类信心 信息抽取 自然语言处理 机器学习 聚类算法
下载PDF
一种基于谱聚类的共指消解方法 被引量:5
17
作者 谢永康 周雅倩 黄萱菁 《中文信息学报》 CSCD 北大核心 2009年第3期10-16,共7页
该文针对中文共指消解的具体任务,提出采用谱聚类的方法进行共指消解。首先,在待消解项对上抽取特征,使用最大熵模型判断两个待消解项存在共指关系的概率;然后,以此概率值作为相似度进行谱聚类;最后,得到若干实体,实现共指消解。该方法... 该文针对中文共指消解的具体任务,提出采用谱聚类的方法进行共指消解。首先,在待消解项对上抽取特征,使用最大熵模型判断两个待消解项存在共指关系的概率;然后,以此概率值作为相似度进行谱聚类;最后,得到若干实体,实现共指消解。该方法能从全局的角度进行实体划分,有效地提高准确率。在ACE 2007标准数据集上的Diagnostic实验结果表明该方法的ACE Value比baseline方法有了2.5%的提高,Unweighted Precision值有5.4%的提高。 展开更多
关键词 计算机应用 中文信息处理 共指消解 谱聚类 最大熵模型
下载PDF
一种基于混合神经网络的命名实体识别与共指消解联合模型 被引量:3
18
作者 郜成胜 张君福 +2 位作者 李伟平 赵文 张世琨 《电子学报》 EI CAS CSCD 北大核心 2020年第3期442-448,共7页
命名实体识别与共指消解均依赖于对实体相邻文本信息的学习,本文提出一种基于混合神经网络的命名实体识别与共指消解联合模型,共用双向长短时记忆模型LSTM编码层对输入序列中每个词前后方向上下文信息进行编码,并通过训练学习得到上下... 命名实体识别与共指消解均依赖于对实体相邻文本信息的学习,本文提出一种基于混合神经网络的命名实体识别与共指消解联合模型,共用双向长短时记忆模型LSTM编码层对输入序列中每个词前后方向上下文信息进行编码,并通过训练学习得到上下文信息传递到前馈神经网络FFNN模型以提高共指消解精度,通过将领域文档及篇章语义向量加入FFNN,改进共指消解算法并优化共指消解模型.基于领域文本数据集进行联合模型训练,实验结果表明该联合模型可以有效地提高共指消解精度. 展开更多
关键词 神经网络 命名实体识别 共指消解 联合神经网络模型
下载PDF
基于有监督关联聚类的中文共指消解 被引量:1
19
作者 刘未鹏 周俊生 +1 位作者 黄书剑 陈家骏 《计算机科学》 CSCD 北大核心 2009年第9期182-185,共4页
共指消解是文本信息处理中的一个重要问题。提出了一种有监督的关联聚类算法以实现对中文实体提及的共指消解。首先将共指消解过程看成图的关联聚类问题,从全局的角度实现对共指等价类的划分,而不是孤立地对每一对名词短语分别进行共指... 共指消解是文本信息处理中的一个重要问题。提出了一种有监督的关联聚类算法以实现对中文实体提及的共指消解。首先将共指消解过程看成图的关联聚类问题,从全局的角度实现对共指等价类的划分,而不是孤立地对每一对名词短语分别进行共指决策;然后给出了关联聚类的推导算法;最后设计了一种基于梯度下降的特征参数学习算法,使得训练出的特征参数能够较好拟合关联聚类的目标。在ACE中文语料上的实验结果显示,该算法优于传统的"分类-聚类"共指消解学习算法。 展开更多
关键词 共指消解 关联聚类 损失函数
下载PDF
基于触发词语义选择的Twitter事件共指消解研究 被引量:2
20
作者 魏萍 巢文涵 +1 位作者 罗准辰 李舟军 《计算机科学》 CSCD 北大核心 2018年第12期130-136,147,共8页
随着社交媒体的发展与普及,如何识别短文本中事件描述的共指关系已成为一个亟待解决的问题。在传统的事件共指消解研究中,需要从NLP工具和知识库中获得丰富的语义特征,这种方式不仅限制了领域的扩展性,而且还导致了误差传播。为了打破... 随着社交媒体的发展与普及,如何识别短文本中事件描述的共指关系已成为一个亟待解决的问题。在传统的事件共指消解研究中,需要从NLP工具和知识库中获得丰富的语义特征,这种方式不仅限制了领域的扩展性,而且还导致了误差传播。为了打破上述局限,提出了一种新颖的基于事件触发词来选择性表达句子语义的方法,以判断短文本中事件的共指关系。首先,利用双向长短记忆模型(Bi-LSTM)提取短文本的句子级语义特征和事件描述级语义特征;其次,通过在句子级特征上应用一个基于事件触发词的选择门来选择性表达句子级语义,以产生潜在语义特征;然后,设计了触发词重叠词数和时间间隔两个辅助特征;最后,通过融合以上特征形成一个分类器来预测共指关系。为评估上述方法,基于Twitter数据标注了一个新的数据集EventCoreOnTweets(ECT)。实验结果表明,与两个基准模型相比,提出的选择性表达模型显著提升了短文本共指消解的性能。 展开更多
关键词 事件共指消解 短文本 双向长短记忆模型 神经网络
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部