期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于双重注意力的无触发词中文事件检测 被引量:1
1
作者 程永 毛莺池 +2 位作者 万旭 王龙宝 朱敏 《计算机科学》 CSCD 北大核心 2023年第1期276-284,共9页
事件抽取是自然语言处理的重要任务,而事件检测是事件抽取的关键步骤之一,其目标是检测事件的发生并对其进行分类。目前基于触发器识别的中文事件检测方法存在一词多义、词与触发词不匹配的问题,影响了事件检测模型的精度。针对此问题,... 事件抽取是自然语言处理的重要任务,而事件检测是事件抽取的关键步骤之一,其目标是检测事件的发生并对其进行分类。目前基于触发器识别的中文事件检测方法存在一词多义、词与触发词不匹配的问题,影响了事件检测模型的精度。针对此问题,提出基于双重注意力的无触发词事件检测模型(Event Detection Without Triggers based on Dual Attention,EDWTDA),该模型可跳过触发词识别过程,实现在无触发词标记情况下直接判断事件类型。EDWTDA利用ALBERT改善词嵌入向量的语义表示能力,缓解一词多义问题,提高模型预测能力;采用局部注意力融合事件类型捕捉句中关键语义信息并模拟隐藏的事件触发词,解决词与触发词不匹配的问题;借助全局注意力挖掘文档中的语境信息,解决一词多义问题;最后将事件检测转化成二分类任务,解决多标签问题。同时,采用Focal loss损失函数解决转化成二分类后产生的样本不均衡问题。在ACE2005中文语料库上的实验结果表明,所提模型相比最佳基线模型JMCEE在精确率、召回率和F1-score评价指标上分别提高了3.40%,3.90%,3.67%。 展开更多
关键词 双重注意力 无触发词 中文事件检测 ace2005 二分类
下载PDF
基于特征组合的中文实体关系抽取 被引量:19
2
作者 黄鑫 朱巧明 +1 位作者 钱龙华 刘梅梅 《微电子学与计算机》 CSCD 北大核心 2010年第4期198-200,204,共4页
结合中文关系抽取的要求,以ACE2005的中文语料为数据进行关系抽取实验.在抽取中文词法、实体、句法,语法基本特征后,提出采用特征组合方法,使用支持向量机的机器学习(SVM)方法,在上关系探测和关系大类上F值分别提高了1.36%和3.97%,达到7... 结合中文关系抽取的要求,以ACE2005的中文语料为数据进行关系抽取实验.在抽取中文词法、实体、句法,语法基本特征后,提出采用特征组合方法,使用支持向量机的机器学习(SVM)方法,在上关系探测和关系大类上F值分别提高了1.36%和3.97%,达到72.77和61.03,并分析出各部分组合特征的贡献.实验数据表明词语和实体组合特征对中文关系抽取的作用较大. 展开更多
关键词 中文关系抽取 信息抽取 ace2005 支持向量机 特征组合
下载PDF
基于篇章信息和Bi-GRU的中文事件检测 被引量:11
3
作者 朱培培 王中卿 +1 位作者 李寿山 王红玲 《计算机科学》 CSCD 北大核心 2020年第12期233-238,共6页
事件抽取是信息抽取中一个重要的研究方向,其中事件检测是事件抽取的关键。目前,中文神经网络事件检测方法均是基于句子的方法,这种方法获得的局部上下文的信息不足以解决事件触发词的歧义性。针对这个问题,文中探索了篇章信息的作用。... 事件抽取是信息抽取中一个重要的研究方向,其中事件检测是事件抽取的关键。目前,中文神经网络事件检测方法均是基于句子的方法,这种方法获得的局部上下文的信息不足以解决事件触发词的歧义性。针对这个问题,文中探索了篇章信息的作用。首先,以双向门控循环单元网络(Bidirectional Gated Recurrent Units,Bi-GRU)模型为基线,定义3个窗口来学习句子特征;然后,将句子表示进行拼接,利用双向门控循环单元网络学习句子的上下文特征;最后,将句子表示和上下文表示进行融合,以丰富句子的语义信息,并减少候选触发词语义模糊现象,通过Softmax函数进行事件触发词的分类。在ACE2005数据集上的实验结果表明,句子的上下文特征能够有效提升中文事件检测方法的性能,该中文事件检测方法的F1值比当前最好的模型高1.5%。 展开更多
关键词 事件抽取 事件检测 篇章信息 双向门控循环单元网络 ace2005
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部