期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于神经网络的中文谓语动词识别研究 被引量:7
1
作者 李婷 秦永彬 +2 位作者 黄瑞章 程欣宇 陈艳平 《数据采集与处理》 CSCD 北大核心 2020年第3期582-590,共9页
识别谓语动词是理解句子的关键。由于中文谓语动词结构复杂、使用灵活、形式多变,识别谓语动词在中文自然语言处理中是一项具有挑战的任务。本文从信息抽取角度,介绍了与中文谓语动词识别相关的概念,提出了一种针对中文谓语动词标注方... 识别谓语动词是理解句子的关键。由于中文谓语动词结构复杂、使用灵活、形式多变,识别谓语动词在中文自然语言处理中是一项具有挑战的任务。本文从信息抽取角度,介绍了与中文谓语动词识别相关的概念,提出了一种针对中文谓语动词标注方法。在此基础上,研究了一种基于Attentional-BiLSTM-CRF神经网络的中文谓语动词识别方法。该方法通过双向递归神经网络获取句子内部的依赖关系,然后用注意力机制建模句子的焦点角色。最后通过条件随机场(Conditional random field,CRF)层返回一条最大化的标注路径。此外,为解决谓语动词输出唯一性的问题,提出了一种基于卷积神经网络的谓语动词唯一性识别模型。通过实验,该算法超出传统的序列标注模型CRF,在本文标注的中文谓语动词数据上到达76.75%的F值。 展开更多
关键词 谓语动词识别 神经网络 中文信息抽取
下载PDF
CMDC:一种差异互补的迭代式多维度文本聚类算法 被引量:3
2
作者 黄瑞章 白瑞娜 +3 位作者 陈艳平 秦永彬 程欣宇 田有亮 《通信学报》 EI CSCD 北大核心 2020年第8期155-164,共10页
针对传统多维度文本聚类算法把文本表示与聚类过程分离,忽略了维度间的互补特性的问题,提出了一种差异互补的迭代式多维度文本聚类算法——CMDC,实现文本聚类与特征调整过程的统一优化。CMDC算法挑选维度聚类间结果的互补文本,基于局部... 针对传统多维度文本聚类算法把文本表示与聚类过程分离,忽略了维度间的互补特性的问题,提出了一种差异互补的迭代式多维度文本聚类算法——CMDC,实现文本聚类与特征调整过程的统一优化。CMDC算法挑选维度聚类间结果的互补文本,基于局部度量学习算法利用互补文本促进聚类的特征调优,以维度的度量一致性来解决多维度文本聚类的划分一致性。实验结果表明,CMDC算法有效地提升了多维度聚类性能。 展开更多
关键词 多维度文本聚类 互补文本 约束文本聚类 度量计算
下载PDF
面向中文关系抽取的句子结构获取方法 被引量:1
3
作者 杨卫哲 秦永彬 +5 位作者 黄瑞章 王凯 程华龄 唐瑞雪 程欣宇 陈艳平 《数据采集与处理》 CSCD 北大核心 2021年第3期605-620,共16页
在关系抽取中,神经网络模型是目前最常用的技术之一,然而现有神经网络模型很少考虑句子中两个实体之间的结构特征。该文针对关系抽取任务的特点,提出了基于神经网络模型的句子结构获取方法。该方法通过对关系实例中两个实体的位置进行... 在关系抽取中,神经网络模型是目前最常用的技术之一,然而现有神经网络模型很少考虑句子中两个实体之间的结构特征。该文针对关系抽取任务的特点,提出了基于神经网络模型的句子结构获取方法。该方法通过对关系实例中两个实体的位置进行特殊标记,使神经网络模型能够有效捕获句子中关于实体的结构信息。为了验证方法的有效性,分别采用两种主流的神经网络模型进行对比实验,实验结果表明,该方法在ACE 2005中文关系抽取数据集上的抽取性能得到显著提升,超出对比工作约11个百分点,表明该方法能有效提升关系抽取任务的性能。 展开更多
关键词 关系抽取 结构特征 自然语言处理 实体标记
下载PDF
一种基于深度神经网络的句法要素识别方法 被引量:6
4
作者 陈艳平 冯丽 +1 位作者 秦永彬 黄瑞章 《山东大学学报(工学版)》 CAS CSCD 北大核心 2020年第2期44-49,共6页
为改进传统特征方法很难获取中文句子中结构信息的问题,提出一种基于深度神经网络的句法要素识别模型。采用Bi-LSTM网络从原始数据中自动抽取句子中的结构信息和语义信息,利用Attention机制自动计算抽象语义特征的分类权重,通过CRF层对... 为改进传统特征方法很难获取中文句子中结构信息的问题,提出一种基于深度神经网络的句法要素识别模型。采用Bi-LSTM网络从原始数据中自动抽取句子中的结构信息和语义信息,利用Attention机制自动计算抽象语义特征的分类权重,通过CRF层对输出标签进行约束,输出最优的标注序列。经过对比验证,该模型能有效识别句子中的句法要素,在标注数据集上F1达到84.85%。 展开更多
关键词 句法要素 信息抽取 深度神经网络
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部