-
题名融入多特征的篇章级新闻要素关系抽取
被引量:1
- 1
-
-
作者
党雪云
王剑
-
机构
昆明理工大学信息工程与自动化学院
云南省人工智能重点实验室
-
出处
《电视技术》
2022年第6期73-78,共6页
-
基金
国家重点研发计划(No.2018YFC0830105
No.2018YFC0830101
No.2018YFC0830100)。
-
文摘
随着互联网信息技术高速更新迭代,新闻文本信息在以指数级的速度增多。面对海量的新闻文本信息,如何自动提取长篇新闻文本中要素与要素之间的关系,成为研究的重点。篇章级新闻要素关系抽取是指从篇章级新闻文本中跨句子识别要素之间的关系信息,有助于加速人们对整篇新闻文本脉络的理解。本文以舆情新闻文本为例,提出融入多特征的篇章级新闻要素关系抽取方法,通过异构图模型将句子间的邻接关系、从属关系、句法依赖关系、要素间的多跳关系等多种特征进行融合,充分挖掘文本中潜在的上下文信息。在构建的篇章级舆情新闻要素关系数据集上的实验结果表明,融入的多种特征对要素关系抽取的性能均有明显的提升,F1值最高提升了4.09%,较目前主流方法取得了更好的效果。
-
关键词
舆情新闻文本信息
篇章级要素关系抽取
异构图模型
-
Keywords
discourse-level element relation extraction
heterogeneous graph
public opinion news text information
-
分类号
TN931.3
[电子电信—信号与信息处理]
-
-
题名基于门控图神经网络的新闻要素信息抽取方法
- 2
-
-
作者
党雪云
王剑
-
机构
昆明理工大学信息工程与自动化学院
云南省人工智能重点实验室
-
出处
《电视技术》
2022年第5期24-29,共6页
-
基金
国家重点研发计划(No.2018YFC0830105,No.2018YFC0830101,No.2018YFC0830100)。
-
文摘
新闻要素信息抽取是指从新闻文本中识别出人名、地名、领域要素等信息,对于快速理解新闻文本有着关键作用。本文以抽取涉案新闻领域的要素信息为例,提出基于门控图神经网络(Gated Graph Neural Network,GGNN)融合案件相关词典的方法,利用图神经网络中结点与边之间的消息传播机制将外部词汇知识融入新闻文本中,挖掘文本潜在的语义特征,提高要素信息抽取性能。首先根据新闻文本特征选择领域相关的词汇构建案件相关词典,其次利用新闻文本和词典构建字粒度的组合图,通过GGNN模型对其进行编码得到字词组合关系的表征,最后利用Bi-LSTM-CRF模型解码得到要素信息序列。在标注的涉案新闻要素信息数据集上的实验结果表明,基于GGNN融入词典信息的要素抽取方法与常用的算法模型相比,F1值有2.12%~5.34%的提高,取得了更稳定的性能。
-
关键词
新闻要素信息抽取
门控图神经网络(GGNN)
字词组合关系图
-
Keywords
news element information extraction
Gated Graph Neural Network(GGNN)
char-word combination graph
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-