-
题名基于篇章级信息特征增强的中文突发事件检测
- 1
-
-
作者
廖涛
吕玉成
张顺香
-
机构
安徽理工大学计算机科学与工程学院
-
出处
《阜阳师范大学学报(自然科学版)》
2024年第1期1-7,共7页
-
基金
国家自然科学基金面上项目(62076006)
安徽省属高校协同创新项目(GXXT-2021-008)
安徽省自然科学基金面上项目(1908085MF189)。
-
文摘
事件检测旨在检测句子中的触发词并将其分类为特定的事件类型。针对目前大多数的中文事件检测方法存在篇章内句子间相互依赖信息利用不充分的问题,提出了基于篇章级信息特征增强的中文突发事件检测方法。首先,通过BERT(Bidirectional Encoder Representations from Transformers)预训练语言模型编码字向量,使用平均池化将字向量转换成句子表示信息;其次,利用双向门控循环神经网络(Bidirectional gated recurrent neural network,Bi-GRU)学习句子内和篇章内的上下文隐层信息,接着通过注意力机制(Attention Mechanism)分别得到句子级信息和由若干句子间的相互依赖信息生成的篇章级信息;最后,将篇章级信息融合到句子级信息上后与字向量拼接,再使用条件随机场完成对句子中触发词的识别和标注。实验结果表明,该方法有效的提升了中文突发事件检测效果,F1值达到79.95%。
-
关键词
事件检测
注意力机制
篇章级信息
双向门控循环神经网络
-
Keywords
event detection
attention mechanism
chapter-level information
bidirectional gated recurrent neural network
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名上市公司公告篇章级信息抽取框架与实现
被引量:3
- 2
-
-
作者
毛瑞彬
吕华揆
朱菁
-
机构
武汉大学信息资源研究中心
深圳证券信息有限公司
-
出处
《情报科学》
CSSCI
北大核心
2019年第11期73-78,88,共7页
-
基金
国家自然科学基金重大研究计划“大数据驱动的管理与决策研究”重点支持项目“基于知识关联的金融大数据价值分析、发现及协同创造机制”(91646206)
国家自然科学基金重点国际(地区)合作研究项目“大数据环境下的知识组织与服务创新研究”(71420107026)
-
文摘
【目的/意义】构建一个面向上市公司公告的篇章级信息抽取框架,实现多种类型信息的抽取,并服务于投资和监管。【方法/过程】以深圳A股市场公告中的635篇并购重组公告为例,从中抽取了交易信息和公司财务指标等信息,对框架和方法进行验证。【结果/结论】运用本文所提框架和方法实现的字段抽取准确率为87.6%,效果较好。本文提出的信息抽取框架及方法在上市公司公告信息抽取中是有效的,可以为投资者的投资决策和监管机构的监管提供数据基础。
-
关键词
上市公司公告
序列标注
语义分析
篇章级信息抽取框架
-
Keywords
announcement of listed companies
sequence labeling
semantic analysis
text-level information extraction framework
-
分类号
G254
[文化科学—图书馆学]
F272
[经济管理—企业管理]
-