-
题名基于句法语义依存分析的中文金融事件抽取
被引量:23
- 1
-
-
作者
万齐智
万常选
胡蓉
刘德喜
-
机构
江西财经大学信息管理学院
江西财经大学软件与物联网工程学院
江西财经大学数据与知识工程江西省高校重点实验室
-
出处
《计算机学报》
EI
CSCD
北大核心
2021年第3期508-530,共23页
-
基金
国家自然科学基金项目(61972184,61562032,61762042)
江西省教育厅科学技术研究项目(GJJ180198,GJJ180252)资助。
-
文摘
事件抽取在自然语言处理应用中扮演着重要的角色,如股票市场趋势预测.传统事件抽取较为关注触发词和论元所属类型的正确性,较少地结合应用需求去分析研究事件抽取效果及使用价值.在财经领域,事件作用对象及动作是关注的重点.因此,本文聚焦于金融事件,抽取三元组事件ET(Sub,Pred,Obj).在中文财经新闻中,存在大量事件嵌套和成分共享等现象,致使易出现事件漏抽和事件成分缺失的情况.为了解决这些问题,本文建立一个句法和语义依存分析相结合的中文事件抽取框架,归纳了4种常见缺省结构,并设计相应的补全规则.首先,基于句法依存树,分析动词词法和句法结构,建立核心动词链,使得每个核心动词对应一个事件,解决事件漏抽问题.然后,在句法依存树的基础上添加语义依存关系,建立事件间语义关联,得到句法语义依存分析(Syntactic Semantic Dependency Parsing,SSDP)树.第三,调整SSDP树,优化句法结构,形成SSDP图,使得同等句法结构的词结点处于相同层级,为后续事件抽取提供途径.第四,归纳4种常见缺省结构,设计相应补全规则,解决事件成分缺失问题.最后,在中文财经新闻标题和CoNLL2009中文语料上进行详细的实验测试,实验结果表明该方法是有效的.
-
关键词
中文事件抽取
核心动词链
句法语义依存分析图
事件语义关联
缺省补全
-
Keywords
Chinese event extraction
core verb chain
syntactic semantic dependency parsing graph
event semantics relevance
default complement
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-