-
题名基于多词汇特征增强的中文事件检测方法
- 1
-
-
作者
缪梓敬
梅欣
-
机构
华南师范大学计算机学院
-
出处
《计算机与现代化》
2022年第9期13-18,共6页
-
基金
广东省重点领域研发计划项目(2019B111101001)。
-
文摘
事件检测主要研究从非结构化文本中自动识别事件触发词,实现所属事件类型的正确分类。与英文相比,中文需要经过分词才能利用词汇信息,还存在“分词-触发词”不匹配问题。针对中文语言特性与事件检测任务的特点,本文提出一种基于多词汇特征增强的中文事件检测模型,通过外部词典为字级别模型引入包含多词汇信息的词汇集,以利用多种分词结果的词汇信息。同时采用静态文本词频统计与自动分词工具协同决策词汇集中词汇的权重,获取更加精确的词汇语义。在ACE2005中文数据集上与现有模型进行实验对比分析,结果表明本文方法取得了最好的性能,验证了该方法在中文事件检测上的有效性。
-
关键词
中文事件检测
特征增强
多词汇特征
词汇权重决策
-
Keywords
Chinese event detection
feature augmentation
multiple lexicon feature
lexicon weight determination
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-