-
题名基于多词汇特征增强的中文事件检测方法
- 1
-
-
作者
缪梓敬
梅欣
-
机构
华南师范大学计算机学院
-
出处
《计算机与现代化》
2022年第9期13-18,共6页
-
基金
广东省重点领域研发计划项目(2019B111101001)。
-
文摘
事件检测主要研究从非结构化文本中自动识别事件触发词,实现所属事件类型的正确分类。与英文相比,中文需要经过分词才能利用词汇信息,还存在“分词-触发词”不匹配问题。针对中文语言特性与事件检测任务的特点,本文提出一种基于多词汇特征增强的中文事件检测模型,通过外部词典为字级别模型引入包含多词汇信息的词汇集,以利用多种分词结果的词汇信息。同时采用静态文本词频统计与自动分词工具协同决策词汇集中词汇的权重,获取更加精确的词汇语义。在ACE2005中文数据集上与现有模型进行实验对比分析,结果表明本文方法取得了最好的性能,验证了该方法在中文事件检测上的有效性。
-
关键词
中文事件检测
特征增强
多词汇特征
词汇权重决策
-
Keywords
Chinese event detection
feature augmentation
multiple lexicon feature
lexicon weight determination
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名拥抱融合的多模态灾害分析算法
- 2
-
-
作者
梅欣
缪梓敬
-
机构
华南师范大学计算机学院
-
出处
《计算机与现代化》
2022年第10期82-87,共6页
-
基金
广东省重点领域研发计划项目(2019B111101001)。
-
文摘
融合文本和图像的多模态信息相对于单模态可以提升灾害事件分析准确率。但是已有的工作多数将文本特征和图片特征进行简单的融合,在提取、融合特征的时候造成特征的冗余,同时忽略了模态之间的联系,没有考虑到图像和文本之间特征的相关性。为此,本文分析和研究目前流行的多模态融合算法,提出一种拥抱融合的多模态灾害事件分析算法。首先将文本特征和图像的特征向量互相对比,考虑文本和图像特征之间的相关性。然后基于多项抽样,剔除冗余的特征,融合文本特征和图像特征。实验结果表明,拥抱融合在Crisis MMD2.0数据集上实验1的2个任务的分类效果准确率分别高达88.2%、85.1%,都明显优于其他多模态融合模型,表明了该模型的有效性。同时第2个实验也验证了拥抱模型对于不同文本和图像深度学习模型的适用性。
-
关键词
多模态融合
拥抱融合
多项抽样
多模态灾害事件
Crisis
MMD2.0
-
Keywords
multi-modal fusion
embrace fusion
multinomial sampling
multi-modal disaster event
CrisisMMD2.0
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-