期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于语言模型词嵌入和注意力机制的敏感信息检测方法 被引量:8
1
作者 黄诚 赵倩锐 《计算机应用》 CSCD 北大核心 2022年第7期2009-2014,共6页
针对基于关键词字符匹配和短语级情感分析等传统敏感信息检测方法准确率低和泛化性差的问题,提出了一种基于语言模型词嵌入和注意力机制(A-ELMo)的敏感信息检测方法。首先,进行字典树快速匹配,以最大限度地减少无用字符的比较,从而极大... 针对基于关键词字符匹配和短语级情感分析等传统敏感信息检测方法准确率低和泛化性差的问题,提出了一种基于语言模型词嵌入和注意力机制(A-ELMo)的敏感信息检测方法。首先,进行字典树快速匹配,以最大限度地减少无用字符的比较,从而极大地提高查询效率;其次,构建了一个语言模型词嵌入模型(ELMo)进行语境分析,并通过动态词向量充分表征语境特征,从而实现较高的可扩展性;最后,结合注意力机制加强模型对敏感特征的识别度,从而进一步提升对敏感信息的检测率。在由多个网络数据源构成的真实数据集上进行实验,结果表明,所提敏感信息检测方法与基于短语级情感分析的方法相比,准确率提升了13.3个百分点;与基于关键字匹配的方法相比,准确率提升了43.5个百分点,充分验证了所提方法在加强敏感特征识别度、提高敏感信息检测率方面的优越性。 展开更多
关键词 敏感信息 语言模型嵌入 语境分析 注意力机制 字典树
下载PDF
基于语言模型及循环卷积神经网络的事件检测 被引量:4
2
作者 施喆尔 陈锦秀 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第3期442-448,共7页
目前,事件检测的难点在于一词多义和多事件句的检测.为了解决这些问题,提出了一个新的基于语言模型的带注意力机制的循环卷积神经网络模型(recurrent and convolutional neural network with attention based on language models,LM-ARC... 目前,事件检测的难点在于一词多义和多事件句的检测.为了解决这些问题,提出了一个新的基于语言模型的带注意力机制的循环卷积神经网络模型(recurrent and convolutional neural network with attention based on language models,LM-ARCNN).该模型利用语言模型计算输入句子的词向量,将句子的词向量输入长短期记忆网络获取句子级别的特征,并使用注意力机制捕获句子级别特征中与触发词相关性高的特征,最后将这两部分的特征输入到包含多个最大值池化层的卷积神经网络,提取更多上下文有效组块.在ACE2005英文语料库上进行实验,结果表明,该模型的 F 1 值为74.4%,比现有最优的文本嵌入增强模型(DEEB)高0.4%. 展开更多
关键词 事件检测 语言模型嵌入 长短期记忆网络 动态多池化卷积神经网络 注意力机制
下载PDF
基于双向编解码器的乌英机器翻译 被引量:11
3
作者 高巍 李耀松 +2 位作者 李大舟 陈子祥 孟智慧 《计算机工程与设计》 北大核心 2021年第5期1479-1484,共6页
对乌尔都语到英语的机器翻译进行研究,提出一种基于双向编解码器的乌英机器翻译模型。利用语言模型嵌入(embedding from language models,ELMo)方法进行语料的预训练,缓解双语平行语料稀缺以及词汇表受限所导致的翻译正确率不佳的问题;... 对乌尔都语到英语的机器翻译进行研究,提出一种基于双向编解码器的乌英机器翻译模型。利用语言模型嵌入(embedding from language models,ELMo)方法进行语料的预训练,缓解双语平行语料稀缺以及词汇表受限所导致的翻译正确率不佳的问题;采用双向编解码机制,避免翻译过程中方向性倾斜的问题,提高翻译效果。实验在少量平行语料库的基础上,对所提模型与传统的乌英机器翻译模型进行对比,实验结果表明,该模型较传统模型在双语评估替补(bilingual evaluation understudy,BLEU)评分上提升了2.42,最终该模型的BLEU评分为9.27。 展开更多
关键词 机器翻译 乌尔都语 双向编解码器 语言模型嵌入 双语评估替补
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部