诈骗电话案件频频发生并威胁着人们的生活,含有诈骗语义的语句与内容的前后文、语句序列、局部相关内容以及显著关键词语相关.本文提出神经网络模型PEAGCNN(Position Embedding and Attention are introduced into BiGRU and CNN)对诈...诈骗电话案件频频发生并威胁着人们的生活,含有诈骗语义的语句与内容的前后文、语句序列、局部相关内容以及显著关键词语相关.本文提出神经网络模型PEAGCNN(Position Embedding and Attention are introduced into BiGRU and CNN)对诈骗电话文本分类.首先构建相关数据集,词嵌入用于表示文本,不同频率的正弦、余弦函数对文本位置信息编码并融入词嵌入向量,然后分别利用BiGRU(Bidirectional Gated Recurrent Unit)和CNN(Convolutional Neural Network)提取文本上下文相关信息、语句序列以及局部相关性,Attention机制对提取出的信息重新分配权重,突出关键信息的作用,最后将两种信息融合,通过Softmax实现分类.在THUCNews数据集以及诈骗电话文本数据集上的实验结果表明,本文提出模型的准确率和F1值均比对比模型有提升,同时模型对诈骗电话文本数据集分类的各项性能指标均在0.91以上.展开更多
文摘诈骗电话案件频频发生并威胁着人们的生活,含有诈骗语义的语句与内容的前后文、语句序列、局部相关内容以及显著关键词语相关.本文提出神经网络模型PEAGCNN(Position Embedding and Attention are introduced into BiGRU and CNN)对诈骗电话文本分类.首先构建相关数据集,词嵌入用于表示文本,不同频率的正弦、余弦函数对文本位置信息编码并融入词嵌入向量,然后分别利用BiGRU(Bidirectional Gated Recurrent Unit)和CNN(Convolutional Neural Network)提取文本上下文相关信息、语句序列以及局部相关性,Attention机制对提取出的信息重新分配权重,突出关键信息的作用,最后将两种信息融合,通过Softmax实现分类.在THUCNews数据集以及诈骗电话文本数据集上的实验结果表明,本文提出模型的准确率和F1值均比对比模型有提升,同时模型对诈骗电话文本数据集分类的各项性能指标均在0.91以上.