伪造文本检测是保证社交安全的重要条件。融合多模特征注意力机制的伪造文本检测,实现多类型伪造文本的检测,并提高其精度。针对目前数据集的不足,根据不同的文本生成模型GPT-2、Grover、LSTM等制作了对应的多伪造类型数据集。融合GLTR...伪造文本检测是保证社交安全的重要条件。融合多模特征注意力机制的伪造文本检测,实现多类型伪造文本的检测,并提高其精度。针对目前数据集的不足,根据不同的文本生成模型GPT-2、Grover、LSTM等制作了对应的多伪造类型数据集。融合GLTR、Grover和LP(Language and Physical)3个多模特征,使用注意力机制将该3个模型输出进行融合。设计时空特征融合网络充分提取时序信息和局部空间信息。最后添加分类层完成伪造文本的分类。实验结果表明:融合多模特征和时空特征融合网络可提取更多的伪造信息,同时充分融合了时序和局部空间信息,提升了伪造文本的表征能力,且泛化能力也优于以往网络。展开更多
随着数据量的爆炸式增长,边缘计算在大数据处理中的作用愈加重要.现实应用中产生的数据通常建模表示成高阶增量式张量的形式,增量式张量Tucker分解是一种高效挖掘高阶海量数据中隐藏信息的方法.针对传统增量式张量分解忽视张量模特征对...随着数据量的爆炸式增长,边缘计算在大数据处理中的作用愈加重要.现实应用中产生的数据通常建模表示成高阶增量式张量的形式,增量式张量Tucker分解是一种高效挖掘高阶海量数据中隐藏信息的方法.针对传统增量式张量分解忽视张量模特征对分解过程的影响、分解结果不能较好保留原始数据特征的问题,提出一种基于模特征的增量式张量Tucker分解方法 ITTDMC (incremental tensor tucker decomposition based on mode characteristics).首先,用模长增量决定增量因子矩阵更新顺序,以此降低更新顺序带来的重构误差;其次,根据模熵变化比决定增量因子矩阵更新权重,使分解结果更准确保留各模特征;然后,将过往时刻的模特征和更新参数记录在指导张量中,遇到模特征相似的增量数据时直接使用来指导张量中参数的更新,避免重复计算,降低时间开销;最后,在合成和真实数据集上进行大量的实验,实验结果表明ITTDMC在模特征明显的数据集上能显著降低(最高可达29%)增量式张量的重构误差.展开更多
文摘伪造文本检测是保证社交安全的重要条件。融合多模特征注意力机制的伪造文本检测,实现多类型伪造文本的检测,并提高其精度。针对目前数据集的不足,根据不同的文本生成模型GPT-2、Grover、LSTM等制作了对应的多伪造类型数据集。融合GLTR、Grover和LP(Language and Physical)3个多模特征,使用注意力机制将该3个模型输出进行融合。设计时空特征融合网络充分提取时序信息和局部空间信息。最后添加分类层完成伪造文本的分类。实验结果表明:融合多模特征和时空特征融合网络可提取更多的伪造信息,同时充分融合了时序和局部空间信息,提升了伪造文本的表征能力,且泛化能力也优于以往网络。
文摘随着数据量的爆炸式增长,边缘计算在大数据处理中的作用愈加重要.现实应用中产生的数据通常建模表示成高阶增量式张量的形式,增量式张量Tucker分解是一种高效挖掘高阶海量数据中隐藏信息的方法.针对传统增量式张量分解忽视张量模特征对分解过程的影响、分解结果不能较好保留原始数据特征的问题,提出一种基于模特征的增量式张量Tucker分解方法 ITTDMC (incremental tensor tucker decomposition based on mode characteristics).首先,用模长增量决定增量因子矩阵更新顺序,以此降低更新顺序带来的重构误差;其次,根据模熵变化比决定增量因子矩阵更新权重,使分解结果更准确保留各模特征;然后,将过往时刻的模特征和更新参数记录在指导张量中,遇到模特征相似的增量数据时直接使用来指导张量中参数的更新,避免重复计算,降低时间开销;最后,在合成和真实数据集上进行大量的实验,实验结果表明ITTDMC在模特征明显的数据集上能显著降低(最高可达29%)增量式张量的重构误差.