期刊文献+
共找到886篇文章
< 1 2 45 >
每页显示 20 50 100
基于微调原型网络的小样本敏感信息识别方法 被引量:1
1
作者 余正涛 关昕 +2 位作者 黄于欣 张思琦 赵庆珏 《中文信息学报》 CSCD 北大核心 2024年第1期115-123,共9页
敏感信息识别主要是指识别互联网上涉及色情、毒品、邪教、暴力等类型的敏感信息,现有的敏感信息识别通常将其看作文本分类任务,但由于缺乏大规模的敏感信息标注数据,分类效果不佳。该文提出一种基于微调原型网络的小样本敏感信息识别方... 敏感信息识别主要是指识别互联网上涉及色情、毒品、邪教、暴力等类型的敏感信息,现有的敏感信息识别通常将其看作文本分类任务,但由于缺乏大规模的敏感信息标注数据,分类效果不佳。该文提出一种基于微调原型网络的小样本敏感信息识别方法,在小样本学习框架下,利用快速适应的微调原型网络来缓解元训练阶段通用新闻领域和元测试阶段敏感信息数据差异大的问题。首先,在元训练阶段,基于通用新闻领域的分类数据训练模型来学习通用知识,同时在训练过程中经过两阶段梯度更新,得到一组对新任务敏感的快速适应初始参数,然后在元测试阶段敏感文本数据集的新任务上,冻结模型部分参数并使用支持集进一步微调,使模型更好地泛化到敏感识别领域上。实验结果证明,相比当前最优的小样本分类模型,该文提出的快速适应微调策略的原型网络显著提升了敏感信息识别效果。 展开更多
关键词 敏感信息识别 小样本学习 微调策略 原型网络
下载PDF
基于动态网络的文本敏感信息感知脑响应检测模型
2
作者 李慧敏 曾颖 +2 位作者 童莉 鲁润南 闫镔 《传感器与微系统》 CSCD 北大核心 2024年第4期152-156,共5页
针对文本敏感信息感知过程复杂和个体差异大造成敏感信息感知脑响应潜伏期不确定性的问题,提出了一种基于动态卷积神经网络的脑响应检测模型——DyCNN_CBAM。该模型通过增加的动态卷积模块,让每层的卷积参数在训练的时候随着输入可变,... 针对文本敏感信息感知过程复杂和个体差异大造成敏感信息感知脑响应潜伏期不确定性的问题,提出了一种基于动态卷积神经网络的脑响应检测模型——DyCNN_CBAM。该模型通过增加的动态卷积模块,让每层的卷积参数在训练的时候随着输入可变,可提升模型的尺寸与容量。然后在模型第一、二层后增加的注意力机制模块,自动计算贡献度较高的时空信息。实验结果表明:该模型比现有的单尺度模型平均分类准确率提高了4%,F1分数提高6.7%,同时比现有多尺度网络平均分类准确率提高了2%,F1分数提高1.2%。此外,在公开数据集上取得最好的F1分数。由此说明,该网络更够适应文本敏感信息感知脑信号潜伏期抖动性,有效地提升了文本敏感信息检测模型的稳定性。 展开更多
关键词 文本敏感信息 脑电信号 目标检测 动态卷积神经网络 注意力机制
下载PDF
电力通信网络敏感信息传输路由安全优化设计
3
作者 杨波 《电子设计工程》 2024年第24期32-35,41,共5页
优化电力通信网络敏感信息传输节点选取过程,可避免链路拥挤,高消耗的传输能量导致簇首分布不合理的问题。因此,为了提高敏感信息传输安全性和网络覆盖率,设计电力通信网络敏感信息传输路由安全优化方案。结合PageRank算法迭代更新连接... 优化电力通信网络敏感信息传输节点选取过程,可避免链路拥挤,高消耗的传输能量导致簇首分布不合理的问题。因此,为了提高敏感信息传输安全性和网络覆盖率,设计电力通信网络敏感信息传输路由安全优化方案。结合PageRank算法迭代更新连接节点,构建路由连接函数,综合考虑节点负荷容量和等级选取节点。构建路由安全优化协议整体框架,依据链路ETX值改善电力通信网络中能量损耗。计算目标节点分布概率密度,设计路由优化数据分发机制,实现敏感信息传输路由安全优化。由实验结果可知,所设计方法簇1、2、3、4的簇首中心坐标分别为(-1,2)、(1,1.8)、(0.95,-2.2)、(-1,-2),与实际簇首所在中心一致;最高网络覆盖率为96%,有效提高了网络连接安全性。 展开更多
关键词 电力通信网络 敏感信息传输 路由安全优化 分布概率密度 PAGERANK算法
下载PDF
基于密文域敏感信息表征的隐私保护算法
4
作者 董冰 《河南科学》 2024年第2期209-215,共7页
网络中提供身份信息的网络资源容易导致个人身份数据的泄露,为了保障身份信息安全,需要进行信息隐私保护设计,提出一种基于密文域敏感信息表征的隐私保护算法.采用双线性映射编码技术构建表征个人隐私信息的比特序列信息模型,提取比特... 网络中提供身份信息的网络资源容易导致个人身份数据的泄露,为了保障身份信息安全,需要进行信息隐私保护设计,提出一种基于密文域敏感信息表征的隐私保护算法.采用双线性映射编码技术构建表征个人隐私信息的比特序列信息模型,提取比特序列信息的信息熵特征量,在密文域中对提取的特征量进行混沌加密设计.设计隐私保护敏感信息的密钥构造方案,运用到数字签名中,对每组信息进行分块加密和身份认证,实现隐私保护设计.仿真结果表明,采用该算法进行隐私保护,对用户敏感信息加密后的抗攻击性能较好,模型的可信度较高,具有较好的隐私保护能力. 展开更多
关键词 隐私保护 密文域 敏感信息 数据加密 密钥
下载PDF
基于Logistic映射的社交网络敏感信息加密算法
5
作者 杨洋 《兰州文理学院学报(自然科学版)》 2024年第2期51-55,共5页
为保护多种社交网络敏感信息安全,研究基于Logistic映射的社交网络敏感信息加密算法.此算法采用基于经验模态分解的社交网络信息预处理方法,以经验模态分解的方式,对复杂的社交网络信息去冗后,通过基于演化超网络的社交网络敏感信息挖... 为保护多种社交网络敏感信息安全,研究基于Logistic映射的社交网络敏感信息加密算法.此算法采用基于经验模态分解的社交网络信息预处理方法,以经验模态分解的方式,对复杂的社交网络信息去冗后,通过基于演化超网络的社交网络敏感信息挖掘方法,提取去冗后社交网络信息中敏感信息;由基于Logistic映射分组加密算法,生成敏感信息二进制随机序列,将其分为两部分明文,一部分明文执行置乱处理,另一部分明文执行异或运算,构建社交网络敏感信息的密文,完成社交网络敏感信息加密.实验结果表明,所提算法加密性能良好,可以有效改变文本类、图像类社交网络敏感信息,原始敏感信息特征完全改变,可保护多种社交网络敏感信息安全. 展开更多
关键词 LOGISTIC映射 社交网络 敏感信息 加密算法 演化超网络 信息挖掘
下载PDF
医疗卫生机构患者个人敏感信息安全使用探究
6
作者 蔡雨蒙 伊向华 +2 位作者 单红伟 王忠民 刘云 《医学信息学杂志》 CAS 2024年第1期83-88,共6页
目的/意义基于医疗卫生机构个人敏感信息使用典型场景,探究个人敏感信息使用安全实现方式。方法/过程针对用户注册、内部利用与交互、医疗器械/可穿戴设备采集和信息披露等使用场景,分析个人敏感信息泄漏风险,探究身份鉴别、访问控制、... 目的/意义基于医疗卫生机构个人敏感信息使用典型场景,探究个人敏感信息使用安全实现方式。方法/过程针对用户注册、内部利用与交互、医疗器械/可穿戴设备采集和信息披露等使用场景,分析个人敏感信息泄漏风险,探究身份鉴别、访问控制、数据加密、数据脱敏和检测审计等多种技术手段的适用场景及优缺点。结果/结论技术手段的应用可以辅助医疗卫生机构进一步保障患者个人信息安全。 展开更多
关键词 医疗卫生机构 个人敏感信息 使用安全
下载PDF
基于BERT模型的网站敏感信息识别及其变体还原技术研究
7
作者 符泽凡 姚竟发 滕桂法 《现代电子技术》 北大核心 2024年第23期105-112,共8页
针对各类网站为了避免被检测到敏感信息,网站内的文字常采用变体词对敏感词词库进行规避。为解决这一问题,文中提出一种基于BERT模型结合变体字还原算法的网站敏感信息识别的方法。该方法将针对文本中的变体词进行还原,通过采用BERT模... 针对各类网站为了避免被检测到敏感信息,网站内的文字常采用变体词对敏感词词库进行规避。为解决这一问题,文中提出一种基于BERT模型结合变体字还原算法的网站敏感信息识别的方法。该方法将针对文本中的变体词进行还原,通过采用BERT模型对文本内容进行向量化,并将其输入由Bi LSTM层和CNN层构成的模型进行训练,从而实现对网站内敏感信息及其变体词的识别。实验结果显示,变体词还原的正确率较高,通过BERT模型获取的文本向量在文本分类任务中表现出色。与其他模型相比,BERT-Bi LSTM-CNN模型在网站敏感信息识别任务中表现出更高的准确率、召回率和F1值,呈现明显的提升。文中模型为变体词还原问题和敏感信息识别领域提供了参考和支持,具有一定的实际应用价值。 展开更多
关键词 网站 敏感信息 变体词 BERT 双向长短期记忆网络 卷积神经
下载PDF
融合敏感词典和异构图的汉泰跨语言敏感信息识别
8
作者 朱栩冉 余正涛 张勇丙 《计算机工程与设计》 北大核心 2024年第7期2150-2156,共7页
通用跨语言文本分类模型识别毒品、暴力和自然灾害等敏感信息不准确,且汉泰双语敏感词表示多样化、难对齐导致不同语言信息聚合能力较弱,为此提出一种融合敏感词典和异构图的汉泰跨语言敏感信息识别方法。利用汉泰敏感词典构建具有文档... 通用跨语言文本分类模型识别毒品、暴力和自然灾害等敏感信息不准确,且汉泰双语敏感词表示多样化、难对齐导致不同语言信息聚合能力较弱,为此提出一种融合敏感词典和异构图的汉泰跨语言敏感信息识别方法。利用汉泰敏感词典构建具有文档对齐和词对齐的跨语言异构图结构,将文档以及所含关键词和敏感词作为节点,双语对齐、相似关系和不同词性作为边构建汉泰跨语言异构图;基于多语言预训练模型对文档节点和词节点进行表征;通过多层图卷积神经网络对输入文档进行编码,使用敏感信息分类器对文档进行分类预测。实验结果表明,所提方法准确率较基线模型提高了5.83%。 展开更多
关键词 敏感词典 跨语言 异构图 图卷积神经网络 敏感信息识别 多语言预训练模型 双语对齐
下载PDF
面向中文文本的敏感信息识别方法研究 被引量:1
9
作者 董思源 王子扬 +1 位作者 章坤 孙美凤 《软件》 2024年第3期51-53,共3页
为了避免互联网上不良敏感信息的泛滥,创建干净、文明的用网环境,本文研究中文文本的敏感信息识别问题。基于调研分析,提出由敏感词库构建、可疑文本发现和敏感信息识别三阶段组成的识别框架,并给出每阶段的执行策略和方法。对基于Word2... 为了避免互联网上不良敏感信息的泛滥,创建干净、文明的用网环境,本文研究中文文本的敏感信息识别问题。基于调研分析,提出由敏感词库构建、可疑文本发现和敏感信息识别三阶段组成的识别框架,并给出每阶段的执行策略和方法。对基于Word2vec的敏感词库扩充方法进行了实验,结果表明该方法具有显著效果。 展开更多
关键词 Word2vec 敏感信息识别 中文文本
下载PDF
基于DBN模型的互联网敏感信息泄露检测研究
10
作者 邓伟 许放 +2 位作者 张涛 艾雪瑞 甄珍 《电子设计工程》 2024年第5期174-177,182,共5页
互联网敏感信息存在的噪声影响敏感信息泄露检出率和检测任务完成时间,因此研究基于DBN模型的互联网敏感信息泄露检测方法。利用分布式网络爬虫技术爬取互联网网页敏感信息,采用近邻策略对爬取到的信息进行分组处理,并对分组处理完成的... 互联网敏感信息存在的噪声影响敏感信息泄露检出率和检测任务完成时间,因此研究基于DBN模型的互联网敏感信息泄露检测方法。利用分布式网络爬虫技术爬取互联网网页敏感信息,采用近邻策略对爬取到的信息进行分组处理,并对分组处理完成的信息进行去噪。将编码和序列化处理过后的互联网敏感信息处理结果输入训练好的DBN模型中,得到互联网敏感信息泄露检测结果。实验结果表明,基于DBN模型的互联网敏感信息泄露检测方法的检出率高达99.8%,检测任务完成时间短,实际应用效果好。 展开更多
关键词 DBN模型 互联网 敏感信息 泄露检测 编码 序列化
下载PDF
同行对标敏感信息差分隐私保护系统设计
11
作者 范冰沁 《电子设计工程》 2024年第12期191-195,共5页
由于海量同行对标敏感信息受到攻击影响,造成敏感信息发布密度低而导致隐私保护效果不佳的问题,设计了同行对标敏感信息差分隐私保护系统。设计攻击检测器,通过数据平面粗粒度配合协作完成整个敏感信息检测。捕获敏感信息包获取相关信... 由于海量同行对标敏感信息受到攻击影响,造成敏感信息发布密度低而导致隐私保护效果不佳的问题,设计了同行对标敏感信息差分隐私保护系统。设计攻击检测器,通过数据平面粗粒度配合协作完成整个敏感信息检测。捕获敏感信息包获取相关信息。设计芯片保护结构,保证系统在受到外界攻击时稳定运行。构建基于差分隐私保护的防御模型,根据同行对标敏感程度,计算系统需要保护的敏感信息量,实现敏感信息的实时检测和保护。采用匿名隐私保护方式抵抗外界攻击,设定隐私预算保护力度,延长差分隐私保护周期。由测试结果可知,该系统查询误差最高为0.15,且能够获取发布的全部敏感信息。 展开更多
关键词 同行对标 敏感信息 差分隐私保护 匿名隐私
下载PDF
基于深度学习的涉密敏感信息识别技术研究
12
作者 曾庆瑞 《现代信息科技》 2024年第11期171-175,共5页
为提升涉密敏感信息管理工作智能化水平,该文提出一种BERT-BGRU-CRF深度学习方法,实现对涉密敏感信息的自动识别。该方法先是采用BERT模型对文本信息进行预处理,再采用双向门控循环单元(BGRU)模型获取上下文语义特征,最后将提取后的信... 为提升涉密敏感信息管理工作智能化水平,该文提出一种BERT-BGRU-CRF深度学习方法,实现对涉密敏感信息的自动识别。该方法先是采用BERT模型对文本信息进行预处理,再采用双向门控循环单元(BGRU)模型获取上下文语义特征,最后将提取后的信息输入到条件随机场模型中进行序列标注,从而得到最优解。实验结果表明,在自建数据集上,所提方法相较于BERT-CRF、BERT-LSTM-CRF、BERT-BiLSTM-CRF三个识别方法,在精确率、召回率和F1值等方面均取得了较高的分数,证明该方法是适用于涉密敏感信息智能识别工作的。 展开更多
关键词 敏感信息识别 深度学习 门控循环单元 BERT 条件随机场
下载PDF
基于恶意流量分析与敏感信息提取系统的设计与实现
13
作者 龙华秋 龙雨航 +1 位作者 梁嘉浩 燕紫君 《现代信息科技》 2024年第19期175-178,183,共5页
文章针对恶意流量的特点建立完善的分析系统,以自动分析流量包基本信息,识别数据包的IP,判断流量包中的网络攻击意图;同时,对特定协议的传输文件进行识别提取,提取流量包中的敏感信息,并基于分析结果给予用户相应提醒。使用时,用户只需... 文章针对恶意流量的特点建立完善的分析系统,以自动分析流量包基本信息,识别数据包的IP,判断流量包中的网络攻击意图;同时,对特定协议的传输文件进行识别提取,提取流量包中的敏感信息,并基于分析结果给予用户相应提醒。使用时,用户只需要将流量包上传,系统就可以自动分析、识别是否存在恶意流量,并提取敏感信息。通过一系列测试证明,系统所有功能均能正常运行,基本可以满足用户的日常使用需求。 展开更多
关键词 恶意流量 敏感信息 提取文件
下载PDF
海量异构资源敏感信息时间序列数据挖掘算法
14
作者 吕长松 《桂林航天工业学院学报》 2024年第1期61-66,共6页
为了保护用户敏感信息,能够进行有效的数据分析和决策制定,突出数据挖掘过程的加速比与准确率,提出一种海量异构资源敏感信息时间序列数据挖掘算法.利用TF-IDF计算异构网络敏感信息的特征向量,根据敏感信息特征提取的阈值,判断是否屏蔽... 为了保护用户敏感信息,能够进行有效的数据分析和决策制定,突出数据挖掘过程的加速比与准确率,提出一种海量异构资源敏感信息时间序列数据挖掘算法.利用TF-IDF计算异构网络敏感信息的特征向量,根据敏感信息特征提取的阈值,判断是否屏蔽敏感信息特征值,从而过滤掉异构网络中的敏感信息.利用标记向量初始化聚类中心,将每一个特征点依次分配到各自聚类中,重新计算敏感信息的聚类中心,对异构网络资源敏感信息进行聚类处理.为了提高挖掘准确性,算法进行标准化处理,并根据偏好函数对敏感信息时间序列进行加权处理.通过对时间序列数据的偏好流进行排序,计算出时间序列数据的净偏好流,按照不同偏好级别,挖掘出异构网络敏感信息的时间序列.实验结果表明,文中算法在挖掘敏感信息时间序列时的加速比更高,敏感信息时间序列数据挖掘准确率最高达98%.在加速性能和准确率方面具有显著优势,可以更有效地进行敏感信息的挖掘和处理. 展开更多
关键词 异构网络 时间序列 数据挖掘 敏感信息 多级纵深过滤 聚类中心
下载PDF
大模型敏感信息泄露攻击的常见手段与防御策略探索
15
作者 王佳音 《中国金融电脑》 2024年第9期74-76,共3页
近年来,随着大模型技术的广泛应用,与之相关的信息安全事件频发,引起业界的广泛关注。攻击者利用各种手段,如恶意序列注入、角色扮演、伪造上下文等,企图从智能系统中套取敏感信息。这些攻击手段不仅威胁个人信息的安全,而且可能对整个... 近年来,随着大模型技术的广泛应用,与之相关的信息安全事件频发,引起业界的广泛关注。攻击者利用各种手段,如恶意序列注入、角色扮演、伪造上下文等,企图从智能系统中套取敏感信息。这些攻击手段不仅威胁个人信息的安全,而且可能对整个组织机构造成不可估量的损害。本文深入剖析当前针对大模型的敏感信息泄露攻击手段,并提出切实可行的防御策略,旨在加固大模型的安全防线,保障用户数据安全。 展开更多
关键词 信息泄露 攻击手段 信息安全事件 数据安全 防御策略 敏感信息 智能系统 策略探索
下载PDF
基于多元线性回归数学模型的通信敏感信息快速识别方法
16
作者 郑真真 段晓辉 《长江信息通信》 2024年第3期52-54,共3页
常规的通信敏感信息识别方法以敏感词语识别为主,忽略了图片、文本、语音等通信敏感信息,影响最终的信息识别效果。因此,设计了基于多元线性回归数学模型的通信敏感信息快速识别方法。提取通信信息敏感性特征,对通信敏感信息的表现形式... 常规的通信敏感信息识别方法以敏感词语识别为主,忽略了图片、文本、语音等通信敏感信息,影响最终的信息识别效果。因此,设计了基于多元线性回归数学模型的通信敏感信息快速识别方法。提取通信信息敏感性特征,对通信敏感信息的表现形式进行分析,相同表现形式的信息统一分类,避免信息之间的相互干扰问题。基于多元线性回归数学模型分级识别敏感文档,过滤掉意思表达不清晰或有歧义的信息,并将信息的敏感性进行合并,得到通信信息的敏感性度量,从而快速识别通信信息的敏感性分级。标注通信敏感信息识别序列,根据敏感信息的敏感性标注,赋予对应的标签作为识别序列,按照标注序列逐级识别信息,从而满足敏感信息识别的完整性需求。采用对比实验,验证了该方法的敏感信息识别精准度更高,能够应用于实际生活中。 展开更多
关键词 多元线性回归数学模型 通信 敏感信息 快速识别方法
下载PDF
基于Elmo的高层语义敏感信息识别方法研究
17
作者 陈紫琴 吴鹏 李乐成 《长江信息通信》 2024年第7期119-122,共4页
社交媒体的不断发展使得网络上充斥着大量的信息,然而网络的开放性也导致了容易传播涉政敏感信息。在这样的背景下,如何高效准确地筛查出这些涉政敏感信息成为当前迫切需要解决的问题。本文旨在提出一种基于深度学习的语义层级敏感信息... 社交媒体的不断发展使得网络上充斥着大量的信息,然而网络的开放性也导致了容易传播涉政敏感信息。在这样的背景下,如何高效准确地筛查出这些涉政敏感信息成为当前迫切需要解决的问题。本文旨在提出一种基于深度学习的语义层级敏感信息识别方法,以应对这一挑战。将输入的文本以基于Elmo的方法生成动态词向量,建立基于高层语义的细到粗策略和基于多上下文的混合模型,再通过基于关联规则的变体词识别算法得到识别结果。经实验证明,在新浪微博数据集上,文章提出的方法有较好的效果。尤其值得注意的是,基于Elmo的动态词向量生成方法相比传统的word2vec和glove表示法具有更突出的效果,这表明了Elmo技术在敏感信息识别任务中的潜力和优势。 展开更多
关键词 文本检测 词向量生成 敏感信息识别 自然语言处理 深度学习
下载PDF
基于SSI-GuidedLDA模型的引导式网络敏感信息识别研究 被引量:2
18
作者 吴树芳 杨强 +1 位作者 侯晓舟 尹萌 《情报杂志》 CSSCI 北大核心 2023年第11期119-125,共7页
[研究目的]引导式主题模型可以引导生成有倾向性的敏感主题,提高网络敏感信息识别性能,对维护国家安全和社会稳定具有重要意义。[研究方法]针对当前网络敏感信息识别研究构建敏感信息特征不全面和不准确,从而导致识别性能欠佳的问题,提... [研究目的]引导式主题模型可以引导生成有倾向性的敏感主题,提高网络敏感信息识别性能,对维护国家安全和社会稳定具有重要意义。[研究方法]针对当前网络敏感信息识别研究构建敏感信息特征不全面和不准确,从而导致识别性能欠佳的问题,提出基于SSI-GuidedLDA模型的引导式网络敏感信息识别方法。首先,从多源网络资源中爬取敏感种子词,并基于词向量模型Word2Vec获得种子词的敏感语义相关词,构建更为完备、准确的敏感特征。其次,将构建的敏感特征融入引导式主题模型,得到改进后的模型SSI-GuidedLDA。最后,基于SSI-GuidedLDA模型获得待识别信息的主题分布,通过主题分布概率判断其是否为网络敏感信息。[研究结论]在新浪微博数据集上的实验结果显示,与已有方法相比,提出的方法在准确率、召回率和F 1值上均有一定提高。 展开更多
关键词 敏感语义(SSI) 敏感种子词 敏感信息识别 引导式主题模型 GuidedLDA Word2Vec
下载PDF
基于层次聚类的敏感信息安全过滤模型研究 被引量:1
19
作者 金秋 林馥 裴斐 《计算机仿真》 北大核心 2023年第10期296-299,320,共5页
若恶意信息在网络广泛传播,将严重影响网民的正常上网体验,于是提出基于层次聚类的敏感信息安全过滤模型。对敏感词拆分或者组合,将个体词语组建合成为敏感词短句,利用增量式Rocchio算法明确用户感兴趣内容,凭借层次聚类算法将用户感兴... 若恶意信息在网络广泛传播,将严重影响网民的正常上网体验,于是提出基于层次聚类的敏感信息安全过滤模型。对敏感词拆分或者组合,将个体词语组建合成为敏感词短句,利用增量式Rocchio算法明确用户感兴趣内容,凭借层次聚类算法将用户感兴趣信息划分为不同类别;计算每组类别数据集中词频和位置因子,得到目标敏感级别分为绝对禁止、一般敏感和需要审核,最后对照由词表、短句构建的敏感词库,自动识别并去除互联网信息流中的敏感部分。在仿真中,所提方法得到的敏感词分布轨迹与实际轨迹高度拟合,能够证明方法过滤信息精度高,在误判率、漏判率和过滤效率方面也展现出了绝对优势。 展开更多
关键词 层次聚类 敏感信息过滤 敏感词词表 词频因子
下载PDF
融合变体字还原和语义分析的敏感信息检测 被引量:1
20
作者 路松峰 郑召作 +1 位作者 周军龙 朱建新 《湖北大学学报(自然科学版)》 CAS 2023年第6期879-887,共9页
针对传统的基于词库的敏感信息检测方法由于变体词而导致检测性能低的问题,提出一种融合变体识别和语义分析的敏感信息检测方法.首先寻找出文本中出现的变体词,再通过编辑距离和相似度计算寻找出该变体词的原词并进行替换,接着通过BERT... 针对传统的基于词库的敏感信息检测方法由于变体词而导致检测性能低的问题,提出一种融合变体识别和语义分析的敏感信息检测方法.首先寻找出文本中出现的变体词,再通过编辑距离和相似度计算寻找出该变体词的原词并进行替换,接着通过BERT作为词嵌入模型融合左右上下文信息实现深层双向的语言表征,并联合卷积神经网络与双向门控循环单元网络构建敏感信息分类模型,分别提取文本的局部语义信息和上下文信息并输入到分类器中进行敏感信息检测.最后将本文提出的模型与其他深度学习网络模型在真实的数据集上进行实验对比,结果表明该方法能更有效地检测敏感信息. 展开更多
关键词 敏感信息检测 卷积神经网络 预训练模型 双向门控循环单元 自然语言处理
下载PDF
上一页 1 2 45 下一页 到第
使用帮助 返回顶部