期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
面向结构化数据集的敏感属性识别与分级算法 被引量:11
1
作者 何文竹 彭长根 +3 位作者 王毛妮 丁兴 樊玫玫 丁红发 《计算机应用研究》 CSCD 北大核心 2020年第10期3077-3082,共6页
如何对生产环境中经代码混淆的结构化数据集的敏感属性(字段)进行自动化识别、分类分级,已成为对结构化数据隐私保护的瓶颈。提出一种面向结构化数据集的敏感属性自动化识别与分级算法,利用信息熵定义了属性敏感度,通过对敏感度聚类和... 如何对生产环境中经代码混淆的结构化数据集的敏感属性(字段)进行自动化识别、分类分级,已成为对结构化数据隐私保护的瓶颈。提出一种面向结构化数据集的敏感属性自动化识别与分级算法,利用信息熵定义了属性敏感度,通过对敏感度聚类和属性间关联规则挖掘,将任意结构化数据集的敏感属性进行识别和敏感度量化;通过对敏感属性簇中属性间的互信息相关性和关联规则分析,对敏感属性进行分组并量化其平均敏感度,实现敏感属性的分类分级。实验表明,该算法可识别、分类、分级任意结构化数据集的敏感属性,效率和精确率更高;对比分析表明,该算法可同时实现敏感属性的识别与分级,无须预知属性特征、敏感特征字典,兼顾了属性间的相关性和关联关系。 展开更多
关键词 隐私保护 敏感属性识别与分级 最大熵 关联规则 互信息
下载PDF
基于层次化主题分析的铁路敏感数据智能识别与分类分级方法
2
作者 江文彬 刘兆霖 +2 位作者 谢仕康 傅一馨 李琪 《铁路计算机应用》 2024年第10期7-12,共6页
为了对铁路不同敏感等级数据实施差异化保护,文章提出了一种基于层次化主题分析的铁路敏感数据智能识别与分类分级方法,旨在为铁路网络数据分级保护提供依据。该方法利用数据语义和分类分级规则建立主题词库,通过主题分析初步判断数据... 为了对铁路不同敏感等级数据实施差异化保护,文章提出了一种基于层次化主题分析的铁路敏感数据智能识别与分类分级方法,旨在为铁路网络数据分级保护提供依据。该方法利用数据语义和分类分级规则建立主题词库,通过主题分析初步判断数据敏感级别。考虑到铁路网络数据的敏感级别分布不平衡,设计分级概率向量加权聚合机制,利用凝聚层次聚类算法实现准确定级。经实验验证,与基于语义和K-means聚类的传统主题分析方法相比,该方法可有效缓解分布不平衡问题,实现细粒度、动态可调整的铁路敏感数据智能识别与准确定级,从而为落实铁路网络数据分级管理要求、确保铁路网络数据安全可控提供技术支撑。 展开更多
关键词 自然语言处理 凝聚层次聚类 主题分析 铁路网络数据 敏感属性识别 数据分类分级
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部