期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向结构化数据集的敏感属性识别与分级算法
被引量:
11
1
作者
何文竹
彭长根
+3 位作者
王毛妮
丁兴
樊玫玫
丁红发
《计算机应用研究》
CSCD
北大核心
2020年第10期3077-3082,共6页
如何对生产环境中经代码混淆的结构化数据集的敏感属性(字段)进行自动化识别、分类分级,已成为对结构化数据隐私保护的瓶颈。提出一种面向结构化数据集的敏感属性自动化识别与分级算法,利用信息熵定义了属性敏感度,通过对敏感度聚类和...
如何对生产环境中经代码混淆的结构化数据集的敏感属性(字段)进行自动化识别、分类分级,已成为对结构化数据隐私保护的瓶颈。提出一种面向结构化数据集的敏感属性自动化识别与分级算法,利用信息熵定义了属性敏感度,通过对敏感度聚类和属性间关联规则挖掘,将任意结构化数据集的敏感属性进行识别和敏感度量化;通过对敏感属性簇中属性间的互信息相关性和关联规则分析,对敏感属性进行分组并量化其平均敏感度,实现敏感属性的分类分级。实验表明,该算法可识别、分类、分级任意结构化数据集的敏感属性,效率和精确率更高;对比分析表明,该算法可同时实现敏感属性的识别与分级,无须预知属性特征、敏感特征字典,兼顾了属性间的相关性和关联关系。
展开更多
关键词
隐私保护
敏感属性识别
与分级
最大熵
关联规则
互信息
下载PDF
职称材料
基于层次化主题分析的铁路敏感数据智能识别与分类分级方法
2
作者
江文彬
刘兆霖
+2 位作者
谢仕康
傅一馨
李琪
《铁路计算机应用》
2024年第10期7-12,共6页
为了对铁路不同敏感等级数据实施差异化保护,文章提出了一种基于层次化主题分析的铁路敏感数据智能识别与分类分级方法,旨在为铁路网络数据分级保护提供依据。该方法利用数据语义和分类分级规则建立主题词库,通过主题分析初步判断数据...
为了对铁路不同敏感等级数据实施差异化保护,文章提出了一种基于层次化主题分析的铁路敏感数据智能识别与分类分级方法,旨在为铁路网络数据分级保护提供依据。该方法利用数据语义和分类分级规则建立主题词库,通过主题分析初步判断数据敏感级别。考虑到铁路网络数据的敏感级别分布不平衡,设计分级概率向量加权聚合机制,利用凝聚层次聚类算法实现准确定级。经实验验证,与基于语义和K-means聚类的传统主题分析方法相比,该方法可有效缓解分布不平衡问题,实现细粒度、动态可调整的铁路敏感数据智能识别与准确定级,从而为落实铁路网络数据分级管理要求、确保铁路网络数据安全可控提供技术支撑。
展开更多
关键词
自然语言处理
凝聚层次聚类
主题分析
铁路网络数据
敏感属性识别
数据分类分级
下载PDF
职称材料
题名
面向结构化数据集的敏感属性识别与分级算法
被引量:
11
1
作者
何文竹
彭长根
王毛妮
丁兴
樊玫玫
丁红发
机构
贵州大学计算机科学与技术学院
贵州大学公共大数据国家重点实验室
贵州大学数学与统计学院
贵州财经大学信息学院
出处
《计算机应用研究》
CSCD
北大核心
2020年第10期3077-3082,共6页
基金
国家自然科学基金资助项目(U1836205,61662009,61772008,11761020)
贵州省科技计划项目(黔科合重大专项字[2018]3001,黔科合重大专项字[2018]3007,黔科合重大专项字[2017]3002,黔科合支撑[2019]2004,黔科合支撑[2018]2162,黔科合基础[2019]1049,黔科合基础[2017]1045)
贵州财经大学科研基金资助项目(2017XJC01)。
文摘
如何对生产环境中经代码混淆的结构化数据集的敏感属性(字段)进行自动化识别、分类分级,已成为对结构化数据隐私保护的瓶颈。提出一种面向结构化数据集的敏感属性自动化识别与分级算法,利用信息熵定义了属性敏感度,通过对敏感度聚类和属性间关联规则挖掘,将任意结构化数据集的敏感属性进行识别和敏感度量化;通过对敏感属性簇中属性间的互信息相关性和关联规则分析,对敏感属性进行分组并量化其平均敏感度,实现敏感属性的分类分级。实验表明,该算法可识别、分类、分级任意结构化数据集的敏感属性,效率和精确率更高;对比分析表明,该算法可同时实现敏感属性的识别与分级,无须预知属性特征、敏感特征字典,兼顾了属性间的相关性和关联关系。
关键词
隐私保护
敏感属性识别
与分级
最大熵
关联规则
互信息
Keywords
privacy protection
sensitive attribute identification and classification
maximum entropy
association rule
mutual information
分类号
TP309 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于层次化主题分析的铁路敏感数据智能识别与分类分级方法
2
作者
江文彬
刘兆霖
谢仕康
傅一馨
李琪
机构
北京交通大学网络安全学院
中国铁道科学研究院集团有限公司电子计算技术研究所
北京经纬信息技术有限公司
出处
《铁路计算机应用》
2024年第10期7-12,共6页
基金
中国国家铁路集团有限公司科技研究开发计划(P2023W001)。
文摘
为了对铁路不同敏感等级数据实施差异化保护,文章提出了一种基于层次化主题分析的铁路敏感数据智能识别与分类分级方法,旨在为铁路网络数据分级保护提供依据。该方法利用数据语义和分类分级规则建立主题词库,通过主题分析初步判断数据敏感级别。考虑到铁路网络数据的敏感级别分布不平衡,设计分级概率向量加权聚合机制,利用凝聚层次聚类算法实现准确定级。经实验验证,与基于语义和K-means聚类的传统主题分析方法相比,该方法可有效缓解分布不平衡问题,实现细粒度、动态可调整的铁路敏感数据智能识别与准确定级,从而为落实铁路网络数据分级管理要求、确保铁路网络数据安全可控提供技术支撑。
关键词
自然语言处理
凝聚层次聚类
主题分析
铁路网络数据
敏感属性识别
数据分类分级
Keywords
Natural Language Processing(NLP)
agglomerative hierarchical clustering
topic analysis
railway information data
sensitive attribute identification
data classification and grading
分类号
U29 [交通运输工程—交通运输规划与管理]
TP39 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向结构化数据集的敏感属性识别与分级算法
何文竹
彭长根
王毛妮
丁兴
樊玫玫
丁红发
《计算机应用研究》
CSCD
北大核心
2020
11
下载PDF
职称材料
2
基于层次化主题分析的铁路敏感数据智能识别与分类分级方法
江文彬
刘兆霖
谢仕康
傅一馨
李琪
《铁路计算机应用》
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部