-
题名非结构化文档敏感数据识别与异常行为分析
被引量:10
- 1
-
-
作者
喻波
王志海
孙亚东
谢福进
安鹏
-
机构
北京明朝万达科技股份有限公司
-
出处
《智能系统学报》
CSCD
北大核心
2021年第5期931-939,共9页
-
基金
国家火炬计划项目(2011GH010018)
国家电子发展基金项目(工信部财【2014】425号).
-
文摘
在海量数据中快速、准确地对数据进行分类分级,快速识别用户异常行为是目前数据安全领域的重要研究内容。在数据分类分级研究领域,自然语言处理技术提升了分类分级的准确率,但是中文语体混杂、无监督学习准确率低、有监督学习样本标注工作量大等问题亟待取得关键突破。本文提出多元中文语言模型和基于无监督算法构建样本,突破数据分类分级领域面临的关键问题。在用户异常行为分析研究领域,由于样本依赖度过高,导致异常行为识别准确率较低,本文提出利用离群点检测方法构建异常行为样本库,解决样本依赖过高问题。为验证方法可行性,进一步构建实验系统开展实验分析,通过实验验证所提出方法可以显著提高数据分类分级和异常行为分析的准确率。
-
关键词
数据安全
人工智能
分类分级
语言模型
用户异常行为分析
样本
自然语言处理
监督学习
-
Keywords
data security
artificial intelligence
classification
language model
user’s behavior analysis
sample
nlp
supervised learning
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
TP319
[自动化与计算机技术—计算机软件与理论]
-