-
题名面向缺损数据的(α,k)-匿名模型
被引量:2
- 1
-
-
作者
张王策
范菁
王渤茹
倪旻
-
机构
云南民族大学电气信息工程学院
-
出处
《计算机科学》
CSCD
北大核心
2020年第S01期395-399,共5页
-
基金
国家自然科学基金项目(61540063)
云南省应用基础研究计划项目(2016FD058,2018FD055)
云南民族大学校级教学质量工程建设项目(2018JWC-JG-30)。
-
文摘
在数据集对外发布之前,需要对数据集的准标识符属性进行匿名,以防遭受链接攻击。然而现有的数据匿名算法都是面向完整数据进行,对于数据集中含有缺损数据的元组会进行直接删除操作,降低了数据的可用性。文中提出将缺损数据与完整数据混合匿名的算法,并且结合了(α,k)-匿名算法。实验得出的数据充分证明:改进后的面向缺损数据的(α,k)-匿名模型有效提升了匿名后数据的可用性,实现了数据匿名。
-
关键词
(α
k)-匿名模型
K-匿名
泛化/隐匿
缺损数据
-
Keywords
(α
k)-anonymous model
k-anonymous
Generalization/concealment
Missing data
-
分类号
TP319.9
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于深度神经决策森林的新闻标题分类
被引量:2
- 2
-
-
作者
王渤茹
范菁
张王策
李晨光
倪旻
-
机构
云南民族大学电气信息工程学院
云南民族大学云南省高校信息与通信安全灾备重点实验室
-
出处
《云南民族大学学报(自然科学版)》
CAS
2020年第5期472-479,共8页
-
基金
国家自然科学基金(61540063)
云南省应用基础研究计划(2016FD058,2018FD055)
+1 种基金
云南省教育厅科学研究基金(2017ZDX045)
云南民族大学科学研究基金(2017QN02)。
-
文摘
由于短文本特征较少,传统的机器学习方法直接应用到短文本分类上,准确率往往不高.新闻标题相较于一般的短文本来说特征更少,在分类过程中难以提高准确率.首先采用3种方式对新闻标题的特征进行扩展,包括采用word2vec的方法寻找新闻标题中每个词在语义空间最相近的词,将最相近的词作为标题扩展词;采用fp-growth方法挖掘外部语料库的频繁项对新闻标题进行扩展;字向量和词向量两种标题表达方式扩展语义信息.其次提出了深度神经决策森林的分类算法.实验结果表明使用字词向量的双路卷积神经网络相对于单一词向量的卷积神经网络特征提取能力更强;使用深度神经决策森林算法在扩展后新闻标题验证集上的分类准确率达82.2%,比仅采用双路卷积神经网络分类的准确率提高约百分之二.
-
关键词
新闻标题
特征扩展
频繁词项挖掘
卷积神经网络
决策森林分类
-
Keywords
news titles
feature extension
frequent item set mining
convolutional neural networks
decision forest classification
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-