期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
面向缺损数据的(α,k)-匿名模型 被引量:2
1
作者 张王策 范菁 +1 位作者 王渤茹 倪旻 《计算机科学》 CSCD 北大核心 2020年第S01期395-399,共5页
在数据集对外发布之前,需要对数据集的准标识符属性进行匿名,以防遭受链接攻击。然而现有的数据匿名算法都是面向完整数据进行,对于数据集中含有缺损数据的元组会进行直接删除操作,降低了数据的可用性。文中提出将缺损数据与完整数据混... 在数据集对外发布之前,需要对数据集的准标识符属性进行匿名,以防遭受链接攻击。然而现有的数据匿名算法都是面向完整数据进行,对于数据集中含有缺损数据的元组会进行直接删除操作,降低了数据的可用性。文中提出将缺损数据与完整数据混合匿名的算法,并且结合了(α,k)-匿名算法。实验得出的数据充分证明:改进后的面向缺损数据的(α,k)-匿名模型有效提升了匿名后数据的可用性,实现了数据匿名。 展开更多
关键词 k)-匿名模型 K-匿名 泛化/隐匿 缺损数据
下载PDF
基于深度神经决策森林的新闻标题分类 被引量:2
2
作者 王渤茹 范菁 +2 位作者 张王策 李晨光 倪旻 《云南民族大学学报(自然科学版)》 CAS 2020年第5期472-479,共8页
由于短文本特征较少,传统的机器学习方法直接应用到短文本分类上,准确率往往不高.新闻标题相较于一般的短文本来说特征更少,在分类过程中难以提高准确率.首先采用3种方式对新闻标题的特征进行扩展,包括采用word2vec的方法寻找新闻标题... 由于短文本特征较少,传统的机器学习方法直接应用到短文本分类上,准确率往往不高.新闻标题相较于一般的短文本来说特征更少,在分类过程中难以提高准确率.首先采用3种方式对新闻标题的特征进行扩展,包括采用word2vec的方法寻找新闻标题中每个词在语义空间最相近的词,将最相近的词作为标题扩展词;采用fp-growth方法挖掘外部语料库的频繁项对新闻标题进行扩展;字向量和词向量两种标题表达方式扩展语义信息.其次提出了深度神经决策森林的分类算法.实验结果表明使用字词向量的双路卷积神经网络相对于单一词向量的卷积神经网络特征提取能力更强;使用深度神经决策森林算法在扩展后新闻标题验证集上的分类准确率达82.2%,比仅采用双路卷积神经网络分类的准确率提高约百分之二. 展开更多
关键词 新闻标题 特征扩展 频繁词项挖掘 卷积神经网络 决策森林分类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部