-
题名海量数据中用户所需信息高效查询仿真
被引量:3
- 1
-
-
作者
孙亚楠
-
机构
北华大学计算机科学技术学院
-
出处
《计算机仿真》
北大核心
2017年第8期453-456,共4页
-
文摘
用户所需信息查询方法研究,能够在海量数据堆下快速查询数据。用户所需信息的高效分类,需要组建数据特征的最优判别矩阵来完成用户所需信息高效查询。传统方法将提取的不同数据类型的多元分布特征,组建判别矩阵,但忽略了对其进行最优选择,导致查询结果不准确。提出基于特征加权组稀疏判别投影的海量数据堆积环境下的用户所需信息高效查询方法。采用社区社团检测方法将用户所需信息中的全部数据划分为不同类型的"数据团",将其集成为用户所需信息中不同数据类的主题组,以数据类内重构散度最小、类间重构散度最大为依据组建数据特征的最优投影判别矩阵,以该矩阵为依据完成对海量数据堆积环境下的用户所需信息高效查询。实验结果表明,所提方法查询精确度高,时间复杂度低,可以大幅度的提升海量数据堆积环境下的用户所需信息高效查询效率。
-
关键词
海量数据
用户所需信息
高效查询
-
Keywords
Massive data
Information Required by User
Efficient query
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名大数据中用户所需信息资源检测仿真
被引量:1
- 2
-
-
作者
张朋
-
机构
江西应用科技学院信息工程学院
-
出处
《计算机仿真》
北大核心
2017年第11期422-425,共4页
-
文摘
通过对数据缺失特征进行检测实现信息资源的有效检测,能够保证大数据中用户所需信息的完整性和准确性,对用户所需信息资源的检测,需要计算出数据特征距离,分析分配缺失数据属性特征权重,完成信息资源的检测。传统方法定义约束容差集合差异度,计算出不完备数据特征集合内全部对象的总体相异程度,但忽略了分析分配缺失数据属性特征权重,导致检测精度偏低。提出基于遗传优化的大数据中用户所需信息资源检测方法。结合遗传优化思想估计用户所需信息均值和协方差矩阵,以用户所需信息的对数似然函数作为目标函数,通过已有缺失数据样本获得参数的相应约束条件,建立大数据中缺失数据估计模型,消除用户所需信息量纲的影响,计算出数据特征的距离,利用聚类分析分配缺失数据属性特征权重,完成大数据中用户所需信息资源检测。实验结果表明,所提方法具有较高的填补准确性,且可扩展性较强。
-
关键词
大数据
用户所需信息
资源检测
-
Keywords
Big data
Information required by users
Resource detection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-