期刊文献+
共找到53篇文章
< 1 2 3 >
每页显示 20 50 100
Research on the big data feature mining technology based on the cloud computing
1
作者 WANG Yun 《International English Education Research》 2019年第3期52-54,共3页
The cloud computing platform has the functions of efficiently allocating the dynamic resources, generating the dynamic computing and storage according to the user requests, and providing the good platform for the big ... The cloud computing platform has the functions of efficiently allocating the dynamic resources, generating the dynamic computing and storage according to the user requests, and providing the good platform for the big data feature analysis and mining. The big data feature mining in the cloud computing environment is an effective method for the elficient application of the massive data in the information age. In the process of the big data mining, the method o f the big data feature mining based on the gradient sampling has the poor logicality. It only mines the big data features from a single-level perspective, which reduces the precision of the big data feature mining. 展开更多
关键词 CLOUD COMPUTING big data features MINING technology model method
下载PDF
Filter and Embedded Feature Selection Methods to Meet Big Data Visualization Challenges 被引量:1
2
作者 Kamal A.ElDahshan AbdAllah A.AlHabshy Luay Thamer Mohammed 《Computers, Materials & Continua》 SCIE EI 2023年第1期817-839,共23页
This study focuses on meeting the challenges of big data visualization by using of data reduction methods based the feature selection methods.To reduce the volume of big data and minimize model training time(Tt)while ... This study focuses on meeting the challenges of big data visualization by using of data reduction methods based the feature selection methods.To reduce the volume of big data and minimize model training time(Tt)while maintaining data quality.We contributed to meeting the challenges of big data visualization using the embedded method based“Select from model(SFM)”method by using“Random forest Importance algorithm(RFI)”and comparing it with the filter method by using“Select percentile(SP)”method based chi square“Chi2”tool for selecting the most important features,which are then fed into a classification process using the logistic regression(LR)algorithm and the k-nearest neighbor(KNN)algorithm.Thus,the classification accuracy(AC)performance of LRis also compared to theKNN approach in python on eight data sets to see which method produces the best rating when feature selection methods are applied.Consequently,the study concluded that the feature selection methods have a significant impact on the analysis and visualization of the data after removing the repetitive data and the data that do not affect the goal.After making several comparisons,the study suggests(SFMLR)using SFM based on RFI algorithm for feature selection,with LR algorithm for data classify.The proposal proved its efficacy by comparing its results with recent literature. 展开更多
关键词 Data Redaction features selection Select from model Select percentile big data visualization data visualization
下载PDF
Geological Database for Plate Tectonic Reconstruction:A Conceptual Model
3
作者 WANG Ping LIU Shaofeng 《Acta Geologica Sinica(English Edition)》 SCIE CAS CSCD 2019年第S01期66-69,共4页
We all live on one planet and geology has no borders.Countries that reside on different continents share the same architecture beneath the surface;they were once neighbors with common foundations.Interoperable geologi... We all live on one planet and geology has no borders.Countries that reside on different continents share the same architecture beneath the surface;they were once neighbors with common foundations.Interoperable geological data are now freely available to everyone for the benefit of society,demonstrating that geoscience can address both global and regional problems.Whilst increasingly large datasets("Big Data")provide clear opportunities(e.g.,Spina,2018). 展开更多
关键词 PLATE TECTONIC RECONSTRUCTION big DATA GML DATA model feature class
下载PDF
不确定大数据流分类的决策树模型构建仿真
4
作者 杨知玲 谭树杰 《计算机仿真》 2024年第5期532-535,542,共5页
在不确定大数据流分类过程中,受噪声和孤立点的干扰,导致处理效果和分类精度无法达到预期要求。为解决上述问题,提出一种基于决策树模型的不确定大数据流分类算法。通过采用在线字典学习算法,对不确定大数据流去噪处理,消除噪声对分类... 在不确定大数据流分类过程中,受噪声和孤立点的干扰,导致处理效果和分类精度无法达到预期要求。为解决上述问题,提出一种基于决策树模型的不确定大数据流分类算法。通过采用在线字典学习算法,对不确定大数据流去噪处理,消除噪声对分类过程产生的干扰。构建决策树,在剪枝过程中通过特征过滤算法,滤除不确定大数据流中掺杂的孤立点。将去噪后的不确定大数据流,输入决策树模型中,完成分类工作。实验结果表明,所提算法处理后的不确定大数据流振幅明显减小,且分类精度高,具有一定的应用价值。 展开更多
关键词 决策树模型 在线字典学习算法 特征过滤 不确定大数据流 数据分类
下载PDF
面向并行大数据网络中传感节点定位异常识别
5
作者 盛波 张跃进 《传感技术学报》 CSCD 北大核心 2024年第12期2159-2164,共6页
并行大数据传感网络通常具有复杂的拓扑结构以及较多的节点数量,在大数据干扰和复杂性干扰下,影响传感网络异常节点识别的可靠性。为此,提出面向并行大数据网络中传感节点定位异常识别方法。建立布尔模型计算节点传输信道覆盖半径,根据... 并行大数据传感网络通常具有复杂的拓扑结构以及较多的节点数量,在大数据干扰和复杂性干扰下,影响传感网络异常节点识别的可靠性。为此,提出面向并行大数据网络中传感节点定位异常识别方法。建立布尔模型计算节点传输信道覆盖半径,根据载波调制方法估计传输信道中的特征参量,建立传感节点之间通信传输信道模型,获取节点状态及分布情况。构建分布式传感序列采样模型,采集传感节点特征序列,利用压缩感知方法实现对传感节点定位的异常识别。仿真结果表明,所提方法识别异常节点的能耗始终低于3 J,平均识别误差未超过0.35%,节点定位精度高于95%,识别传感异常节点的运行时间在2 ms以下,能够有效延长并行大数据网络的寿命。 展开更多
关键词 传感节点 定位异常识别 压缩感知 并行大数据网络 布尔模型 特征采集
下载PDF
基于大数据的学生行为模型分析研究
6
作者 王以伍 蒋守花 曾满江 《长江信息通信》 2024年第3期102-104,107,共4页
本研究旨在基于大数据技术,对大学生的行为模型进行分析和研究。通过收集包括一卡通消费、宿舍门禁、选课记录、社交媒体活动等多种数据,以及其他可能影响学生行为的因素,如图书借阅、网络登陆等,构建大学生行为相关模型。研究采用统计... 本研究旨在基于大数据技术,对大学生的行为模型进行分析和研究。通过收集包括一卡通消费、宿舍门禁、选课记录、社交媒体活动等多种数据,以及其他可能影响学生行为的因素,如图书借阅、网络登陆等,构建大学生行为相关模型。研究采用统计学、机器学习和数据挖掘等方法对数据进行处理和分析,探索大学生行为中的关键因素和潜在趋势。通过预测模型的建立,可以预测学生的孤僻度、亲密度、疑似贫困生等重要指标,为学校和教师提供更科学有效的教学指导和个性化辅导。 展开更多
关键词 大数据 模型 数据采集 特征
下载PDF
基于大数据分析的网络安全威胁检测与防范研究
7
作者 白进东 《科学与信息化》 2024年第16期22-24,共3页
本文探讨了基于大数据分析的网络安全威胁检测与防范方法,通过分析基于大数据分析的信息安全技术的原理和优缺点,阐述网络安全威胁检测与防范的关键技术,提出利用大数据分析技术提升网络安全威胁检测和防范能力的策略,从数据采集与处理... 本文探讨了基于大数据分析的网络安全威胁检测与防范方法,通过分析基于大数据分析的信息安全技术的原理和优缺点,阐述网络安全威胁检测与防范的关键技术,提出利用大数据分析技术提升网络安全威胁检测和防范能力的策略,从数据采集与处理、特征提取与选取、模型构建与培训、威胁探测与预防4个方面,对大数据环境下的网络安全威胁进行了研究,总结了基于大数据分析的网络安全威胁检测与防范的有效手段。本研究旨在为网络安全管理提供更加高效、智能的解决方案,应对不断演变的网络威胁。 展开更多
关键词 网络安全 大数据分析 威胁检测 数据处理 特征提取 模型训练 安全管理 技术应用
下载PDF
基于数据的流程工业生产过程指标预测方法综述 被引量:31
8
作者 陈龙 刘全利 +2 位作者 王霖青 赵珺 王伟 《自动化学报》 EI CSCD 北大核心 2017年第6期944-954,共11页
生产过程关键指标的预测对于流程工业生产调度,安全生产和节能环保有着重要作用.目前,已有多种基于工业生产数据提出的生产过程指标预测方法,主要涉及特征(变量)选择,预测模型构建及其模型参数优化这三方面.本文分别针对以上三方面论述... 生产过程关键指标的预测对于流程工业生产调度,安全生产和节能环保有着重要作用.目前,已有多种基于工业生产数据提出的生产过程指标预测方法,主要涉及特征(变量)选择,预测模型构建及其模型参数优化这三方面.本文分别针对以上三方面论述了基于数据的工业生产过程指标预测国内外研究现状,分析了各种方法的优缺点.最后,指出了流程工业生产过程指标预测方法在工业大数据及知识自动化等方面的未来研究方向和前景. 展开更多
关键词 生产过程 特征选择 预测模型 参数优化 工业大数据
下载PDF
大数据驱动的投诉预测模型 被引量:12
9
作者 周文杰 杨璐 严建峰 《计算机科学》 CSCD 北大核心 2016年第7期217-223,共7页
随着电信行业市场竞争的不断加剧,用户对服务质量要求逐步提高,导致用户投诉率不断攀升。在此情况下,通过准确预测用户投诉行为来降低用户投诉率成为运营商关注的重点。目前传统的投诉预测模型仅从分类算法和人工调研特征来讨论,而没有... 随着电信行业市场竞争的不断加剧,用户对服务质量要求逐步提高,导致用户投诉率不断攀升。在此情况下,通过准确预测用户投诉行为来降低用户投诉率成为运营商关注的重点。目前传统的投诉预测模型仅从分类算法和人工调研特征来讨论,而没有充分利用运营商的大数据。因此,提出了在Hadoop/Spark大数据平台上使用并行随机森林来构建用户预测投诉模型,它不仅用到了业务支持系统数据,而且还用到了运营支持系统数据和客服工单数据,并在此基础上进一步增加了反映用户相互关系的图特征和二阶特征。基于上海市某运营商数据的实验结果表明,利用多来源、高维度的特征来训练用户投诉预测模型的精度会明显高于传统方法,在此基础上有针对性地对目标用户采取安抚措施,可以降低用户投诉率,获得较高的商业价值。 展开更多
关键词 大数据 投诉预测模型 特征工程 二阶特征 图特征 随机森林
下载PDF
大数据网络环境下舆情信息情感维度模型构建研究 被引量:16
10
作者 刘英杰 黄微 李瑞 《情报理论与实践》 CSSCI 北大核心 2016年第4期32-35,共4页
网络舆情信息所表象及内隐的情感数据是其发生、发展和消亡的重要演变信号。文章在情感维度理论和离散情感理论的基础上,构建了网络舆情信息的情感维度模型,并通过实证研究分析模型内涵、各维要素的特征及相互关系,进一步阐释该模型中... 网络舆情信息所表象及内隐的情感数据是其发生、发展和消亡的重要演变信号。文章在情感维度理论和离散情感理论的基础上,构建了网络舆情信息的情感维度模型,并通过实证研究分析模型内涵、各维要素的特征及相互关系,进一步阐释该模型中情感发展演变过程及其规律,从而为大数据网络舆情信息的分级监测和危机预警提供有益参考。 展开更多
关键词 大数据 网络舆情 情感特征 理论模型 实证研究
下载PDF
非结构化数据特征建模关键技术研究 被引量:6
11
作者 蔡宇翔 付婷 +2 位作者 倪时龙 苏江文 刘心 《电网与清洁能源》 北大核心 2017年第1期13-17,23,共6页
在智能电网大数据中,非结构化数据占据比例最大,且增速是结构化数据的10~50倍,已成为智能电网大数据处理的关键技术。针对非结构化数据存在数量巨大、模式滞后问题,基于现实数据存在的诸多特征,提出来非结构化数据特征模型建模。文中重... 在智能电网大数据中,非结构化数据占据比例最大,且增速是结构化数据的10~50倍,已成为智能电网大数据处理的关键技术。针对非结构化数据存在数量巨大、模式滞后问题,基于现实数据存在的诸多特征,提出来非结构化数据特征模型建模。文中重点论述了基于智能电网大数据的非结构化数据特征建模的关键技术,包括原始数据以及特征数据的存储、查询以及数据可视化、特征空间的选取等。 展开更多
关键词 智能电网大数据 非结构化数据 特征建模 关键技术
下载PDF
大数据下最优教学方式选取模型设计 被引量:5
12
作者 许健松 游晓东 《沈阳工业大学学报》 EI CAS 北大核心 2018年第6期664-669,共6页
为了获取关联性较强、数据融合精度较高的最优教学模式,提出依据数据估计量变化的最优教学方式选取模型设计方法.对不同服务器大数据信息进行分段,利用前半段数据进行曲线拟合,后半段数据进行直线拟合.预测高噪声干扰数据,分析干扰数据... 为了获取关联性较强、数据融合精度较高的最优教学模式,提出依据数据估计量变化的最优教学方式选取模型设计方法.对不同服务器大数据信息进行分段,利用前半段数据进行曲线拟合,后半段数据进行直线拟合.预测高噪声干扰数据,分析干扰数据点滤除前后统计量的变化,构建由数据源整合、数据拟合、滤除干扰三方面相结合的最优教学方式选取模型并进行相关性计算.利用调整系数进一步提高了模型精度.结果表明,所设计模型的表达能力较强,复杂度不高,可精准、快速地实现最优教学方式的选取. 展开更多
关键词 大数据 数据拟合 滤除干扰 模型设计 数据挖掘 分段处理 特征选取 教学方式
下载PDF
大数据下监控网络混合入侵信息检索仿真 被引量:18
13
作者 何保荣 《沈阳工业大学学报》 EI CAS 北大核心 2019年第6期654-658,共5页
针对传统的监控入侵信息检索方法存在检索精度低、召回率高、检索耗时长等问题,提出一种大数据下监控网络混合入侵信息检索方法.采用遗传算法对特征集进行优化选择,引入偏F检验对选择最优子集,组成优化特征集,并构建冗余信息消除模型,... 针对传统的监控入侵信息检索方法存在检索精度低、召回率高、检索耗时长等问题,提出一种大数据下监控网络混合入侵信息检索方法.采用遗传算法对特征集进行优化选择,引入偏F检验对选择最优子集,组成优化特征集,并构建冗余信息消除模型,消除混合入侵信息中的冗余信息.以信息检索理论为依据,引用LDA模型对文档的话题进行建模,构建入侵信息检索模型,完成大数据下监控网络混合入侵信息检索.结果表明,所提方法的检索精度较高,能够有效提高入侵信息检索效率,降低检索耗时,且召回率平均值约为24%,优于其他方法,具有一定可行性. 展开更多
关键词 大数据 监控网络 混合入侵信息 冗余 检索 特征集 LDA模型 召回率
下载PDF
基于智能化公文主题分析的我国政策层级扩散倾向性研究 被引量:16
14
作者 王芳 徐路路 《情报学报》 CSSCI CSCD 北大核心 2021年第4期387-401,共15页
政策创新通过公文流转得以实施和扩散。在大数据背景下,运用政策文本挖掘分析我国不同层级政府间的政策扩散过程,对于了解政策实施效果,推进数字政府建设和提升政府治理能力具有重要意义。然而,当前面向我国政府公文智能处理和政策层级... 政策创新通过公文流转得以实施和扩散。在大数据背景下,运用政策文本挖掘分析我国不同层级政府间的政策扩散过程,对于了解政策实施效果,推进数字政府建设和提升政府治理能力具有重要意义。然而,当前面向我国政府公文智能处理和政策层级扩散的研究尚未广泛展开。因此,本文通过分析公文文本的结构和内容特征属性,从政策扩散主题维度和政策扩散倾向性两个方面展开研究,尝试分析政策发布时间、布局数量、政策主题强度、执行部门数量等多个维度,构建了一种基于多特征融合的政策扩散倾向性探测模型。同时,本文设计了一种新的针对我国政策层级扩散的可视化图谱,以清晰表达政策在中央、省级以及地市级的主题扩散与变迁。最后,本文以我国大数据政策为例进行了实验,通过大规模政府公文的智能处理与层级扩散倾向性探测,为政策制定者和执行者提供情报支撑和决策参考服务。 展开更多
关键词 政策扩散 倾向性 政府公文 主题分析 多特征融合模型 大数据政策
下载PDF
灌阳县丧葬仪式“大歌”的模式性结构特征 被引量:1
15
作者 陆栋梁 《广西民族师范学院学报》 2014年第1期14-17,共4页
灌阳县丧葬仪式"大歌"结构庞大,具有一定的结构模式。其中,存在一个大模式和一个小模式。大模式体现的是在总体结构上的固定程序,是[大歌]演唱的总体程式;小模式体现的是在局部结构上所形成的固定框架或格式,是单首大歌的结... 灌阳县丧葬仪式"大歌"结构庞大,具有一定的结构模式。其中,存在一个大模式和一个小模式。大模式体现的是在总体结构上的固定程序,是[大歌]演唱的总体程式;小模式体现的是在局部结构上所形成的固定框架或格式,是单首大歌的结构框格。大模式中套有诸多小模式,灌阳县"大歌"的结构是一个由三重模式复合而成的复模式结构。这是"大歌"庞大结构的骨架。 展开更多
关键词 “大歌”的模式性 大模式 小模式 复模式 总体程式 局部框格
下载PDF
基于大数据的人体行为特征方向估计模型仿真 被引量:1
16
作者 刘静 《计算机仿真》 北大核心 2019年第9期422-425,451,共5页
由于人体运动过程中行为的多样性以及复杂性,导致人体行为特征方向估计模型的效果不理想、准确率偏低等问题。为此,构建基于大数据的人体行为特征方向估计模型。通过人体运动图像中的深度信息分别计算出不同像素点在水平方向和垂直方向... 由于人体运动过程中行为的多样性以及复杂性,导致人体行为特征方向估计模型的效果不理想、准确率偏低等问题。为此,构建基于大数据的人体行为特征方向估计模型。通过人体运动图像中的深度信息分别计算出不同像素点在水平方向和垂直方向的梯度值,再计算不同像素点与邻域像素点之间的差值,获取人体行为特征。对图像中的关键参数进行自适应处理,利用遗传算法对关键参数进行寻优,并构建基于大数据的人体行为特征方向估计模型。实验结果表明,与传统的人体行为特征方向估计模型相比,所提估计模型在人体行为特征方向估计效果以及准确率方面都有较大幅度的提升。 展开更多
关键词 大数据 人体行为 特征方向 估计模型
下载PDF
基于多特征融合和机器学习的疾病基因检测大数据分类模型 被引量:4
17
作者 高媛媛 《微型电脑应用》 2023年第3期25-27,39,共4页
采用目前方法对疾病基因检测大数据进行分类时,没有对提取特征进行融合处理,存在正确分类率低、病情反映能力低和分类效率低的问题。为此提出基于多特征融合和机器学习的疾病基因检测大数据分类模型构建方法,提取疾病基因图像的粗糙度... 采用目前方法对疾病基因检测大数据进行分类时,没有对提取特征进行融合处理,存在正确分类率低、病情反映能力低和分类效率低的问题。为此提出基于多特征融合和机器学习的疾病基因检测大数据分类模型构建方法,提取疾病基因图像的粗糙度特征、对比度特征和方向度特征,采用主成分分析方法融合提取的特征,在机器学习原理的基础上构建疾病基因检测大数据分类模型,将融合后的特征输入模型中,完成疾病基因检测大数据的分类。实验结果表明,所提方法的正确分类率高、病情反映能力强、分类效率高。 展开更多
关键词 多特征融合 机器学习 疾病基因检测 特征提取 大数据分类模型
下载PDF
基于大数据分析技术的电子商务供应商选择研究 被引量:6
18
作者 徐杨 《现代电子技术》 北大核心 2020年第15期152-154,158,共4页
针对电子商务供应商原有选择方法特征抓取不全面的问题,提出大数据分析技术的电子商务供应商智能选择方法。过滤并优化外部信息,减少无效数据干扰,分析供应商选择的影响因素,根据电子商务特性搭建供应商选择指标体系,采用层次分析法确... 针对电子商务供应商原有选择方法特征抓取不全面的问题,提出大数据分析技术的电子商务供应商智能选择方法。过滤并优化外部信息,减少无效数据干扰,分析供应商选择的影响因素,根据电子商务特性搭建供应商选择指标体系,采用层次分析法确定指标权重,建立判断矩阵,构建智能选择模型。实验结果表明,所提出的智能选择方法能够准确抓取供应商财务状况数据信息,弥补了原有方法特征抓取不全面的问题,为电子商务企业与供应商间的良好合作关系夯实了基础。 展开更多
关键词 大数据分析技术 供应商智能选择 供应商选择指标确立 智能选择模型构建 供应商特征抓取对比 智能选择可行性验证
下载PDF
宋元时期闽北青白瓷造型特征及其演变 被引量:2
19
作者 王苗苗 《三明学院学报》 2014年第5期86-89,共4页
宋元时期,闽北三明中村洄瑶窑、光泽茅店窑和光泽下史源窑的青白瓷以生活用瓷为主,在创烧期造型规整严谨,鼎盛期造型粗糙简略。具体在成型工艺上,由规范走向粗糙草率;在器物各部位造型上由规整严谨、各部位比例恰当走向粗糙简略,各部位... 宋元时期,闽北三明中村洄瑶窑、光泽茅店窑和光泽下史源窑的青白瓷以生活用瓷为主,在创烧期造型规整严谨,鼎盛期造型粗糙简略。具体在成型工艺上,由规范走向粗糙草率;在器物各部位造型上由规整严谨、各部位比例恰当走向粗糙简略,各部位存在或多或少的缺陷;在装饰造型上由在器物内外壁刻、划几何纹走向在器物内底模印花卉纹。这些都说明宋元时期闽北青白瓷的生产是以市场为导向的。 展开更多
关键词 闽北 宋元 青白瓷 造型特征 演变
下载PDF
大数据驱动下自主创新创业活跃度评估模型构建 被引量:1
20
作者 迟云平 《现代电子技术》 2021年第8期53-57,共5页
由于自主创新创业活跃度评估受到自主创新创业风险指数的影响,为提高自主创新创业活跃度的评估效果,研究大数据驱动下的自主创新创业活跃度评估模型构建。在大数据驱动的背景下,计算自主创新创业活跃度特征的物元模型,通过计算自主创新... 由于自主创新创业活跃度评估受到自主创新创业风险指数的影响,为提高自主创新创业活跃度的评估效果,研究大数据驱动下的自主创新创业活跃度评估模型构建。在大数据驱动的背景下,计算自主创新创业活跃度特征的物元模型,通过计算自主创新创业活跃度等级的关联度矩阵,提取自主创新创业活跃度特征,采用客观赋值法中的熵权法,建立自主创新创业活跃度评估的初始矩阵,结合自主创新创业活跃度评估指标差异系数,计算自主创新创业活跃度评估指标权重,最后通过构建自主创新创业活跃度评估模型,实现自主创新创业活跃度的评估。实验结果表明,在大数据驱动下的自主创新创业活跃度评估模型构建方法不会受到自主创新创业风险影响,且具有较高的自主创新创业活跃度的评估效果。 展开更多
关键词 自主创新创业 活跃度评估 评估模型 大数据驱动 特征提取 物元模型计算
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部