期刊文献+
共找到52篇文章
< 1 2 3 >
每页显示 20 50 100
Research on the big data feature mining technology based on the cloud computing
1
作者 WANG Yun 《International English Education Research》 2019年第3期52-54,共3页
The cloud computing platform has the functions of efficiently allocating the dynamic resources, generating the dynamic computing and storage according to the user requests, and providing the good platform for the big ... The cloud computing platform has the functions of efficiently allocating the dynamic resources, generating the dynamic computing and storage according to the user requests, and providing the good platform for the big data feature analysis and mining. The big data feature mining in the cloud computing environment is an effective method for the elficient application of the massive data in the information age. In the process of the big data mining, the method o f the big data feature mining based on the gradient sampling has the poor logicality. It only mines the big data features from a single-level perspective, which reduces the precision of the big data feature mining. 展开更多
关键词 CLOUD COMPUTING big data features MINING technology model method
下载PDF
Filter and Embedded Feature Selection Methods to Meet Big Data Visualization Challenges 被引量:1
2
作者 Kamal A.ElDahshan AbdAllah A.AlHabshy Luay Thamer Mohammed 《Computers, Materials & Continua》 SCIE EI 2023年第1期817-839,共23页
This study focuses on meeting the challenges of big data visualization by using of data reduction methods based the feature selection methods.To reduce the volume of big data and minimize model training time(Tt)while ... This study focuses on meeting the challenges of big data visualization by using of data reduction methods based the feature selection methods.To reduce the volume of big data and minimize model training time(Tt)while maintaining data quality.We contributed to meeting the challenges of big data visualization using the embedded method based“Select from model(SFM)”method by using“Random forest Importance algorithm(RFI)”and comparing it with the filter method by using“Select percentile(SP)”method based chi square“Chi2”tool for selecting the most important features,which are then fed into a classification process using the logistic regression(LR)algorithm and the k-nearest neighbor(KNN)algorithm.Thus,the classification accuracy(AC)performance of LRis also compared to theKNN approach in python on eight data sets to see which method produces the best rating when feature selection methods are applied.Consequently,the study concluded that the feature selection methods have a significant impact on the analysis and visualization of the data after removing the repetitive data and the data that do not affect the goal.After making several comparisons,the study suggests(SFMLR)using SFM based on RFI algorithm for feature selection,with LR algorithm for data classify.The proposal proved its efficacy by comparing its results with recent literature. 展开更多
关键词 Data Redaction features selection Select from model Select percentile big data visualization data visualization
下载PDF
Visualization Analysis for 3D Big Data Modeling
3
作者 TianChi Zhang Jing Zhang +2 位作者 JianPei Zhang HaiWei Pan Kathawach Satianpakiranakorn 《国际计算机前沿大会会议论文集》 2015年第1期63-64,共2页
This paper describes an automatic system for 3D big data of face modeling using front and side view images taken by an ordinary digital camera, whose directions are orthogonal. The paper consists of four keys in 3D vi... This paper describes an automatic system for 3D big data of face modeling using front and side view images taken by an ordinary digital camera, whose directions are orthogonal. The paper consists of four keys in 3D visualization. Firstly we study the 3D big data of face modeling including feature facial extraction from 2D images. The second part is to represent the technical from Computer Vision, Image Processing and my new method for extract information from images and create 3D model. Thirdly, 3D face modeling based on 2D image software is implemented by C# language, EMGU CV library and XNA framework. Finally, we design experiment, test and record results for measure performance of our method. 展开更多
关键词 3D big data FACE MODELING MESH MODELING FEATURE POINTS extraction
下载PDF
不确定大数据流分类的决策树模型构建仿真
4
作者 杨知玲 谭树杰 《计算机仿真》 2024年第5期532-535,542,共5页
在不确定大数据流分类过程中,受噪声和孤立点的干扰,导致处理效果和分类精度无法达到预期要求。为解决上述问题,提出一种基于决策树模型的不确定大数据流分类算法。通过采用在线字典学习算法,对不确定大数据流去噪处理,消除噪声对分类... 在不确定大数据流分类过程中,受噪声和孤立点的干扰,导致处理效果和分类精度无法达到预期要求。为解决上述问题,提出一种基于决策树模型的不确定大数据流分类算法。通过采用在线字典学习算法,对不确定大数据流去噪处理,消除噪声对分类过程产生的干扰。构建决策树,在剪枝过程中通过特征过滤算法,滤除不确定大数据流中掺杂的孤立点。将去噪后的不确定大数据流,输入决策树模型中,完成分类工作。实验结果表明,所提算法处理后的不确定大数据流振幅明显减小,且分类精度高,具有一定的应用价值。 展开更多
关键词 决策树模型 在线字典学习算法 特征过滤 不确定大数据流 数据分类
下载PDF
基于大数据的学生行为模型分析研究
5
作者 王以伍 蒋守花 曾满江 《长江信息通信》 2024年第3期102-104,107,共4页
本研究旨在基于大数据技术,对大学生的行为模型进行分析和研究。通过收集包括一卡通消费、宿舍门禁、选课记录、社交媒体活动等多种数据,以及其他可能影响学生行为的因素,如图书借阅、网络登陆等,构建大学生行为相关模型。研究采用统计... 本研究旨在基于大数据技术,对大学生的行为模型进行分析和研究。通过收集包括一卡通消费、宿舍门禁、选课记录、社交媒体活动等多种数据,以及其他可能影响学生行为的因素,如图书借阅、网络登陆等,构建大学生行为相关模型。研究采用统计学、机器学习和数据挖掘等方法对数据进行处理和分析,探索大学生行为中的关键因素和潜在趋势。通过预测模型的建立,可以预测学生的孤僻度、亲密度、疑似贫困生等重要指标,为学校和教师提供更科学有效的教学指导和个性化辅导。 展开更多
关键词 大数据 模型 数据采集 特征
下载PDF
基于大数据分析的网络安全威胁检测与防范研究
6
作者 白进东 《科学与信息化》 2024年第16期22-24,共3页
本文探讨了基于大数据分析的网络安全威胁检测与防范方法,通过分析基于大数据分析的信息安全技术的原理和优缺点,阐述网络安全威胁检测与防范的关键技术,提出利用大数据分析技术提升网络安全威胁检测和防范能力的策略,从数据采集与处理... 本文探讨了基于大数据分析的网络安全威胁检测与防范方法,通过分析基于大数据分析的信息安全技术的原理和优缺点,阐述网络安全威胁检测与防范的关键技术,提出利用大数据分析技术提升网络安全威胁检测和防范能力的策略,从数据采集与处理、特征提取与选取、模型构建与培训、威胁探测与预防4个方面,对大数据环境下的网络安全威胁进行了研究,总结了基于大数据分析的网络安全威胁检测与防范的有效手段。本研究旨在为网络安全管理提供更加高效、智能的解决方案,应对不断演变的网络威胁。 展开更多
关键词 网络安全 大数据分析 威胁检测 数据处理 特征提取 模型训练 安全管理 技术应用
下载PDF
Geological Database for Plate Tectonic Reconstruction:A Conceptual Model
7
作者 WANG Ping LIU Shaofeng 《Acta Geologica Sinica(English Edition)》 SCIE CAS CSCD 2019年第S01期66-69,共4页
We all live on one planet and geology has no borders.Countries that reside on different continents share the same architecture beneath the surface;they were once neighbors with common foundations.Interoperable geologi... We all live on one planet and geology has no borders.Countries that reside on different continents share the same architecture beneath the surface;they were once neighbors with common foundations.Interoperable geological data are now freely available to everyone for the benefit of society,demonstrating that geoscience can address both global and regional problems.Whilst increasingly large datasets("Big Data")provide clear opportunities(e.g.,Spina,2018). 展开更多
关键词 PLATE TECTONIC RECONSTRUCTION big DATA GML DATA model feature class
下载PDF
基于多特征融合和机器学习的疾病基因检测大数据分类模型 被引量:3
8
作者 高媛媛 《微型电脑应用》 2023年第3期25-27,39,共4页
采用目前方法对疾病基因检测大数据进行分类时,没有对提取特征进行融合处理,存在正确分类率低、病情反映能力低和分类效率低的问题。为此提出基于多特征融合和机器学习的疾病基因检测大数据分类模型构建方法,提取疾病基因图像的粗糙度... 采用目前方法对疾病基因检测大数据进行分类时,没有对提取特征进行融合处理,存在正确分类率低、病情反映能力低和分类效率低的问题。为此提出基于多特征融合和机器学习的疾病基因检测大数据分类模型构建方法,提取疾病基因图像的粗糙度特征、对比度特征和方向度特征,采用主成分分析方法融合提取的特征,在机器学习原理的基础上构建疾病基因检测大数据分类模型,将融合后的特征输入模型中,完成疾病基因检测大数据的分类。实验结果表明,所提方法的正确分类率高、病情反映能力强、分类效率高。 展开更多
关键词 多特征融合 机器学习 疾病基因检测 特征提取 大数据分类模型
下载PDF
基于改进K-均值联合SVDD的电力数据异常检测方法 被引量:3
9
作者 林昱奂 胡嘉铭 +1 位作者 戴伟力 黄波 《电力电容器与无功补偿》 2023年第5期99-107,共9页
电力数据高维、非线性特点导致传统单一异常检测模型存在检测准确率低、误漏报率高的问题,为了解决此问题,提出一种最小熵K-均值和果蝇算法(fruit fly optimization algorithm,FOA)优化支持向量数据描述(support vector data descriptio... 电力数据高维、非线性特点导致传统单一异常检测模型存在检测准确率低、误漏报率高的问题,为了解决此问题,提出一种最小熵K-均值和果蝇算法(fruit fly optimization algorithm,FOA)优化支持向量数据描述(support vector data description,SVDD)相结合的电力数据异常检测方法。首先提取波动性特征、变动性特征和趋势性特征并利用主成分分析(principal component analysis,PCA)进行特征变换从而实现对高维电力数据的降维表征,其次利用最小熵理论改进的K-均值算法对用电数据进行自适应聚类,将用电模式接近的用户划分为同一聚类,采样SVDD对每个聚类进行异常检测,为了提升SVDD模型聚类性能,利用改进后的变步长FOA算法对其优化,提升异常检测性能。基于某电网实测用电数据开展试验,结果表明所提方法相对于单一检测模型能够获得更高的检测准确率和更低的误漏报率。 展开更多
关键词 电力大数据 异常用电 模型优化 特征提取 数据降维
下载PDF
基于大数据分析的电网窃电行为特征自动提取模型 被引量:1
10
作者 马占海 张俊超 田光欣 《电子设计工程》 2023年第19期117-121,共5页
目前研究的电网窃电行为特征提取方法数据挖掘能力较差,导致反窃电甄别效果不理想。为了解决上述问题,提出了基于大数据分析的电网窃电行为特征自动提取模型。建立大维随机矩阵,对数据进行预处理,实现反窃电甄别,并完成输出反馈控制。... 目前研究的电网窃电行为特征提取方法数据挖掘能力较差,导致反窃电甄别效果不理想。为了解决上述问题,提出了基于大数据分析的电网窃电行为特征自动提取模型。建立大维随机矩阵,对数据进行预处理,实现反窃电甄别,并完成输出反馈控制。通过线损识别、台区识别、窃电嫌疑判断实现特征识别,利用滑动窗口提取视在功率、三相电压不平衡率、三相电流不平衡率和功率因数等特征参数,分析是否存在异常。实验结果表明,基于大数据分析的电网窃电行为特征自动提取模型能够有效确定特征值平均谱,精准地实现发窃电信息甄别。 展开更多
关键词 大数据分析 电网窃电 窃电行为 特征提取 自动提取 提取模型
下载PDF
基于特征词的教学综合评语量化研究
11
作者 陈建 向露 +1 位作者 徐晶 陆存豪 《软件导刊》 2023年第1期123-127,共5页
目前高校对课堂教学质量的评价方法较为单一,现有方法不能很好地区分不同课程教学质量的差异,专家对教师的课堂综合评语也没有得到充分利用。为有效利用教学综合评语,提出基于专业特征词与大数据特征词的两种评分模型,对教学综合评语进... 目前高校对课堂教学质量的评价方法较为单一,现有方法不能很好地区分不同课程教学质量的差异,专家对教师的课堂综合评语也没有得到充分利用。为有效利用教学综合评语,提出基于专业特征词与大数据特征词的两种评分模型,对教学综合评语进行量化打分。结果表明,基于大数据特征词的评分模型能更好地区分不同课程教学质量的差异,模型精度高达87.5%。该方法不仅能减少由于专家评价的主观性造成的误差,而且避免了传统评价方法导致的结果模糊问题,具有重要的参考价值。 展开更多
关键词 教学质量评价 综合评语量化 评分模型 专业特征词 大数据特征词
下载PDF
大数据赋能A铝厂首个五层一体钎焊板工艺开发落地
12
作者 田增产 刘欢欢 +3 位作者 郑伟 李娟 苏尧臣 魏静东 《有色金属加工》 CAS 2023年第5期15-25,共11页
首先对三层板轧制时设备、生产、工艺和质量数据进行实时采集存储,构建三层板轧制数据模型和工艺知识库;在此基础上,试验开发新五层板产品,利用三层板知识库确定监控工艺参数,持续收集工艺过程数据并进行清洗、编码与关联特征提取等预... 首先对三层板轧制时设备、生产、工艺和质量数据进行实时采集存储,构建三层板轧制数据模型和工艺知识库;在此基础上,试验开发新五层板产品,利用三层板知识库确定监控工艺参数,持续收集工艺过程数据并进行清洗、编码与关联特征提取等预处理方法获得训练/测试数据集;采用神经网络建立新工艺质量在线预测模型,对工艺参数进行评估与优化;通过应用验证表明该方法加快了新工艺落地和持续改善。 展开更多
关键词 五层一体钎焊板 工艺开发 大数据 特征提取 神经网络模型
下载PDF
基于大数据分析技术的刀具寿命预测方法探讨
13
作者 郑玮 《移动信息》 2023年第6期289-291,共3页
刀具寿命预测是制造业中的重要问题之一。传统的预测方法在准确度和效率方面存在一定的局限。随着大数据分析技术的发展,越来越多的研究者开始探讨基于大数据分析技术的刀具寿命预测方法。文中主要介绍了大数据分析技术在刀具寿命预测... 刀具寿命预测是制造业中的重要问题之一。传统的预测方法在准确度和效率方面存在一定的局限。随着大数据分析技术的发展,越来越多的研究者开始探讨基于大数据分析技术的刀具寿命预测方法。文中主要介绍了大数据分析技术在刀具寿命预测中的应用,包括数据预处理、特征提取、预测模型和结果评估等。同时,通过实例分析,比较了传统方法和大数据分析方法的预测准确率,证明了大数据分析技术在刀具寿命预测中的应用具有广阔的应用前景。 展开更多
关键词 刀具寿命预测 大数据分析 数据预处理 特征提取 预测模型
下载PDF
基于多模态数据融合的城中村社会治理大数据模型构建与算法创新
14
作者 耿亮 《信息与电脑》 2023年第19期158-160,共3页
针对城中村社会治理中信息分散、决策不准确等问题,提出一种基于多模态数据融合的大数据模型构建方法。采用多模态数据融合策略,将不同类型的数据进行融合和关联,以获取更全面、准确的城中村社会治理信息。为了实现数据融合,引入了卷积... 针对城中村社会治理中信息分散、决策不准确等问题,提出一种基于多模态数据融合的大数据模型构建方法。采用多模态数据融合策略,将不同类型的数据进行融合和关联,以获取更全面、准确的城中村社会治理信息。为了实现数据融合,引入了卷积神经网络(Convolutional Neural Networks,CNN)和长短时记忆网络(Long Short-Term Memory,LSTM)等深度学习方法,通过对不同数据模态进行特征提取和表示学习,进一步增强模型的表达能力和泛化能力。实验结果表明,与传统的方法相比,所提出的模型和算法能够更准确地预测社会问题,优化资源配置,提高城中村社会治理的效能和效果。 展开更多
关键词 城中村社会治理 多模态数据融合 大数据模型构建 特征提取
下载PDF
基于数据的流程工业生产过程指标预测方法综述 被引量:29
15
作者 陈龙 刘全利 +2 位作者 王霖青 赵珺 王伟 《自动化学报》 EI CSCD 北大核心 2017年第6期944-954,共11页
生产过程关键指标的预测对于流程工业生产调度,安全生产和节能环保有着重要作用.目前,已有多种基于工业生产数据提出的生产过程指标预测方法,主要涉及特征(变量)选择,预测模型构建及其模型参数优化这三方面.本文分别针对以上三方面论述... 生产过程关键指标的预测对于流程工业生产调度,安全生产和节能环保有着重要作用.目前,已有多种基于工业生产数据提出的生产过程指标预测方法,主要涉及特征(变量)选择,预测模型构建及其模型参数优化这三方面.本文分别针对以上三方面论述了基于数据的工业生产过程指标预测国内外研究现状,分析了各种方法的优缺点.最后,指出了流程工业生产过程指标预测方法在工业大数据及知识自动化等方面的未来研究方向和前景. 展开更多
关键词 生产过程 特征选择 预测模型 参数优化 工业大数据
下载PDF
大数据驱动的投诉预测模型 被引量:12
16
作者 周文杰 杨璐 严建峰 《计算机科学》 CSCD 北大核心 2016年第7期217-223,共7页
随着电信行业市场竞争的不断加剧,用户对服务质量要求逐步提高,导致用户投诉率不断攀升。在此情况下,通过准确预测用户投诉行为来降低用户投诉率成为运营商关注的重点。目前传统的投诉预测模型仅从分类算法和人工调研特征来讨论,而没有... 随着电信行业市场竞争的不断加剧,用户对服务质量要求逐步提高,导致用户投诉率不断攀升。在此情况下,通过准确预测用户投诉行为来降低用户投诉率成为运营商关注的重点。目前传统的投诉预测模型仅从分类算法和人工调研特征来讨论,而没有充分利用运营商的大数据。因此,提出了在Hadoop/Spark大数据平台上使用并行随机森林来构建用户预测投诉模型,它不仅用到了业务支持系统数据,而且还用到了运营支持系统数据和客服工单数据,并在此基础上进一步增加了反映用户相互关系的图特征和二阶特征。基于上海市某运营商数据的实验结果表明,利用多来源、高维度的特征来训练用户投诉预测模型的精度会明显高于传统方法,在此基础上有针对性地对目标用户采取安抚措施,可以降低用户投诉率,获得较高的商业价值。 展开更多
关键词 大数据 投诉预测模型 特征工程 二阶特征 图特征 随机森林
下载PDF
大数据网络环境下舆情信息情感维度模型构建研究 被引量:16
17
作者 刘英杰 黄微 李瑞 《情报理论与实践》 CSSCI 北大核心 2016年第4期32-35,共4页
网络舆情信息所表象及内隐的情感数据是其发生、发展和消亡的重要演变信号。文章在情感维度理论和离散情感理论的基础上,构建了网络舆情信息的情感维度模型,并通过实证研究分析模型内涵、各维要素的特征及相互关系,进一步阐释该模型中... 网络舆情信息所表象及内隐的情感数据是其发生、发展和消亡的重要演变信号。文章在情感维度理论和离散情感理论的基础上,构建了网络舆情信息的情感维度模型,并通过实证研究分析模型内涵、各维要素的特征及相互关系,进一步阐释该模型中情感发展演变过程及其规律,从而为大数据网络舆情信息的分级监测和危机预警提供有益参考。 展开更多
关键词 大数据 网络舆情 情感特征 理论模型 实证研究
下载PDF
非结构化数据特征建模关键技术研究 被引量:6
18
作者 蔡宇翔 付婷 +2 位作者 倪时龙 苏江文 刘心 《电网与清洁能源》 北大核心 2017年第1期13-17,23,共6页
在智能电网大数据中,非结构化数据占据比例最大,且增速是结构化数据的10~50倍,已成为智能电网大数据处理的关键技术。针对非结构化数据存在数量巨大、模式滞后问题,基于现实数据存在的诸多特征,提出来非结构化数据特征模型建模。文中重... 在智能电网大数据中,非结构化数据占据比例最大,且增速是结构化数据的10~50倍,已成为智能电网大数据处理的关键技术。针对非结构化数据存在数量巨大、模式滞后问题,基于现实数据存在的诸多特征,提出来非结构化数据特征模型建模。文中重点论述了基于智能电网大数据的非结构化数据特征建模的关键技术,包括原始数据以及特征数据的存储、查询以及数据可视化、特征空间的选取等。 展开更多
关键词 智能电网大数据 非结构化数据 特征建模 关键技术
下载PDF
大数据下最优教学方式选取模型设计 被引量:5
19
作者 许健松 游晓东 《沈阳工业大学学报》 EI CAS 北大核心 2018年第6期664-669,共6页
为了获取关联性较强、数据融合精度较高的最优教学模式,提出依据数据估计量变化的最优教学方式选取模型设计方法.对不同服务器大数据信息进行分段,利用前半段数据进行曲线拟合,后半段数据进行直线拟合.预测高噪声干扰数据,分析干扰数据... 为了获取关联性较强、数据融合精度较高的最优教学模式,提出依据数据估计量变化的最优教学方式选取模型设计方法.对不同服务器大数据信息进行分段,利用前半段数据进行曲线拟合,后半段数据进行直线拟合.预测高噪声干扰数据,分析干扰数据点滤除前后统计量的变化,构建由数据源整合、数据拟合、滤除干扰三方面相结合的最优教学方式选取模型并进行相关性计算.利用调整系数进一步提高了模型精度.结果表明,所设计模型的表达能力较强,复杂度不高,可精准、快速地实现最优教学方式的选取. 展开更多
关键词 大数据 数据拟合 滤除干扰 模型设计 数据挖掘 分段处理 特征选取 教学方式
下载PDF
大数据下监控网络混合入侵信息检索仿真 被引量:18
20
作者 何保荣 《沈阳工业大学学报》 EI CAS 北大核心 2019年第6期654-658,共5页
针对传统的监控入侵信息检索方法存在检索精度低、召回率高、检索耗时长等问题,提出一种大数据下监控网络混合入侵信息检索方法.采用遗传算法对特征集进行优化选择,引入偏F检验对选择最优子集,组成优化特征集,并构建冗余信息消除模型,... 针对传统的监控入侵信息检索方法存在检索精度低、召回率高、检索耗时长等问题,提出一种大数据下监控网络混合入侵信息检索方法.采用遗传算法对特征集进行优化选择,引入偏F检验对选择最优子集,组成优化特征集,并构建冗余信息消除模型,消除混合入侵信息中的冗余信息.以信息检索理论为依据,引用LDA模型对文档的话题进行建模,构建入侵信息检索模型,完成大数据下监控网络混合入侵信息检索.结果表明,所提方法的检索精度较高,能够有效提高入侵信息检索效率,降低检索耗时,且召回率平均值约为24%,优于其他方法,具有一定可行性. 展开更多
关键词 大数据 监控网络 混合入侵信息 冗余 检索 特征集 LDA模型 召回率
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部