期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
基于多特征融合和机器学习的疾病基因检测大数据分类模型 被引量:2
1
作者 高媛媛 《微型电脑应用》 2023年第3期25-27,39,共4页
采用目前方法对疾病基因检测大数据进行分类时,没有对提取特征进行融合处理,存在正确分类率低、病情反映能力低和分类效率低的问题。为此提出基于多特征融合和机器学习的疾病基因检测大数据分类模型构建方法,提取疾病基因图像的粗糙度... 采用目前方法对疾病基因检测大数据进行分类时,没有对提取特征进行融合处理,存在正确分类率低、病情反映能力低和分类效率低的问题。为此提出基于多特征融合和机器学习的疾病基因检测大数据分类模型构建方法,提取疾病基因图像的粗糙度特征、对比度特征和方向度特征,采用主成分分析方法融合提取的特征,在机器学习原理的基础上构建疾病基因检测大数据分类模型,将融合后的特征输入模型中,完成疾病基因检测大数据的分类。实验结果表明,所提方法的正确分类率高、病情反映能力强、分类效率高。 展开更多
关键词 多特征融合 机器学习 疾病基因检测 特征提取 大数据分类模型
下载PDF
差异化需求下的非关系型分布式报送信息大数据分类方法 被引量:3
2
作者 韩璐 陈威宇 +2 位作者 张斐 何建锋 苏怀振 《电信科学》 2023年第6期114-121,共8页
针对多源异构、分布广泛报送信息差异化应用需求较多、无法区分可用性信息的问题,研究了差异化需求下的非关系型分布式报送信息大数据分类方法。首先,分析了非关系型分布式报送信息数据库的可用性、开放性和拓展性等特征,结合字段类型... 针对多源异构、分布广泛报送信息差异化应用需求较多、无法区分可用性信息的问题,研究了差异化需求下的非关系型分布式报送信息大数据分类方法。首先,分析了非关系型分布式报送信息数据库的可用性、开放性和拓展性等特征,结合字段类型的基本要求,采用非结构化数据库存储文本检索信息处理(TRIP)存储非关系型分布式报送信息;然后,分析了汉明散列家族内散列过程,在线性级要求约束下,利用多吸引子优化元胞自动机,通过遗传算法改进多吸引子元胞自动机分类器的最优参数,进而改进大数据分类方法。实验结果表明,该方法能够有效识别并分类非关系型分布式报送信息中的结构化数据与非结构化数据,具有较高的分类精度。 展开更多
关键词 差异化需求 非关系型 分布式 报送信息 大数据分类 元胞自动机
下载PDF
基于随机森林模型的不平衡大数据分类算法
3
作者 魏亚明 孟媛 《吉林大学学报(信息科学版)》 CAS 2023年第6期1079-1085,共7页
针对目前不平衡大数据分类算法分类效果较差的问题,提出基于随机森林模型的不平衡大数据分类算法。首先采用SVM(Support Vector Machine)支持向量机算法对不平衡大数据进行信息过滤,然后利用反k近邻法检测并消除离群点,通过增量主成分... 针对目前不平衡大数据分类算法分类效果较差的问题,提出基于随机森林模型的不平衡大数据分类算法。首先采用SVM(Support Vector Machine)支持向量机算法对不平衡大数据进行信息过滤,然后利用反k近邻法检测并消除离群点,通过增量主成分分析法去掉不平衡大数据中协方差矩阵存在的奇异性,并依据熵值法对其展开权重解析,进而提取不平衡大数据特征信息。将CART(Classification and Regression Trees)决策树当作不平衡大数据的基分类器,进而构建随机森林决策树分类器,最后将提取的不平衡大数据特征信息输入分类器中,实现不平衡大数据分类。实验结果表明,该算法对不平衡大数据的采样效果较好,并且分类精准度、稳定性和性能都较高。 展开更多
关键词 随机森林模型 不平衡大数据分类 SVM支持向量机 反k近邻法 CART决策树
下载PDF
区块链框架下基于优化决策树模型的大数据分类算法研究 被引量:1
4
作者 王建芳 《佳木斯大学学报(自然科学版)》 CAS 2023年第1期60-62,95,共4页
近年来,虽然我国大数据技术的发展水平有所提升,但是分类算法存在分类准确性问题和计算能力问题,而在区块链框架体系下,以优化决策树模型为基础的大数据分类算法,具有数据加密的特点,能够形成分布类型的决策树模型,精准进行数据的分类处... 近年来,虽然我国大数据技术的发展水平有所提升,但是分类算法存在分类准确性问题和计算能力问题,而在区块链框架体系下,以优化决策树模型为基础的大数据分类算法,具有数据加密的特点,能够形成分布类型的决策树模型,精准进行数据的分类处理,优化决策树算法,有效解决传统大数据分类算法的问题。基于此,分析区块链框架下基于优化决策树模型的大数据分类算法应用意义,提出几点算法技术的应用措施,旨在为增强技术发展水平而提供帮助。 展开更多
关键词 区块链框架 优化决策树模型 大数据分类算法
下载PDF
基于半监督学习的大数据分类方法
5
作者 王少煜 《计算机应用文摘》 2023年第24期96-98,共3页
文章研究了基于半监督学习的大数据分类方法,并以MNIST数据集为例,对SGAN模型进行了测试。首先,介绍了半监督学习的基本思想以及SGAN模型的结构,包括标记数据、无标记数据、随机噪声、判别器和生成器等组件。其次,详细描述了在MNIST数... 文章研究了基于半监督学习的大数据分类方法,并以MNIST数据集为例,对SGAN模型进行了测试。首先,介绍了半监督学习的基本思想以及SGAN模型的结构,包括标记数据、无标记数据、随机噪声、判别器和生成器等组件。其次,详细描述了在MNIST数据集上测试SGAN模型的方法,包括数据预处理、模型构建、训练过程和性能评估。最后,给出了生成器生成样本的逼真度和多样性指标,以及判别器在测试集上的分类准确率、精确度、召回率和F1分数。经分析验证发现,SGAN模型在MNIST数据集上具有良好性能。 展开更多
关键词 大数据分类 半监督学习 半监督生成对抗网络 MNIST数据
下载PDF
基于非平稳割点的大数据分类样例选择 被引量:3
6
作者 王熙照 邢胜 赵士欣 《模式识别与人工智能》 EI CSCD 北大核心 2016年第9期780-789,共10页
针对传统样例选择方法压缩大数据集时,存在计算复杂度较高、时间消耗较大的问题,文中提出基于非平稳割点的样例选择方法.依据在区间端点得到凸函数的极值这一基本性质,通过标记非平衡割点度量一个样例为端点的程度,然后选取端点程度较... 针对传统样例选择方法压缩大数据集时,存在计算复杂度较高、时间消耗较大的问题,文中提出基于非平稳割点的样例选择方法.依据在区间端点得到凸函数的极值这一基本性质,通过标记非平衡割点度量一个样例为端点的程度,然后选取端点程度较高的样例,从而避免样例之间距离的计算.该方法旨在不影响分类精度的前提下,达到压缩数据集、提高计算效率的目的.实验表明,文中方法对于类别不平衡度较高的数据集压缩效果明显,同时表现出较强的抗噪性. 展开更多
关键词 大数据分类 样例选择 非平稳割点 决策树
下载PDF
用于肿瘤癌症大数据分类的新型仿生优化计算研究 被引量:1
7
作者 杜晓昕 王波 +4 位作者 胡斌 张剑飞 金涛 吴迪 郑晓东 《科学技术创新》 2018年第16期17-18,共2页
本文采用莱维飞行轨迹及多步环绕扰动对新型仿生优化计算(蜻蜓算法)进行了改进,将改进后的新型优化计算方法用于肿瘤癌症大数据分类,实验结果表明该方法获得了较高的分类准确度和分类速度,该方法具有很高的推广价值。
关键词 肿瘤癌症 大数据分类 新型仿生优化计算
下载PDF
区块链框架下基于优化决策树模型的大数据分类算法研究 被引量:5
8
作者 杨薇薇 曾凌静 《沈阳工程学院学报(自然科学版)》 2021年第4期57-62,共6页
现有大数据分类算法存在并行计算能力差、分类准确率低等不足,为此在区块链框架体系下提出一种基于优化决策树模型的大数据分类算法研究。利用区块链在数据加密方面的优势,构建分布式决策树模型,以信息熵和信息增益率为基础对目标数据... 现有大数据分类算法存在并行计算能力差、分类准确率低等不足,为此在区块链框架体系下提出一种基于优化决策树模型的大数据分类算法研究。利用区块链在数据加密方面的优势,构建分布式决策树模型,以信息熵和信息增益率为基础对目标数据集做预测分类,并对经典决策树算法进行优化,预留出用于缓冲的空节点,避免分类终止情况的发生。在每一次节点分裂后,用全部样本的平均梯度修改下一个叶子节点的权重,提升整个算法的迭代寻优能力和分类性能。仿真结果显示,提出的分类算法具有更强的数据吞吐能力和并行计算能力,针对10种不同大数据集的平均分类准确率达到了97.75%。 展开更多
关键词 区块链 优化决策树模型 大数据分类 并行计算 平均梯度
下载PDF
利用并行惯性权重OOL-FA的大数据分类
9
作者 钟章生 陈世炉 陈志龙 《计算机工程与设计》 北大核心 2020年第10期2818-2824,共7页
针对现有大数据分类过程中特征选择算法精度较低,影响后续数据分类算法精度的问题,提出基于惯性权重正交反向学习(OOL)-萤火虫算法(FA)的大数据特征选择算法。借助FA的全局搜索能力,以及OOL分别在收敛速度、收敛精度方面的改进能力,实... 针对现有大数据分类过程中特征选择算法精度较低,影响后续数据分类算法精度的问题,提出基于惯性权重正交反向学习(OOL)-萤火虫算法(FA)的大数据特征选择算法。借助FA的全局搜索能力,以及OOL分别在收敛速度、收敛精度方面的改进能力,实现数据特征的快速、精确选择,采用结构感知卷积神经网络对大数据特征进行精确分类。在包含6600万个样本和2000个属性的大数据集上进行实验,实验结果表明,所提算法在分类准确率上具有明显的优势。 展开更多
关键词 大数据分类 惯性权重OOL-FA算法 结构感知神经网络 Spark框架 特征选择 数据分类
下载PDF
概率统计下的大数据分类方法初探 被引量:2
10
作者 胡俊红 《数学学习与研究》 2018年第17期23-23,共1页
随着网络技术的发展,数据库技术的发展也随之提高,而海量的数据系统使得大数据分类与处理显得尤为重要,而现有的数据统计分类方法存在一些缺陷,准确度以及效率都达不到要求,本文简要探讨基于概率统计下的大数据分类方法,希望可以对读者... 随着网络技术的发展,数据库技术的发展也随之提高,而海量的数据系统使得大数据分类与处理显得尤为重要,而现有的数据统计分类方法存在一些缺陷,准确度以及效率都达不到要求,本文简要探讨基于概率统计下的大数据分类方法,希望可以对读者有一定的帮助. 展开更多
关键词 概率统计 大数据分类方法 微分方程 二项-泊松模型
下载PDF
基于概率统计的大数据分类方法 被引量:7
11
作者 杨晓波 《内蒙古师范大学学报(自然科学汉文版)》 CAS 北大核心 2017年第2期174-177,共4页
提出一种基于概率统计的大数据分类优化方法.首先构建大数据分类的二项-泊松模型,在无穷维向量空间对分类目标函数进行概率密度估计,在数据聚类中心的几何邻域构建置信区间,采用置信度特征求解大数据分类的二项-泊松微分方程,然后以方... 提出一种基于概率统计的大数据分类优化方法.首先构建大数据分类的二项-泊松模型,在无穷维向量空间对分类目标函数进行概率密度估计,在数据聚类中心的几何邻域构建置信区间,采用置信度特征求解大数据分类的二项-泊松微分方程,然后以方程的稳定解作为聚类中心特征值,在Bernoulli空间通过概率统计实现对大数据的准确分类. 展开更多
关键词 大数据分类 概率统计 泛函 微分方程
下载PDF
基于心理行为大数据分类算法的家政服务人员的专业性研究 被引量:2
12
作者 李咏维 刘峰涛 《服务科学和管理》 2020年第1期40-48,共9页
本文为解决互联网家政服务业入户服务人员的专业性分类问题,基于Y互联网家政服务企业的详细入户服务人员数据库,运用心理行为的调研实验,确立入户服务人员的静态属性,进而提出了针对入户服务人员专业性的大数据分类算法的判别模型,在对... 本文为解决互联网家政服务业入户服务人员的专业性分类问题,基于Y互联网家政服务企业的详细入户服务人员数据库,运用心理行为的调研实验,确立入户服务人员的静态属性,进而提出了针对入户服务人员专业性的大数据分类算法的判别模型,在对入户服务人员的训练样本集进行判别模型的初步训练基础上,实现入户服务人员数据中测试样本集判别准确率的分析。研究结果显示,针对入户服务人员的心理行为,调研实验确立了研究的六个静态属性,分别是年龄、性别、籍贯、分数、婚姻、学历;基于心理行为学的大数据分类算法的判别模型对于入户服务人员的专业性分类准确率达到67.5%。 展开更多
关键词 家政服务 心理与行为 静态属性 大数据分类 朴素贝叶斯算法
下载PDF
Web网络大数据分类系统的设计研究 被引量:3
13
作者 徐哲 《电脑知识与技术(过刊)》 2017年第6X期216-217,共2页
该文通过对Web网络大数据进行系统性的分类处理,从而采用软件以及计算机硬件进行数据结合的形式进行系统分类结构改造。分析Web网络大数据分类系统的设计及应用。
关键词 WEB网络 大数据分类 系统 设计
下载PDF
基于鲸鱼优化和深度学习的不平衡大数据分类算法 被引量:8
14
作者 孙二华 胡云冰 《西南师范大学学报(自然科学版)》 CAS 2021年第5期127-133,共7页
针对当前不平衡数据分类算法中存在的分类精度低和容易陷入局部最优状态的问题,提出一种基于鲸鱼优化和深度学习的不平衡大数据分类算法.该算法由特征选择、预处理和分类3个阶段组成:①为了提高分类精度,使用鲸鱼优化算法(whale optimiz... 针对当前不平衡数据分类算法中存在的分类精度低和容易陷入局部最优状态的问题,提出一种基于鲸鱼优化和深度学习的不平衡大数据分类算法.该算法由特征选择、预处理和分类3个阶段组成:①为了提高分类精度,使用鲸鱼优化算法(whale optimization algorithm,WOA)在不平衡数据中寻找最优特征子集,消除不相关和多余的特征;②采用局部敏感哈希的合成少数类过采样技术(locality sensitive hashing synthetic minority oversampling technique,LSH-SMOT)对数据集进行预处理,解决类不平衡问题;③使用基于WOA算法优化的双向递归神经网络(bidirectional recurrent neural networks,BRNN)对预处理后的数据集进行分类.实验结果表明:本文算法能够有效解决不平衡数据集的分类问题,相比于其他算法,本文算法在分类精度和局部最优避免率方面具有明显优势. 展开更多
关键词 不平衡大数据分类 鲸鱼优化算法 深度学习 合成少数类过采样技术
下载PDF
基于Web网络大数据分类系统的设计与实现 被引量:9
15
作者 范敏 刘军 《电子设计工程》 2018年第8期106-109,共4页
在Web网络中的数据信息量十分复杂,传统的计算机系统只是采用软件或者计算机的硬件设施来对Web网络中的复杂信息数据进行分类,那么在这一过程中所需要耗费的时间过多,浪费的计算机资源也过多,对复杂的信息网络数据处理较为困难,计算机... 在Web网络中的数据信息量十分复杂,传统的计算机系统只是采用软件或者计算机的硬件设施来对Web网络中的复杂信息数据进行分类,那么在这一过程中所需要耗费的时间过多,浪费的计算机资源也过多,对复杂的信息网络数据处理较为困难,计算机的配置也需要更高要求,因此不能及时的满足对数据进行及时处理的要求。基于对Web网络大数据进行分类,从而采用了新型的软件硬件结合的处理方式对数据进行分类,通过对Web网络中的大数据分类系统进行设计,分析了其中的结构以及相关内容,从而表明了所采用的设计系统对Web网络大数据进行详细的分析,在此过程中不仅节约了分析的时间,更使得分析数据更加精准,相比之下此种系统具备了更加优质的分类性能。 展开更多
关键词 WEB网络 大数据分类 系统设计 实现
下载PDF
基于概率数学模型的大数据分类研究 被引量:1
16
作者 陈丽 《内蒙古师范大学学报(自然科学汉文版)》 CAS 北大核心 2016年第6期765-768,共4页
提出一种基于概率数学模型的大数据分类方法.首先采用非线性双曲微分方程构建数据统计分析模型,给出数据分类的稳定凸函数,并采用最佳有理逼近方法构建检验统计量,得到数据分类的概率分布密度函数;然后采用Sigma检验得到数据分类的判据... 提出一种基于概率数学模型的大数据分类方法.首先采用非线性双曲微分方程构建数据统计分析模型,给出数据分类的稳定凸函数,并采用最佳有理逼近方法构建检验统计量,得到数据分类的概率分布密度函数;然后采用Sigma检验得到数据分类的判据和概率分析置信区间与拒绝区间,证明数学模型的稳定性和渐进收敛性;最后通过仿真实验进行数据分析,结果表明,该模型的数据分类准确率高,平均误分率低,收敛性好. 展开更多
关键词 大数据分类 概率数学模型 Sigma检验 收敛性 置信区间
下载PDF
基于大数据随机样本划分的分布式观测点分类器
17
作者 李旭 何玉林 +2 位作者 崔来中 黄哲学 PHILIPPE Fournier-Viger 《计算机应用》 CSCD 北大核心 2024年第6期1727-1733,共7页
观测点分类器(OPC)是一种试图通过将多维样本空间线性不可分问题转换成一维距离空间线性可分问题的有监督学习模型,对高维数据的分类问题尤为有效。针对OPC在处理大数据分类问题时表现的较高训练复杂度,在Spark框架下设计一款基于大数... 观测点分类器(OPC)是一种试图通过将多维样本空间线性不可分问题转换成一维距离空间线性可分问题的有监督学习模型,对高维数据的分类问题尤为有效。针对OPC在处理大数据分类问题时表现的较高训练复杂度,在Spark框架下设计一款基于大数据的随机样本划分(RSP)的分布式OPC(DOPC)。首先,在分布式计算环境下生成大数据的RSP数据块,并将它转换为弹性分布式数据集(RDD);其次,在RSP数据块上协同式地训练一组OPC,由于每个RSP数据块上的OPC独立训练,因此有高效的Spark可实现性;最后,在Spark框架下将在RSP数据块上协同训练的OPC集成为DOPC,对新样本进行类标签预测。在8个大数据集上,对Spark集群环境下实现的DOPC的可行性、合理性和有效性进行实验验证,实验结果显示,DOPC能够以更低的计算消耗获得比单机OPC更高的测试精度,同时相较于Spark框架下实现的基于RSP模型的神经网络(NN)、决策树(DT)、朴素贝叶斯(NB)和K最近邻(KNN),DOPC分类器具有更强的泛化性能。测试结果表明,DOPC是一种高效低耗的处理大数据分类问题的有监督学习算法。 展开更多
关键词 大数据分类 分布式文件系统 随机样本划分 观测点分类 Spark计算框架
下载PDF
基于大数据分类的高校辅导员学生管理策略研究
18
作者 王宇琼 《成才之路》 2024年第16期141-144,共4页
大数据凭借其海量的数据规模、多样化的数据类型、快速的处理能力和高度的真实性,已成为高校辅导员决策的重要依据。将大数据应用于高校学生管理中,不仅能为辅导员提供客观、全面的决策依据,显著提升其工作效率,还能实现精细化管理,并... 大数据凭借其海量的数据规模、多样化的数据类型、快速的处理能力和高度的真实性,已成为高校辅导员决策的重要依据。将大数据应用于高校学生管理中,不仅能为辅导员提供客观、全面的决策依据,显著提升其工作效率,还能实现精细化管理,并具备预测和反馈的功能。文章结合大数据特性,阐述大数据应用于学生管理的价值,分析大数据应用于学生管理的现实基础,探讨基于大数据分类的高校辅导员学生管理的策略,旨在进一步推动学生管理工作的创新与发展,实现学生个性化管理。 展开更多
关键词 大数据分类 高校 辅导员 学生管理 个性化管理 策略
下载PDF
精准医学大数据应用安全分类分级研究 被引量:7
19
作者 刘莉 陈先来 +6 位作者 李忠民 安莹 朱勋梅 谢丽敏 杨潇 邱珂 于冰 《医学信息学杂志》 CAS 2021年第1期9-15,35,共8页
应用文献研究法、线面混合分类法划分精准医学大数据用户角色、应用场景,详细阐述划分方法及结果,指出精准医学背景下基于不同角色、不同应用场景的数据分类分级思路,为精准医学大数据标准化体系构建和安全隐私保护相关研究提供新方向。
关键词 精准医学 大数据分类分级 数据安全 隐私保护
下载PDF
基于决策树算法的医疗大数据填补及分类仿真 被引量:13
20
作者 岳根霞 刘金花 刘峰 《计算机仿真》 北大核心 2021年第1期451-454,459,共5页
从大数据的基本特点和医疗大数据研究现状出发,分析处理过程中存在的问题,提出在决策树算法下的医疗大数据填补及分类方法。分析医疗数据的关联规则,采用关联分析(Apriori)算法和频繁模式树(Frequent Pattern Growth,FP-Growth)算法挖... 从大数据的基本特点和医疗大数据研究现状出发,分析处理过程中存在的问题,提出在决策树算法下的医疗大数据填补及分类方法。分析医疗数据的关联规则,采用关联分析(Apriori)算法和频繁模式树(Frequent Pattern Growth,FP-Growth)算法挖掘数据。以挖掘数据为基础填补其中的缺失数据,按照医疗数据特点搭建决策树,并运用ID3和C4.5决策树算法,实现医疗大数据的分类,得出数据分类结果。由仿真得出,与传统方法相比,填补量提高了50%,分类精度提高了11.40%、14.80%,无论从数据的填补方面还是分类方法,上述方法均有较高的应用价值,为医疗大数据体系的构建开辟了新的思路。 展开更多
关键词 决策树算法 医疗大数据 数据填补 大数据分类
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部