期刊文献+
共找到1,270篇文章
< 1 2 64 >
每页显示 20 50 100
基于SPRINT分类算法的异构分布式数据挖掘研究 被引量:6
1
作者 宾宁 李宏 陈松乔 《计算机测量与控制》 CSCD 2005年第1期76-78,91,共4页
分类算法是数据挖掘领域最重要的技术之一。随着网络的迅猛发展,分布式环境的日益普遍,分布式数据挖掘已成为近年来数据挖掘中的热点问题。针对目前的数据库多为异构式分布,提出利用SPRINT算法来进行分布式环境下的分类研究。先简要介绍... 分类算法是数据挖掘领域最重要的技术之一。随着网络的迅猛发展,分布式环境的日益普遍,分布式数据挖掘已成为近年来数据挖掘中的热点问题。针对目前的数据库多为异构式分布,提出利用SPRINT算法来进行分布式环境下的分类研究。先简要介绍了SPRINT算法,然后针对具体实例,详细探讨了分站点的预处理、计算最佳分裂、中心站点的决策树生成等几个阶段以及具体的算法设计实现过程。 展开更多
关键词 分布式数据库 异构分布式数据挖掘 sprint分类算法 决策树
下载PDF
SPRINT算法的改进 被引量:5
2
作者 刘友军 汪林林 《计算机工程》 EI CAS CSCD 北大核心 2006年第16期55-57,共3页
引出了纯区间的概念后,提出了一种基于纯区间归约的数值型属性处理方法对SPRINT算法进行改进。该方法将属性值域用等宽直方图的方法划分为多个区间,对纯区间进行归约,对非纯区间进行精确计算,保证了分裂精度,减小了计算量。
关键词 决策树 sprint算法 纯区间归约 Gini指数
下载PDF
SPRINT算法及其改进方法 被引量:3
3
作者 罗可 张学茂 《计算机工程与应用》 CSCD 北大核心 2005年第32期178-180,189,共4页
分类是数据挖掘中重要的研究课题。文章介绍了SPRINT分类算法。为了提高该算法在海量数据库中分类的总体效率,笔者提出了两种处理离散属性的新方法,这些方法能明显减少求最佳分割点的运算量,提高算法的执行速度。
关键词 数据挖掘 分类 决策树 sprint算法
下载PDF
基于Hadoop平台的SPRINT算法的分析与研究 被引量:2
4
作者 黄刚 孙媛 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2016年第4期25-30,共6页
传统的决策树算法在单机平台上处理海量数据挖掘时,容易受到计算能力和存储能力的限制,所以存在耗时过长、容错性差、存储量小的缺点.而拥有高可靠性和高容错性的Hadoop平台的出现为决策树算法的并行化提供了新的思路.本文设计和实现了... 传统的决策树算法在单机平台上处理海量数据挖掘时,容易受到计算能力和存储能力的限制,所以存在耗时过长、容错性差、存储量小的缺点.而拥有高可靠性和高容错性的Hadoop平台的出现为决策树算法的并行化提供了新的思路.本文设计和实现了一种基于Hadoop平台的并行SPRINT分类算法.实验结果表明:基于Hadoop平台的SPRINT分类算法比没有进行并行化的SPRINT算法具有较好的分类正确率、较低的时间复杂度和较好的并行性能,并且能明显提高算法求最佳分裂点时的执行速度. 展开更多
关键词 HADOOP MAPREDUCE 数据挖掘 决策树 sprint算法
下载PDF
基于SPRINT方法的并行决策树分类研究 被引量:18
5
作者 魏红宁 《计算机应用》 CSCD 北大核心 2005年第1期39-41,共3页
决策树技术的最大问题之一就是它的计算复杂性和训练数据的规模成正比,导致在大的数据集上构造决策树的计算时间太长。并行构造决策树是解决这个问题的一种有效方法。文中基于同步构造决策树的思想,对SPRINT方法的并行性做了详细分析和... 决策树技术的最大问题之一就是它的计算复杂性和训练数据的规模成正比,导致在大的数据集上构造决策树的计算时间太长。并行构造决策树是解决这个问题的一种有效方法。文中基于同步构造决策树的思想,对SPRINT方法的并行性做了详细分析和研究,并提出了进一步研究的方向。 展开更多
关键词 数据挖掘 sprint决策树分类 并行性
下载PDF
云计算下的SPRINT并行算法研究 被引量:5
6
作者 张春艳 《软件》 2010年第11期57-61,共5页
目前,由于云计算的出现,越来越多的中小企业在分析海量数据时能便利地找到廉价的解决方案。本文,鉴于MapReduce作为Hadoop中的重要编程模型,在介绍基于云计算的Hadoop平台和数据挖掘技术中的SPRINT分类算法的基础上,详细描述SPRINT的并... 目前,由于云计算的出现,越来越多的中小企业在分析海量数据时能便利地找到廉价的解决方案。本文,鉴于MapReduce作为Hadoop中的重要编程模型,在介绍基于云计算的Hadoop平台和数据挖掘技术中的SPRINT分类算法的基础上,详细描述SPRINT的并行算法在MapReduce编程模型上的执行流程,并利用研究出的决策树模型对输入数据进行分类。 展开更多
关键词 云计算 HADOOP MAPREDUCE 数据挖掘 sprint
下载PDF
SPRINT研究的解读 被引量:3
7
作者 王新宴 张莎莎 +1 位作者 周墅 邹鲁 《空军医学杂志》 2016年第4期270-272,共3页
科研是促进医学发展和人类健康的基础。业界称为《SPRINT研究》的重要科研成果是由SPRINT研究组在102个临床研究中心历经平均3.26年的药物干预和随访监测后分析得出的。该研究成果的问世在高血压领域甚至心血管研究领域引起了不断的争... 科研是促进医学发展和人类健康的基础。业界称为《SPRINT研究》的重要科研成果是由SPRINT研究组在102个临床研究中心历经平均3.26年的药物干预和随访监测后分析得出的。该研究成果的问世在高血压领域甚至心血管研究领域引起了不断的争议。争议的焦点主要集中在对于高血压患者是否应该通过强化降压将降压目标控制在120 mm Hg以下以及该研究成果对于未来高血压防治指南制定的参考意义。所有的争议都源于不同人对SPRINT研究的理解不同。我们从研究人群、研究结果和实际问题三方面对其内容进行了客观、深入的解读。 展开更多
关键词 高血压 sprint研究 降压目标 心血管疾病 危险因素
下载PDF
基于云计算的SPRINT算法研究 被引量:1
8
作者 杨洁 黄刚 《计算机技术与发展》 2017年第3期108-112,共5页
决策树是数据挖掘中非常重要的一种技术,常用来做数据分析和预测。传统的决策树算法在处理海量数据挖掘时,受到CPU和内存的限制,导致算法存在消耗时间过长,容错性差,存储量小的缺点。面对海量数据的处理,云计算在这方面具有非常多的优... 决策树是数据挖掘中非常重要的一种技术,常用来做数据分析和预测。传统的决策树算法在处理海量数据挖掘时,受到CPU和内存的限制,导致算法存在消耗时间过长,容错性差,存储量小的缺点。面对海量数据的处理,云计算在这方面具有非常多的优势。针对决策树中优秀的SPRINT算法,首先对SPRINT算法进行了优化,然后为了让优化后的算法更好地应用于云计算,对算法实现了并行化。传统的SPRINT算法在生成决策树时,会发生多值偏向问题,在生成一个节点时,通过计算两层的Gini指数来降低多值偏向的影响。在算法并行化时,通过将数据分发到各个处理器执行,然后进行汇总处理,从而减少算法执行的总时间。实验结果表明:基于云计算平台的SPRINT改进算法具有更好的分类正确率,同时算法的执行速度也得到了明显的提高。 展开更多
关键词 云计算 MAPREDUCE sprint算法 Gini指数
下载PDF
基于SPRINT分类算法挖掘保险业务数据中的风险规则 被引量:1
9
作者 宾宁 《广东工业大学学报》 CAS 2007年第2期99-102,共4页
提出利用SPRINT算法对保险业务数据进行风险分析.针对医疗保险业务,详细介绍了SPRINT算法的预处理、计算最佳分裂、执行分裂的具体设计实现过程,并得出一些实用的风险规则.
关键词 sprint算法 分类算法 数据挖掘 保险业务
下载PDF
基于SPRINT分类算法进行医学预后分析的研究与应用 被引量:2
10
作者 雷炜 《现代计算机》 2008年第10期67-69,共3页
SPRINT算法是一种具有良好扩展性且能实现并行处理的数据分类方法,可以方便地从算法生成的决策树提取规则。在使用海量医学数据库进行预后分析中,它是值得推荐的一种研究方法。对该算法进行了深入研究,并在预后分析中进行了应用,对于类... SPRINT算法是一种具有良好扩展性且能实现并行处理的数据分类方法,可以方便地从算法生成的决策树提取规则。在使用海量医学数据库进行预后分析中,它是值得推荐的一种研究方法。对该算法进行了深入研究,并在预后分析中进行了应用,对于类似医学信息处理有启发意义。 展开更多
关键词 数据挖掘 决策树 sprint算法 预后分析
下载PDF
IQ200 Sprint全自动尿液有形成分分析仪的性能验证
11
作者 曹碧红 王春晖 《标记免疫分析与临床》 CAS 2022年第4期715-718,共4页
目的对IQ200 Sprint全自动尿液有形成分分析仪进行性能验证分析,评价其性能是否达到质量标准要求。方法在实验室符合ISO 15189实验室管理要求下,从精密度、携带污染率、线性范围、可报告范围、正确度等5个方面分析验证IQ200 Sprint全自... 目的对IQ200 Sprint全自动尿液有形成分分析仪进行性能验证分析,评价其性能是否达到质量标准要求。方法在实验室符合ISO 15189实验室管理要求下,从精密度、携带污染率、线性范围、可报告范围、正确度等5个方面分析验证IQ200 Sprint全自动尿液有形成分分析仪的性能。结果IQ200 Sprint全自动尿液有形成分分析仪的精密度、携带污染率、线性范围、可报告范围、正确度验证所得结果均符合厂家及实验室要求。结论IQ 200 Sprint全自动尿液有形成分分析仪性能良好,达到质量标准要求,可用于临床标本检测。 展开更多
关键词 IQ200 sprint 尿液有形成分 性能验证
下载PDF
一种改进的SPRINT算法
12
作者 白玲玲 韩天鹏 《韶关学院学报》 2018年第9期20-25,共6页
自大数据时代以来,数据密集型计算已经引起了相当大的关注.数据密集型计算环境中的数据挖掘研究仍处于初级阶段.提出一种基于MapReduce编程框架和SPRINT算法的决策树分类算法M-BCBT. M-BCBT继承了MapReduce的优点,使算法更适合数据密集... 自大数据时代以来,数据密集型计算已经引起了相当大的关注.数据密集型计算环境中的数据挖掘研究仍处于初级阶段.提出一种基于MapReduce编程框架和SPRINT算法的决策树分类算法M-BCBT. M-BCBT继承了MapReduce的优点,使算法更适合数据密集型计算应用.算法的性能根据实例进行分析评估.实验结果表明,MBCBT可以缩短操作时间,提高大数据环境的准确性. 展开更多
关键词 sprint MAPREDUCE 决策树 数据挖掘
下载PDF
SPRINT决策树方法中I/O分析及优化研究
13
作者 魏红宁 颜治平 《计算机与数字工程》 2007年第6期49-51,54,共4页
分析SPRINT方法的磁盘I/O,提出用读优化、写优化和磁盘文件搜索优化来减少SPRINT方法的磁盘I/O时间。读优化可使SPRINT方法省去一次读操作,写优化可以使SPRINT方法在交替层省去一次写操作,磁盘文件搜索优化可使SPRINT方法的磁盘文件搜... 分析SPRINT方法的磁盘I/O,提出用读优化、写优化和磁盘文件搜索优化来减少SPRINT方法的磁盘I/O时间。读优化可使SPRINT方法省去一次读操作,写优化可以使SPRINT方法在交替层省去一次写操作,磁盘文件搜索优化可使SPRINT方法的磁盘文件搜索时间复杂性只和决策树的节点个数相关。这三种方法可单独使用,也可结合起来使用。 展开更多
关键词 sprint 决策树 磁盘I/O 优化
下载PDF
一个基于SPRINT的分类算法的实现
14
作者 谭勇 《湖北民族学院学报(自然科学版)》 CAS 2004年第2期72-75,共4页
在介绍数据挖掘、分类算法有关概念的基础上,介绍了决策树的具体生成算法.为了减少数据量,改进决策树算法实现时的数据结构,详细描述了基于SPRINT(scalable parallelizable induction of decision trees)分类算法的实现,给出了SPRINT算... 在介绍数据挖掘、分类算法有关概念的基础上,介绍了决策树的具体生成算法.为了减少数据量,改进决策树算法实现时的数据结构,详细描述了基于SPRINT(scalable parallelizable induction of decision trees)分类算法的实现,给出了SPRINT算法的性能评估. 展开更多
关键词 数据挖掘 分类 决策树 sprint算法
下载PDF
SPRINT算法的并行性研究与应用
15
作者 陈如云 符保龙 《商场现代化》 北大核心 2007年第07Z期13-14,共2页
随着数据挖掘技术的发展,分类算法的并行化问题已经成为数据挖掘领域的一个研究热点。文章详细讨论了基于SPRINT的数据挖掘分类算法,并针对该算法并行化的问题进行研究探讨。
关键词 数据挖掘 决策树 sprint算法 并行化
下载PDF
SPRINT决策树分类器中的数据存储方法
16
作者 魏红宁 《计算机应用》 CSCD 北大核心 2004年第S1期95-96,104,共3页
叙述了决策树方法的基本原理 ,对SPRINT算法的主要特点作了详细分析讨论。在此基础上 ,提出了两种有效的用于SPRINT算法的数据存储方法。
关键词 数据挖掘 决策树 sprint 数据存储
下载PDF
改进SPRINT算法及其在分布式环境下的研究 被引量:5
17
作者 于蕾 刘大有 +1 位作者 高滢 田野 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2008年第6期1119-1124,共6页
通过引入一种动态数据结构,解决了SPRINT算法使用多个属性列表存储数据、占用过多系统资源、需创建哈希表对属性列表进行分割以及节点分割处理相对复杂的问题,并探讨了改进算法在分布式环境下的工作过程.实验结果表明,改进的算法减少了... 通过引入一种动态数据结构,解决了SPRINT算法使用多个属性列表存储数据、占用过多系统资源、需创建哈希表对属性列表进行分割以及节点分割处理相对复杂的问题,并探讨了改进算法在分布式环境下的工作过程.实验结果表明,改进的算法减少了属性列表占用的存储空间以及分割节点操作所需的时间. 展开更多
关键词 决策树 sprint算法 分布式环境
下载PDF
云计算框架下SPRINT大数据分类算法的优化及应用 被引量:1
18
作者 周雅静 《电脑知识与技术》 2023年第20期93-97,共5页
现有分类算法在处理大数据时计算时间往往过长,从而使得其性能难以满足大数据应用的实际需求。为此,该文研究了一种基于云计算框架的SPRINT优化分类算法,其思路是构建一种三层次的云计算框架,将优化的SPRINT分类算法植入其中,使得在处... 现有分类算法在处理大数据时计算时间往往过长,从而使得其性能难以满足大数据应用的实际需求。为此,该文研究了一种基于云计算框架的SPRINT优化分类算法,其思路是构建一种三层次的云计算框架,将优化的SPRINT分类算法植入其中,使得在处理大数据过程中SPRINT分类算法具有更好的稳定性和通信效率以及更高性能的并行计算环境。SPRINT分类算法的优化方法是:首先,利用GiNi值节点的分割提升连续属性的优化能力和分类算法并行计算能力,然后,重新划分大数据集的子集,并依据最佳分割点完成决策树的构建,提升大数据分类处理能力。实验结果表明,云计算框架下优化SPRINT分类算法具有更好的分类性能和分类效率,算法的并行性能和执行速率也优于传统大数据分类算法。 展开更多
关键词 云计算框架 优化sprint分类算法 GiNi值 子节点
下载PDF
改进的SPRINT算法及其在体质数据分析中的应用 被引量:4
19
作者 丁亚芝 郑志高 马嵘 《体育科学》 CSSCI 北大核心 2014年第6期90-96,共7页
为了能够利用常规测试数据快速准确地确定人体体质状况,引入了纯区间的概念,并提出了一种趋势选择方法,在此基础上提出基于趋势选择的SPRINT算法(TESTSPRINT)。利用该算法可以根据身高、体重、握力等基本测试数据快速建立人体体质状况... 为了能够利用常规测试数据快速准确地确定人体体质状况,引入了纯区间的概念,并提出了一种趋势选择方法,在此基础上提出基于趋势选择的SPRINT算法(TESTSPRINT)。利用该算法可以根据身高、体重、握力等基本测试数据快速建立人体体质状况决策树,为快速确定人体体质健康状况提供依据。实验和理论分析结果均表明,提出的TESTSPRINT算法可以有效为分析人体体质健康状况提供决策依据,具有较高的准确性,并且时间和空间开销较原SPRINT算法小。 展开更多
关键词 sprint算法 基尼系数 体质数据 数据挖掘
下载PDF
SPRINT算法中寻找连续属性分割点方法的改进 被引量:2
20
作者 彭程 罗可 《计算机工程与应用》 CSCD 北大核心 2006年第27期155-157,共3页
文章针对SPRINT算法中的寻找连续属性最佳分割点计算量大的问题,改进了寻找连续属性最佳分割点的方法。改进后的方法可减少候选分割点的数目,从而减少计算量和计算时间。
关键词 数据挖掘 决策树 sprint算法
下载PDF
上一页 1 2 64 下一页 到第
使用帮助 返回顶部