期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
高速数据链的挖掘算法——VFDT算法 被引量:1
1
作者 郑伟发 李培亮 +2 位作者 郑梁珠 潘伟贤 曾繁富 《广东商学院学报》 2002年第S2期118-120,共3页
本文描述并评价了VFDT(VeryFastDecisionTree)算法。它可以使用不变的内存和时间来处理每个样本 ,从而有效地解决时间、内存和样本对数据挖掘的限制 ,特别是高速数据流上的数据挖掘。它通过建立Ho effding树来进行决策支持 ,并使用Hoeff... 本文描述并评价了VFDT(VeryFastDecisionTree)算法。它可以使用不变的内存和时间来处理每个样本 ,从而有效地解决时间、内存和样本对数据挖掘的限制 ,特别是高速数据流上的数据挖掘。它通过建立Ho effding树来进行决策支持 ,并使用Hoeffding约束来保证以高精确度处理高速数据链。 展开更多
关键词 数据挖掘 Hoeffding树 vfdt算法
下载PDF
基于VFDT特征的空中飞机目标分类方法 被引量:1
2
作者 李秋生 张华霞 《雷达科学与技术》 北大核心 2020年第4期438-442,共5页
飞机机身的非刚性振动、航行姿态的改变以及机上旋转部件的转动等均会引发对其雷达回波的非线性调制,采用多重分形测度可以对飞机回波的此类调制特征进行细致的刻画。文中引入方差分形维轨迹(VFDT)这一种新的多重分形算法对飞机回波进... 飞机机身的非刚性振动、航行姿态的改变以及机上旋转部件的转动等均会引发对其雷达回波的非线性调制,采用多重分形测度可以对飞机回波的此类调制特征进行细致的刻画。文中引入方差分形维轨迹(VFDT)这一种新的多重分形算法对飞机回波进行特性分析和特征提取,基于提出的VFDT特征并结合支持向量机(SVM),对实际录取的多种类型飞机回波进行了目标分类识别实验。实验结果表明,VFDT特征可以较好地对多种不同类型的飞机目标进行分类辨识,并具有较小的计算量。 展开更多
关键词 特征提取 方差分形维轨迹 目标分类 低分辨雷达
下载PDF
一种高效的数据流挖掘增量模糊决策树分类算法 被引量:18
3
作者 王涛 李舟军 +2 位作者 胡小华 颜跃进 陈火旺 《计算机学报》 EI CSCD 北大核心 2007年第8期1244-1250,共7页
数据流具有数据持续到达、到达速度快、数据规模巨大等特点,这些都给数据流挖掘领域的研究工作带来了新挑战,而其中分类算法更是当前的研究热点.Domingos等在VFDT中利用Hoeffding不等式很好地解决了在数据流上进行单遍扫描获取高精度决... 数据流具有数据持续到达、到达速度快、数据规模巨大等特点,这些都给数据流挖掘领域的研究工作带来了新挑战,而其中分类算法更是当前的研究热点.Domingos等在VFDT中利用Hoeffding不等式很好地解决了在数据流上进行单遍扫描获取高精度决策树的问题.Gama等对VFDT进行扩展并实现了VFDTc,使系统能够处理连续属性.Peng等在传统数据挖掘环境下提出了基于模糊理论的连续属性平滑离散化方法.基于前述工作,作者设计并实现了一种基于线索化排序二叉树的增量模糊决策树分类算法fVFDT,其主要贡献有如下4点:(1)第一次设计并实现了数据流上的基于线索化二叉排序树(TBST)的连续属性处理方法.相比VFDT,fVFDT的样本插入时间复杂度由O(n2)降低到O(nlogn).当新样本到达时,VFDTc需要更新O(logn)个属性节点,而fVFDT只需要更新相应的一个节点即可;(2)改进了VFDTc连续属性的最佳划分节点选取的计算方法,使其时间复杂度由O(nlogn)降低到O(n);(3)根据Fayyad等的研究成果,相比VFDTc,fVFDT只需从更少的备选划分节点中选取最佳节点,备选划分节点数由O(n)降低到O(logn);(4)改进了传统数据挖掘环境下的基于模糊理论的连续属性平滑离散化方法,有效地处理了噪声数据,很好地提高了分类精度. 展开更多
关键词 数据流 线索化二叉排序树 连续属性 模糊离散化 增量 vfdt
下载PDF
大数据环境下的不确定数据流在线分类算法 被引量:9
4
作者 吕艳霞 王翠荣 +1 位作者 王聪 于长永 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第9期1245-1249,共5页
在大数据环境下,由于隐私保护、数据丢失等原因,数据普遍存在不确定性;数据流系统中数据不断地到达系统,只扫描一遍且不能一次性全部获得;所以要构建一个增量分类模型来处理不确定数据流分类.本文基于VFDT算法提出了WBVFDTu算法,该算法... 在大数据环境下,由于隐私保护、数据丢失等原因,数据普遍存在不确定性;数据流系统中数据不断地到达系统,只扫描一遍且不能一次性全部获得;所以要构建一个增量分类模型来处理不确定数据流分类.本文基于VFDT算法提出了WBVFDTu算法,该算法在学习和分类阶段都可快速而有效地分析不确定信息.在学习期间,采用Hoeffding分解定理构造决策树模型;在分类期间,在决策树的叶子节点利用加权贝叶斯分类算法提高模型的分类准确率和算法的执行效率.最终证明该算法能够非常快速地学习不确定数据流,提高分类的准确率. 展开更多
关键词 不确定数据流 加权贝叶斯 vfdt 分类算法 大数据
下载PDF
光纤、电容液滴分析仪(一):原理与实验 被引量:15
5
作者 宋晴 张国雄 +1 位作者 裘祖荣 陈海秀 《仪器仪表学报》 EI CAS CSCD 北大核心 2003年第4期348-351,共4页
介绍一种用于液体特性研究的新型仪器——光纤、电容液滴分析仪 (FCDA:Fiber- Capacitive Drop Analyzer)。该仪器利用光纤液滴分析技术和电容液滴分析技术制成特殊的液滴传感器 ,获取经过液滴的光强信号随液滴生长变化的规律 ,得到反... 介绍一种用于液体特性研究的新型仪器——光纤、电容液滴分析仪 (FCDA:Fiber- Capacitive Drop Analyzer)。该仪器利用光纤液滴分析技术和电容液滴分析技术制成特殊的液滴传感器 ,获取经过液滴的光强信号随液滴生长变化的规律 ,得到反映液体综合特性的“液滴指纹图”。通过对部分样品进行测试实验 ,证明液滴指纹图可以作为鉴别液体的依据 ,同时具有测量液体物理。 展开更多
关键词 液滴分析仪 FCDA vfdt 液滴传感器 液滴指纹图 细微鉴别
下载PDF
光纤、电容液滴分析仪(二):系统设计 被引量:4
6
作者 宋晴 张国雄 +2 位作者 裘祖荣 张爱萍 史庆伟 《仪器仪表学报》 EI CAS CSCD 北大核心 2003年第4期352-355,359,共5页
详细介绍了光纤、电容液滴分析仪 (FCDA:Fiber- Capacitive Drop Analyzer)的系统设计方案和各组成部分的具体实现方法 ,包括液滴传感器的设计、微量供液系统的设计。
关键词 液滴分析仪 FCDA vfdt 液滴传感器 供液泵 信号处理
下载PDF
帕金森病人的图形辨别障碍 被引量:1
7
作者 汤慈美 刘颖 《心理学报》 CSSCI CSCD 北大核心 1993年第3期258-263,共6页
对56名帕金森病人用视觉形状辨别测验(VFDT)进行了测查,44名年龄、文化水平与帕金森组相当的正常人作为对照组。结果发现帕金森病人对图形辨别有明显障碍。对帕金森病人在图形辨别障碍中的特点进行了分析,并对其可能机制进行了讨论。
关键词 图形辨别 震颤性麻痹 vfdt
下载PDF
子空间流式分类方法在校园网IPv6流量上的应用研究 被引量:3
8
作者 王若愚 张凌 刘珍 《通信学报》 EI CSCD 北大核心 2018年第A01期44-52,共9页
随着IPv4地址的耗尽,IPv6将被广泛部署使用。在互联网流量分类领域,目前大多研究对象为IPv4流量。采集校园网IPv6流量数据,开展数据预处理工作,为解决流量数据面临的概念漂移问题,改进流式机器学习算法(VFDT)。为每个类别搜索与之相关... 随着IPv4地址的耗尽,IPv6将被广泛部署使用。在互联网流量分类领域,目前大多研究对象为IPv4流量。采集校园网IPv6流量数据,开展数据预处理工作,为解决流量数据面临的概念漂移问题,改进流式机器学习算法(VFDT)。为每个类别搜索与之相关的特征集合,利用各特征集合建立子空间,在每个子空间利用流式机器学习算法建立分类模型,在分类过程中,不断学习新标记流量数据,改善分类模型。未知流量数据的类别预测为多个分类模型的投票结果。实验结果表明,改进的算法能改善流式学习方法在IPv6网络流量数据上的分类性能。 展开更多
关键词 IPv6流量分类 vfdt算法 特征选择 流式学习
下载PDF
一种基于线索化二叉排序树的数据流挖掘的决策树分类新算法
9
作者 王涛 李舟军 +1 位作者 颜跃进 陈火旺 《计算机研究与发展》 EI CSCD 北大核心 2007年第z2期42-46,共5页
数据流具有数据持续到达、到达速度快、数据规模巨大等特点,这些都给数据流挖掘领域研究工作带来了新挑战,而其中分类算法更是当前的研究热点. Domingos等人在VFDT中利用Hoeffding不等式很好地解决了在数据流上进行单遍扫描获取高精度... 数据流具有数据持续到达、到达速度快、数据规模巨大等特点,这些都给数据流挖掘领域研究工作带来了新挑战,而其中分类算法更是当前的研究热点. Domingos等人在VFDT中利用Hoeffding不等式很好地解决了在数据流上进行单遍扫描获取高精度决策树的问题. Gama等人对VFDT进行扩展并实现了VFDTc,使系统能够处理连续属性,并在叶节点采用了贝叶斯分类算法使分类精度更高.基于VFDT和VFDTc,设计并实现了一种基于线索化二叉排序树的决策树分类新算法VFDTt,其主要贡献有如下3点:1)第1次设计并实现了数据流上的基于线索化二叉排序树(TBST)的连续属性处理方法.相比VFDT,VFDTt的样本插入时间复杂度由O(n2)降低到O(nlogn).当新样本到达时,VFDTc需要更新O(logn)个属性节点,而VFDTt只需要更新相应的一个节点即可. 2)改进了VFDTc连续属性的最佳划分节点选取的计算方法,使其时间复杂度由O(nlogn)降低到O(n). 3)相比VFDTc,VFDTt只需从更少的备选划分节点中选取最佳节点,备选划分节点数由O(n)降低到O(logn). 展开更多
关键词 数据流 线索化二叉排序树 连续属性 vfdt
下载PDF
一种高效的基于数据流模型的电力系统实时安全评估算法
10
作者 王鹤苓 唐玉平 《中小企业管理与科技》 2012年第12期299-300,共2页
安全评估问题是电力系统规划和运行过程中的一个很重要的问题。它包括对电力系统进行安全评估及在需要的时候采取及时的应对措施。本文聚焦于该问题并将电力系统的实时安全评估问题抽象为一个数据流挖掘模型。VFDT利用Hoeffding不等式... 安全评估问题是电力系统规划和运行过程中的一个很重要的问题。它包括对电力系统进行安全评估及在需要的时候采取及时的应对措施。本文聚焦于该问题并将电力系统的实时安全评估问题抽象为一个数据流挖掘模型。VFDT利用Hoeffding不等式解决了数据流挖掘问题。Wang等的VFDTb利用线索化二叉树技术高效地解决了数据流挖掘中连续属性问题。在VFDT和VFDTb的基础上,我们设计实现了一个基于AVL树的高效算法PPSDT,该算法的排序树的内部路径长度接近于最优的NlogN。总体上说,该算法在保持决策树精度的基础上,很好的提高了挖掘速度。 展开更多
关键词 vfdt vfdtb AVL PSSDT
下载PDF
在数据流管理系统中实现快速决策树算法(英文) 被引量:3
11
作者 袁磊 张阳 +2 位作者 李梅 李雪 王勇 《计算机科学与探索》 CSCD 2010年第8期673-682,共10页
在数据流管理系统(data stream management system,DSMS)中嵌入数据挖掘算法对数据库研究者是一项新的挑战,而在数据流管理系统中嵌入快速决策树(very fast decision tree,VFDT),尚未见报道。利用DSMS原有的机制在Esper中实现了VFDT算... 在数据流管理系统(data stream management system,DSMS)中嵌入数据挖掘算法对数据库研究者是一项新的挑战,而在数据流管理系统中嵌入快速决策树(very fast decision tree,VFDT),尚未见报道。利用DSMS原有的机制在Esper中实现了VFDT算法。其主要思想是将VFDT算法转换为Esper的数据查询语言(Esper query language,EQL)。给出了在DSMS中实现VFDT算法的两种方法:普通方法。直接将VFDT算法转化为EQL语言并在DSMS中实现(记作DVFDT);改进方法。通过Esper中固有的批量处理模式来实现(记作optimal-DVFDT)。通过一系列实验比较分析了两种方法对海量数据流分类的准确率和性能;将提出的两种方法与用Java实现的VFDT算法(记作JVFDT)在分类精度和时间上进行比较。结果表明,在DSMS中实现的VFDT算法具有较好的性能,并且该算法对大规模数据流数据的子集同样具有较高的性能。 展开更多
关键词 数据管理系统 vfdt算法 嵌入 分类
下载PDF
统计关联规则决策树在医疗数据中的应用 被引量:2
12
作者 王旭晨 陈小惠 《微型机与应用》 2016年第15期78-81,共4页
提出一种基于统计关联规则的增量决策树分类算法,称为SARMT(Statistic Association Rules Miner Tree),它基于快速决策树(Very Fast Decision Tree,VFDT)技术来挖掘医疗数据。与VFDT不同,改进的SARMT算法不依赖于样本分裂节点的数量。... 提出一种基于统计关联规则的增量决策树分类算法,称为SARMT(Statistic Association Rules Miner Tree),它基于快速决策树(Very Fast Decision Tree,VFDT)技术来挖掘医疗数据。与VFDT不同,改进的SARMT算法不依赖于样本分裂节点的数量。在医疗大数据中,通常缺少大量可用的数据样本,因此SARMT算法更加适用于医疗环境中。将SARMT算法和VFDT算法应用于不同的三个医疗数据集上,实验结果表明在执行时间相当的情况下,SARMT算法在处理医疗数据中有更高的准确率。 展开更多
关键词 医疗数据 决策树 关联规则 SARMT vfdt
下载PDF
基于大数据分析的配电网辅助决策系统的研究 被引量:17
13
作者 谢潇睿 李学 +1 位作者 彭春华 杨春艳 《电子设计工程》 2020年第5期121-124,129,共5页
为高效、快速地处理配电网呈指数增长的数据,提高数据分析、决策能力,文中提出了1种基于大数据分析的配电网辅助决策系统设计。文中根据配电网业务需求特点,分别就流处理与批处理两种数据处理方式进行了分析。利用分布式计算通用框架Map... 为高效、快速地处理配电网呈指数增长的数据,提高数据分析、决策能力,文中提出了1种基于大数据分析的配电网辅助决策系统设计。文中根据配电网业务需求特点,分别就流处理与批处理两种数据处理方式进行了分析。利用分布式计算通用框架MapReduce分别进行基于Strom的VFDT算法的构建,实现了流处理。同时利用Spark进行了随机森林算法的构建,实现了批处理。测试结果表明,基于Strom的VFDT算法可有效将数据进行分类,具有更好的分类准确率。此外,基于Spark的随机森林算法具有良好的可扩展性。 展开更多
关键词 大数据分析 vfdt算法 SPARK 随机森林算法
下载PDF
模糊控制理论在新技术评价中的应用 被引量:2
14
作者 王毅 高红岩 王晓明 《太原科技大学学报》 2006年第4期259-262,272,共5页
应用模糊控制思想确定变权的方法,解决新技术评价的信息的不确定问题,采用常权与变权相结合的方法,对新技术进行综合评价。本文不仅提出了新技术评价的一种有效的新方法,而且加快企业信息化的实现,并使模糊控制的理论和方法得到更广泛... 应用模糊控制思想确定变权的方法,解决新技术评价的信息的不确定问题,采用常权与变权相结合的方法,对新技术进行综合评价。本文不仅提出了新技术评价的一种有效的新方法,而且加快企业信息化的实现,并使模糊控制的理论和方法得到更广泛的应用。 展开更多
关键词 新技术评价 模糊控制 变权
下载PDF
Random Forest Based Very Fast Decision Tree Algorithm for Data Stream
15
作者 DONG Zhenjiang LUO Shengmei +2 位作者 WEN Tao ZHANG Fayang LI Lingjuan 《ZTE Communications》 2017年第B12期52-57,共6页
The Very Fast Decision Tree(VFDT)algorithm is a classification algorithm for data streams.When processing large amounts of data,VFDT requires less time than traditional decision tree algorithms.However,when training s... The Very Fast Decision Tree(VFDT)algorithm is a classification algorithm for data streams.When processing large amounts of data,VFDT requires less time than traditional decision tree algorithms.However,when training samples become fewer,the label values of VFDT leaf nodes will have more errors,and the classification ability of single VFDT decision tree is limited.The Random Forest algorithm is a combinational classifier with high prediction accuracy and noise-tol-erant ability.It is constituted by multiple decision trees and can make up for the shortage of single decision tree.In this paper,in order to improve the classification accuracy on data streams,the Random Forest algorithm is integrated into the process of tree building of the VFDT algorithm,and a new Random Forest Based Very Fast Decision Tree algorithm named RFVFDT is designed.The RFVFDT algorithm adopts the decision tree building criterion of a Random Forest classifier,and improves Random Forest algorithm with sliding window to meet the unboundedness of data streams and avoid process delay and data loss.Experimental results of the classification of KDD CUP data sets show that the classification accuracy of RFVFDT algorithm is higher than that of VFDT.The less the samples are,the more obvious the advantage is.RFVFDT is fast when running in the multithread mode. 展开更多
关键词 DATA STREAM DATA classification RANDOM FOREST ALGORITHM vfdt ALGORITHM
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部