期刊文献+
共找到163篇文章
< 1 2 9 >
每页显示 20 50 100
树状结构在数据流求均值中的应用
1
作者 刘薇 陈文 《电脑与电信》 2024年第3期81-83,88,共4页
数据采集过程中,随着数据的增加,数据的平均值持续发生变化。为了研究平均值的变化过程,分析平均值序列的计算方法是有必要的。传统的方法是使用线性顺序存储方式计算均值序列,总的时间复杂度高达O(n2)。提出利用树状结构存储方法求取... 数据采集过程中,随着数据的增加,数据的平均值持续发生变化。为了研究平均值的变化过程,分析平均值序列的计算方法是有必要的。传统的方法是使用线性顺序存储方式计算均值序列,总的时间复杂度高达O(n2)。提出利用树状结构存储方法求取均值序列,并介绍其实现方法,该方法时间复杂度大大降低,仅为O(n*lnn)。 展开更多
关键词 算法 数据流 搜索树 平均值
下载PDF
QDM-Tree:支持数据流频繁更新的Cache敏感索引 被引量:1
2
作者 苏亮 王博 +2 位作者 邹鹏 贾焰 杨树强 《微电子学与计算机》 CSCD 北大核心 2008年第9期193-195,198,共4页
随着硬件和通信技术的飞速发展,数据流技术已广泛应用于金融分析、网络监控及传感器网络等诸多领域,这类应用通常具有高速、海量、连续和实时等特性.因此,在数据流上渐进、实时地更新索引成为一个极具价值和挑战性的问题.为了克服现有... 随着硬件和通信技术的飞速发展,数据流技术已广泛应用于金融分析、网络监控及传感器网络等诸多领域,这类应用通常具有高速、海量、连续和实时等特性.因此,在数据流上渐进、实时地更新索引成为一个极具价值和挑战性的问题.为了克服现有支持频繁更新的索引树性能大都深受处理器缓存失效率的影响,提出了一种新颖的基于双Memo的量化R*索引树-QDM-Tree(Quantized R*-tree with Double Memos),并给出了相应的插入、删除、更新和范围查询算法,理论分析表明:与已有R*树及其变种相比,该索引树能成倍地压缩树结点,具有更强支持频繁更新的能力. 展开更多
关键词 频繁更新 Cache敏感 索引树 数据流
下载PDF
JPEG2000中Tag-tree编码分析及实现 被引量:1
3
作者 胡高军 任广辉 吴芝路 《电视技术》 北大核心 2004年第10期13-15,共3页
分析了tag-tree编码在JPEG2000中的应用状况,讨论了其编码原理,并给出了具体的编码实现过程,有助于加速JPEG2000在实际生活中的应用。
关键词 JPEG2000 编码原理 加速 实现过程
下载PDF
不确定大数据流分类的决策树模型构建仿真
4
作者 杨知玲 谭树杰 《计算机仿真》 2024年第5期532-535,542,共5页
在不确定大数据流分类过程中,受噪声和孤立点的干扰,导致处理效果和分类精度无法达到预期要求。为解决上述问题,提出一种基于决策树模型的不确定大数据流分类算法。通过采用在线字典学习算法,对不确定大数据流去噪处理,消除噪声对分类... 在不确定大数据流分类过程中,受噪声和孤立点的干扰,导致处理效果和分类精度无法达到预期要求。为解决上述问题,提出一种基于决策树模型的不确定大数据流分类算法。通过采用在线字典学习算法,对不确定大数据流去噪处理,消除噪声对分类过程产生的干扰。构建决策树,在剪枝过程中通过特征过滤算法,滤除不确定大数据流中掺杂的孤立点。将去噪后的不确定大数据流,输入决策树模型中,完成分类工作。实验结果表明,所提算法处理后的不确定大数据流振幅明显减小,且分类精度高,具有一定的应用价值。 展开更多
关键词 决策树模型 在线字典学习算法 特征过滤 不确定大数据流 数据分类
下载PDF
基于Hoeffding Tree的电能质量在线扰动分类 被引量:5
5
作者 丁建光 张沛超 《电力自动化设备》 EI CSCD 北大核心 2014年第9期84-89,共6页
为满足电能质量扰动事件的在线分类需求,提出了一种基于Hoeffding Tree的电能质量扰动在线分类方法。对电能质量在线扰动分类中的关键技术进行了研究,提出用小波变换和离散傅里叶变换相结合的判别方法检测电能质量扰动,该算法采用自适... 为满足电能质量扰动事件的在线分类需求,提出了一种基于Hoeffding Tree的电能质量扰动在线分类方法。对电能质量在线扰动分类中的关键技术进行了研究,提出用小波变换和离散傅里叶变换相结合的判别方法检测电能质量扰动,该算法采用自适应滑动数据窗算法,能够根据扰动持续时间提取完整的扰动事件。以小波信号能量以及基波有效值构成特征向量,利用Hoeffding Tree算法构建增量式分类训练模型。仿真结果表明,所提方法的准确度和效率均满足电能质量扰动事件在线检测和分类的要求。 展开更多
关键词 电能质量 扰动 小波变换 自适应滑动数据窗 数据挖掘 Hoeffding tree 噪声 数据流
下载PDF
PMTree:一种高效的事件流模式匹配方法 被引量:8
6
作者 程苏珺 王永剑 +3 位作者 孟由 程振东 栾钟治 钱德沛 《计算机研究与发展》 EI CSCD 北大核心 2012年第11期2481-2493,共13页
复杂事件处理技术从多个持续事件流中分析并提取满足特定模式的事件序列.高吞吐率场景下,如何快速准确地识别事件序列是复杂事件处理技术中一个非常重要的问题.现在事件流的模式匹配方法——NFA、Petri网、有向图等——存在语义描述能... 复杂事件处理技术从多个持续事件流中分析并提取满足特定模式的事件序列.高吞吐率场景下,如何快速准确地识别事件序列是复杂事件处理技术中一个非常重要的问题.现在事件流的模式匹配方法——NFA、Petri网、有向图等——存在语义描述能力不足、部分算子实现代价高等缺陷.针对这一现状,设计并实现了一种基于树的模式匹配方法——PMTree.PMTree定义了事件模型及相应事件算子,将事件序列映射为树节点,同时将时间窗口约束及谓词约束等放置在相应节点,这些树节点连接成一棵PMTree来支持实时的事件筛选与过滤.进一步研究了PMTree构建过程中的优化策略,并提出了开销模型以及优化构建算法,以尽可能减少模式匹配开销.实验结果表明,相同测试条件下基于PMTree实现的复杂事件处理引擎Cesar吞吐率是基于NFA实现的开源引擎Esper的3~6倍,并且在不同事件量或事件序列复杂度下性能表现稳定. 展开更多
关键词 事件流 复杂事件处理 模式匹配树 NFA 开销模型
下载PDF
转换时间数据流的加权FP-Tree挖掘算法 被引量:4
7
作者 宋军 陈潇君 《江苏大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第3期330-335,共6页
数据流中的数据分布随着时间动态变化.为了解决传统基于事务的挖掘算法较难建立时间特征和关系特征的相关性,事务和时间作为不同维度的基本单元耗费较高数据存储量的问题,基于事务的FP-Tree挖掘算法,提出了时间间断度的概念.引入了FP-T... 数据流中的数据分布随着时间动态变化.为了解决传统基于事务的挖掘算法较难建立时间特征和关系特征的相关性,事务和时间作为不同维度的基本单元耗费较高数据存储量的问题,基于事务的FP-Tree挖掘算法,提出了时间间断度的概念.引入了FP-Tree结点权重的概念,将时间数据进行动态转换,设计了基于加权FP-Tree的挖掘算法,对时间数据流关联规则挖掘.在实际数据集上完成了挖掘试验.结果表明,该算法相对传统FP-Growth算法能在计算效率降低约20%的情况下,提高10%以上的平均查全率和5%以上的平均查准率. 展开更多
关键词 时间数据流 数据挖掘 加权FP-tree 加权FP-Growth 关联规则
下载PDF
Blocking optimized SIMD tree search on modern processors 被引量:2
8
作者 张倬 陆宇凡 +2 位作者 沈文枫 徐炜民 郑衍衡 《Journal of Shanghai University(English Edition)》 CAS 2011年第5期437-444,共8页
Tree search is a widely used fundamental algorithm. Modern processors provide tremendous computing power by integrating multiple cores, each with a vector processing unit. This paper reviews some studies on exploiting... Tree search is a widely used fundamental algorithm. Modern processors provide tremendous computing power by integrating multiple cores, each with a vector processing unit. This paper reviews some studies on exploiting single instruction multiple date (SIMD) capacity of processors to improve the performance of tree search, and proposes several improvement methods on reported SIMD tree search algorithms. Based on blocking tree structure, blocking for memory alignment and dynamic blocking prefetch are proposed to optimize the overhead of memory access. Furthermore, as a way of non-linear loop unrolling, the search branch unwinding shows that the number of branches can exceed the data width of SIMD instructions in the SIMD search algorithm. The experiments suggest that blocking optimized SIMD tree search algorithm can achieve 1.6 times response speed faster than the un-optimized algorithm. 展开更多
关键词 single instruction multiple date (SIMD) tree search binary search streaming SIMD extensions (SSE) Cell broadband engine (BE)
下载PDF
基于Spark Streaming的并行K-means改进算法研究 被引量:1
9
作者 宋国兴 张清伟 +2 位作者 郑明钊 杜飞 陈彬 《现代计算机》 2021年第18期68-71,共4页
K-means聚类算法作为一种经典的聚类算法被广泛应用,但是传统聚类算法在对实时性聚类要求较高的场景已经不适用,特别是在基于聚类的一些实时推荐算法中。本文通过Spark Streaming框架对传统K-means聚类过程广播共享聚类中心并使用KD树... K-means聚类算法作为一种经典的聚类算法被广泛应用,但是传统聚类算法在对实时性聚类要求较高的场景已经不适用,特别是在基于聚类的一些实时推荐算法中。本文通过Spark Streaming框架对传统K-means聚类过程广播共享聚类中心并使用KD树对迭代过程进行二次优化。实验结果表明优化改进后的K-means聚类算法能够明显提升收敛效率和降低聚类时间,能够满足对实时性聚类的要求。 展开更多
关键词 K-MEANS聚类 实时性聚类 KD树 Spark streaming框架
下载PDF
基于模仿学习的决策树码率自适应算法研究 被引量:1
10
作者 王博 张远 杨咏蓓 《计算机工程》 CAS CSCD 北大核心 2023年第5期206-214,共9页
码率自适应(ABR)算法是提升流媒体服务质量的有效方法,主要分为启发式算法和基于学习的算法两类。传统的启发式算法基于固定的规则,难以应对多变的网络环境,基于深度强化学习的算法映射表达能力较好,但其鲁棒性不佳且可解释性较差。针... 码率自适应(ABR)算法是提升流媒体服务质量的有效方法,主要分为启发式算法和基于学习的算法两类。传统的启发式算法基于固定的规则,难以应对多变的网络环境,基于深度强化学习的算法映射表达能力较好,但其鲁棒性不佳且可解释性较差。针对上述问题,提出一种基于模仿学习的决策树码率自适应算法ABRTree。针对帧级别直播传输系统设计有效的专家ABR算法,并对专家算法的时序经验数据进行离散化处理。采用分类回归树作为码率决策的基础模型,基于专家算法给出的示例数据,采用DAgger算法进行决策树的训练。在此基础上,通过剪枝操作剔除出现较少的样本,从而提升决策树模型的泛化性。实验结果表明,ABRTree在多种视频场景下均能保证画面质量,同时取得较低的端到端延时和较少的卡顿,相比BBA、HYSA和FrameMPC算法,ABRTree算法的QoE性能可以提升1.0%~29.1%,且决策树模型能够直观表达输入特征与码率决策之间的关系,具有较好的可解释性和映射表达能力。 展开更多
关键词 HTTP自适应流媒体 码率自适应算法 决策树 模仿学习 流媒体直播
下载PDF
Efficient Algorithm based on Macro ForestTransducer for XPath Query over Stream
11
作者 Jing Ao Husheng Liao +1 位作者 Hongyu Gao Hang Su 《计算机科学与技术汇刊(中英文版)》 2016年第1期14-23,共10页
关键词 XPATH 有效算法 时间复杂性 XQUERY 研究人员 半结构化 流数据
下载PDF
An Indexed Non-Equijoin Algorithm Based on Sliding Windows over Data Streams
12
作者 YU Ya-xin YANG Xing-hua YU Ge WU Shan-shan 《Wuhan University Journal of Natural Sciences》 EI CAS 2006年第1期294-298,共5页
Processing a join over unbounded input streams requires unbounded memory, since every tuple in one infinite stream must be compared with every tuple in the other. In fact, most join queries over unbounded input stream... Processing a join over unbounded input streams requires unbounded memory, since every tuple in one infinite stream must be compared with every tuple in the other. In fact, most join queries over unbounded input streams are restricted to finite memory due to sliding window constraints. So far, non-indexed and indexed stream equijoin algorithms based on sliding windows have been proposed in many literatures. However, none of them takes non-equijoin into consideration. In many eases, non-equijoin queries occur frequently. Hence, it is worth to discuss how to process non-equijoin queries effectively and efficiently. In this paper, we propose an indexed join algorithm for supporting non-equijoin queries. The experimental results show that our indexed non-equijoin techniques are more efficient than those without index. 展开更多
关键词 non-equijoin data stream sliding window red-black indexing tree
下载PDF
一种大数据流内存B+树构建方法 被引量:4
13
作者 杨良怀 项俊腱 +1 位作者 徐卫 范玉雷 《计算机科学》 CSCD 北大核心 2018年第3期171-177,212,共8页
面向具有时间维度的大数据流,基于二级B+树索引结构,提出了一种高效的面向时间窗口、采用批量装载技术的内存B+树构建方法。该方法对时间窗口进行分片,通过分离出可以并行处理的操作来加速构建过程,将排序操作与数据流接收并行,B+树骨... 面向具有时间维度的大数据流,基于二级B+树索引结构,提出了一种高效的面向时间窗口、采用批量装载技术的内存B+树构建方法。该方法对时间窗口进行分片,通过分离出可以并行处理的操作来加速构建过程,将排序操作与数据流接收并行,B+树骨架的构建与排序并行;采用基于排序的批量装载技术以及优化的构建顺序,能够避免多线程之间不必要的加锁、同步开销,有效提高构建效率。提出的多次微批量排序单次批量装载(MBSortSBLoad)B+树构建方法的构建速度快,能承载的最大流速大。实验验证了所提方法的有效性。 展开更多
关键词 B+树 数据流 内存索引 大数据
下载PDF
基于用户行为分析的应用层组播树生成算法 被引量:21
14
作者 罗建光 赵黎 杨士强 《计算机研究与发展》 EI CSCD 北大核心 2006年第9期1557-1563,共7页
应用层组播采用终端主机转发数据的方式,在一对多的媒体内容分发方面具有广阔的应用前景.与IP组播相比,应用层组播具有灵活和易实施的特点,但是因为终端主机可以自由地退出组播树,应用层组播也存在数据传递易中断的缺点,这对实时性要求... 应用层组播采用终端主机转发数据的方式,在一对多的媒体内容分发方面具有广阔的应用前景.与IP组播相比,应用层组播具有灵活和易实施的特点,但是因为终端主机可以自由地退出组播树,应用层组播也存在数据传递易中断的缺点,这对实时性要求严格的视频直播应用的影响尤为严重.通过对超过1000万条实际视频直播系统的真实用户记录进行统计分析,发现用户平均剩余在线时间随着已经在线时间的增大而增大,并据此提出了一种适用于视频直播的应用层组播树生成算法.模拟结果表明,算法对减少视频直播应用下应用层组播树的数据传递中断次数有明显作用. 展开更多
关键词 应用层组播 组播树生成 视频直播 用户行为分析
下载PDF
CAPE——数据流上的基于频繁模式的分类算法 被引量:7
15
作者 王鹏 吴晓晨 +2 位作者 王晨 汪卫 施伯乐 《计算机研究与发展》 EI CSCD 北大核心 2004年第10期1677-1683,共7页
近年来涌现出很多数据流的应用 ,比如网络日志、传感器网络等 数据流的数据量无限、数据分布变化等特性使得传统的挖掘算法不能很好地解决这些问题 针对上述问题提出了一种数据流上的基于频繁模式的分类算法———CAPE(classificationu... 近年来涌现出很多数据流的应用 ,比如网络日志、传感器网络等 数据流的数据量无限、数据分布变化等特性使得传统的挖掘算法不能很好地解决这些问题 针对上述问题提出了一种数据流上的基于频繁模式的分类算法———CAPE(classificationusingfrequentpattern) CAPE通过数据流中的频繁模式进行分类 ,在压缩数据的同时保存了数据中的分类信息 实验证明 ,这种算法比其他算法有更高的准确性 展开更多
关键词 数据流 分类 决策树 频繁模式
下载PDF
变量定义未使用故障的一种静态测试方法 被引量:3
16
作者 夏玉辉 张威 +1 位作者 李鸣 万琳 《计算机工程与设计》 CSCD 北大核心 2007年第3期515-516,604,共3页
变量定义未使用故障是C/C++程序中的可见故障,该类故障可导致计算结果错误或系统崩溃。针对C/C++语言中变量定义未使用错误类型进行了分析,并从面向具体故障的测试思想出发,给出软件测试系统设计,建立了C/C++语言中变量定义未使用的故... 变量定义未使用故障是C/C++程序中的可见故障,该类故障可导致计算结果错误或系统崩溃。针对C/C++语言中变量定义未使用错误类型进行了分析,并从面向具体故障的测试思想出发,给出软件测试系统设计,建立了C/C++语言中变量定义未使用的故障模型,结合静态测试特点,给出了一种静态查找此类故障的方法。该方法已用于面向故障的软件测试系统中。 展开更多
关键词 软件测试 静态测试 变量定义未使用故障 语法树 控制流图
下载PDF
数据流中结构二叉树挖掘算法研究 被引量:2
17
作者 唐向红 元宁 +1 位作者 易向华 陆见光 《计算机应用研究》 CSCD 北大核心 2017年第10期2924-2928,共5页
针对传统数据流挖掘算法不能挖掘出频繁项之间的关系而且挖掘时间和空间复杂度高、准确度不高的问题,提出了一种数据流中结构二叉树挖掘算法(AMST)。该算法利用了二叉树结构的优势,将所处理事务数据库中的数据流转换成结构化二叉树,然... 针对传统数据流挖掘算法不能挖掘出频繁项之间的关系而且挖掘时间和空间复杂度高、准确度不高的问题,提出了一种数据流中结构二叉树挖掘算法(AMST)。该算法利用了二叉树结构的优势,将所处理事务数据库中的数据流转换成结构化二叉树,然后利用数据流矩阵对结构二叉树进行挖掘。整个过程只对事务数据库进行一次扫描,大大提高了挖掘的效率;此外,算法还找出了具有层次关系的频繁子树。实验结果表明,AMST算法性能稳定,在时间复杂度和空间复杂度方面有很大的优越性,能够快速准确地对数据流进行挖掘。 展开更多
关键词 数据流 频繁项集 结构二叉树 数据流矩阵
下载PDF
湖南消防部队图像综合集成关键技术剖析 被引量:2
18
作者 王湘新 陈绍黔 幸雪初 《科技通报》 北大核心 2012年第12期188-191,共4页
介绍了湖南省公安消防部队图像综合集成建设背景、方案、关键技术以及建设成果,通过图像综合集成建设,为灭火救援指挥作战和部队管理提供了综合通信手段的支持。
关键词 图像 综合集成 MCU 跨网传输 图像资源树 码流控制
下载PDF
基于区域化的P2P流媒体直播系统模型 被引量:6
19
作者 宋启昌 胡君 王栋 《计算机工程》 CAS CSCD 北大核心 2010年第1期127-130,共4页
基于树状拓扑协议及扩展的模型和基于Gossip协议的模型在媒体数据分发方面存在缺陷。针对该问题,提出一种基于区域化的P2P流媒体直播系统模型,采用动态自适应的区域化自治机制,在大规模的流媒体直播网络系统中降低系统管理控制负载的开... 基于树状拓扑协议及扩展的模型和基于Gossip协议的模型在媒体数据分发方面存在缺陷。针对该问题,提出一种基于区域化的P2P流媒体直播系统模型,采用动态自适应的区域化自治机制,在大规模的流媒体直播网络系统中降低系统管理控制负载的开销,优化系统带宽和时延,提高了流媒体数据资源的利用率。 展开更多
关键词 P2P流媒体 树状拓扑协议 GOSSIP协议 区域化
下载PDF
一种基于关联频繁模式的振动数据流挖掘框架 被引量:4
20
作者 张艳梅 陆伟 杨余旺 《数据采集与处理》 CSCD 北大核心 2019年第5期872-882,共11页
针对大型滚转机器轴承故障诊断应用场景中传统故障识别技术通常存在诊断识别精度低的问题,在频域分析基础上提出了一种新的数据挖掘框架——关联频繁模式集挖掘框架(Associated frequency patterns mining framework,AFPMF),由数据预处... 针对大型滚转机器轴承故障诊断应用场景中传统故障识别技术通常存在诊断识别精度低的问题,在频域分析基础上提出了一种新的数据挖掘框架——关联频繁模式集挖掘框架(Associated frequency patterns mining framework,AFPMF),由数据预处理、关联频繁模式集挖掘和故障状态监测组成。首先,在数据预处理过程中,AFPMF在时域上使用时间窗分块划分机械振动数据流,再使用傅立叶变换对数据流进行时频变换实现故障频率特征提取。其次,使用基于滑动窗的关联频繁模式树构建压缩树,求解关联频繁模式集,实现数据挖掘过程。最后,根据数据挖掘结果中出现的振动频率判别潜在故障,从而实现监测故障状态。通过对比AFPMF和传统方法在轴承故障诊断应用场景的实验结果可知,相比传统方案,AFPMF具有更优的故障识别性能。 展开更多
关键词 机器状态监测 轴承故障 关联频繁模式树 振动数据流
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部