期刊文献+
共找到5,431篇文章
< 1 2 250 >
每页显示 20 50 100
零信任环境下的多层次身份认证数据流安全检测算法
1
作者 顾健华 冯建华 +1 位作者 高泽芳 文成江 《现代电子技术》 北大核心 2025年第1期85-89,共5页
身份认证数据流中的敏感信息可能在传输过程中被攻击者截获,并用于恶意目的,导致隐私泄露、身份盗用等风险,为确保网络安全性,提高主体身份认证安全性,提出零信任环境下的多层次身份认证数据流安全检测算法。采用改进的文档指纹检测算... 身份认证数据流中的敏感信息可能在传输过程中被攻击者截获,并用于恶意目的,导致隐私泄露、身份盗用等风险,为确保网络安全性,提高主体身份认证安全性,提出零信任环境下的多层次身份认证数据流安全检测算法。采用改进的文档指纹检测算法实现多层次身份认证过程中主体和客体交互数据流安全监测。通过Rabin-Karp算法实现身份认证数据文档的分块,采用Winnow算法划分身份认证数据分块文档边界后,得到身份认证数据文档指纹,将其与指纹库中的指纹进行匹配对比,识别出多层次身份认证数据流中的异常数据,实现多层次身份认证数据流安全检测。实验结果表明,该算法具有较好的身份认证数据流安全检测能力,有效地降低了网络威胁频率,提升了网络安全性。 展开更多
关键词 零信任 多层次身份认证 数据流安全检测 文档指纹检测算法 Rabin-Karp算法 WINNOW算法
下载PDF
基于HCPN的复杂BPMN协作模型数据流建模与验证 被引量:2
2
作者 黄凤兰 倪枫 +3 位作者 刘姜 陶蒙怡 周奕宁 李业勋 《计算机集成制造系统》 EI CSCD 北大核心 2024年第5期1754-1769,共16页
为了保证复杂BPMN协作模型的正确性,不仅要涵盖多实例和子进程等复杂元素,还要在检测控制流错误的同时检测数据流错误。但业务流程建模标注(BPMN 2.0)缺乏形式化语义的描述,这对模型正确性的验证造成了阻碍。因此,给出了一种具有弧权重... 为了保证复杂BPMN协作模型的正确性,不仅要涵盖多实例和子进程等复杂元素,还要在检测控制流错误的同时检测数据流错误。但业务流程建模标注(BPMN 2.0)缺乏形式化语义的描述,这对模型正确性的验证造成了阻碍。因此,给出了一种具有弧权重的层次化着色Petri网(HCPN)的定义,它既可以对数据流进行形式化表示,又可以对多实例和子进程结构进行建模。进一步提出了从BPMN协作模型到HCPN模型的形式化映射方法。然后基于HCPN模型的弧权重给出了缺失、丢失和冗余3种数据流错误的定义,并提出了对应的检测算法。最后,设计了一个自动化建模与验证的框架,通过一个案例研究说明了该方法的有效性。 展开更多
关键词 着色PETRI网 BPMN协作模型 数据流错误 模型验证 形式化
下载PDF
基于数据流的K-S变化检测的动态多目标规划算法 被引量:1
3
作者 张涛 周晨 +2 位作者 杜锋 陈芳 刘瑞林 《长江大学学报(自然科学版)》 2024年第1期109-116,共8页
为了更加准确地判断环境是否发生变化并快速追踪动态多目标规划问题(dynamicmulti-objectiveoptimization problem,DMOP)当前时刻的Pareto前沿,提出了一种基于数据流的Kolmogorov-Smirnov(K-S)变化检测的动态多目标规划(DSK-SDMOP)算法... 为了更加准确地判断环境是否发生变化并快速追踪动态多目标规划问题(dynamicmulti-objectiveoptimization problem,DMOP)当前时刻的Pareto前沿,提出了一种基于数据流的Kolmogorov-Smirnov(K-S)变化检测的动态多目标规划(DSK-SDMOP)算法。该算法以NSGA-Ⅱ为基础,通过数据流建立2个时刻的检验窗口,再利用K-S检验基于数据流的Pareto最优前沿是否发生变化,检测2个窗口的数据是否服从同一分布来判断环境是否发生变化,并就环境变化的剧烈程度实行相应的应答机制,以提高对环境的适应程度。利用基于数据流的K-S检测方法,对环境变化不会过于敏感,而且不用提前假设对应目标值的分布,易于操作。通过5个动态多目标规划标准测试函数对该算法进行测试,并和现有的2种算法进行对比分析,结果表明该算法处理动态多目标规划问题具有良好的性能。 展开更多
关键词 动态多目标规划 数据流 K-S检验 NSGA-Ⅱ
下载PDF
非平衡数据流在线主动学习方法
4
作者 李艳红 任霖 +1 位作者 王素格 李德玉 《自动化学报》 EI CAS CSCD 北大核心 2024年第7期1389-1401,共13页
数据流分类是数据流挖掘领域一项重要研究任务,目标是从不断变化的海量数据中捕获变化的类结构.目前,几乎没有框架可以同时处理数据流中常见的多类非平衡、概念漂移、异常点和标记样本成本高昂问题.基于此,提出一种非平衡数据流在线主... 数据流分类是数据流挖掘领域一项重要研究任务,目标是从不断变化的海量数据中捕获变化的类结构.目前,几乎没有框架可以同时处理数据流中常见的多类非平衡、概念漂移、异常点和标记样本成本高昂问题.基于此,提出一种非平衡数据流在线主动学习方法(Online active learning method for imbalanced data stream,OALM-IDS).AdaBoost是一种将多个弱分类器经过迭代生成强分类器的集成分类方法,AdaBoost.M2引入了弱分类器的置信度,此类方法常用于静态数据.定义了基于非平衡比率和自适应遗忘因子的训练样本重要性度量,从而使AdaBoost.M2方法适用于非平衡数据流,提升了非平衡数据流集成分类器的性能.提出了边际阈值矩阵的自适应调整方法,优化了标签请求策略.将概念漂移程度融入模型构建过程中,定义了基于概念漂移指数的自适应遗忘因子,实现了漂移后的模型重构.在6个人工数据流和4个真实数据流上的对比实验表明,提出的非平衡数据流在线主动学习方法的分类性能优于其他5种非平衡数据流学习方法. 展开更多
关键词 主动学习 数据流分类 多类非平衡 概念漂移
下载PDF
非平衡概念漂移数据流主动学习方法
5
作者 李艳红 王甜甜 +1 位作者 王素格 李德玉 《自动化学报》 EI CAS CSCD 北大核心 2024年第3期589-606,共18页
数据流分类研究在开放、动态环境中如何提供更可靠的数据驱动预测模型,关键在于从实时到达且不断变化的数据流中检测并适应概念漂移.目前,为检测概念漂移和更新分类模型,数据流分类方法通常假设所有样本的标签都是已知的,这一假设在真... 数据流分类研究在开放、动态环境中如何提供更可靠的数据驱动预测模型,关键在于从实时到达且不断变化的数据流中检测并适应概念漂移.目前,为检测概念漂移和更新分类模型,数据流分类方法通常假设所有样本的标签都是已知的,这一假设在真实场景下是不现实的.此外,真实数据流可能表现出较高且不断变化的类不平衡比率,会进一步增加数据流分类任务的复杂性.为此,提出一种非平衡概念漂移数据流主动学习方法 (Active learning method for imbalanced concept drift data stream, ALM-ICDDS).定义基于多预测概率的样本预测确定性度量,提出边缘阈值矩阵的自适应调整方法,使得标签查询策略适用于类别数较多的非平衡数据流;提出基于记忆强度的样本替换策略,将难区分、少数类样本和代表当前数据分布的样本保存在记忆窗口中,提升新基分类器的分类性能;定义基于分类精度的基分类器重要性评价及更新方法,实现漂移后的集成分类器更新.在7个合成数据流和3个真实数据流上的对比实验表明,提出的非平衡概念漂移数据流主动学习方法的分类性能优于6种概念漂移数据流学习方法. 展开更多
关键词 数据流分类 主动学习 概念漂移 多类不平衡
下载PDF
基于数据流模型的航线网络结构可视分析方法
6
作者 贺怀清 宋淼 刘浩翰 《现代电子技术》 北大核心 2024年第19期27-32,共6页
针对航线网络结构多维属性关联分析问题,提出一种基于数据流模型的多视图协同网络结构可视分析方法。引入数据流模型,增强多维数据分析时的交互和多视图协同效果;构建基于数据流模型的航线网络结构可视分析系统用于方法验证。该方法对... 针对航线网络结构多维属性关联分析问题,提出一种基于数据流模型的多视图协同网络结构可视分析方法。引入数据流模型,增强多维数据分析时的交互和多视图协同效果;构建基于数据流模型的航线网络结构可视分析系统用于方法验证。该方法对比和实验结果表明,利用航线网络数据流实时交互和多视图协同分析网络结构数据,完成聚类、相关性、异常值分析任务,能更好地分析数据之间的关联关系,有助于理解航线网络的结构和特征。最后,通过以上方法分析网络结构特点与不足,提出航线网络优化建议,能更好地帮助用户完成可视分析任务,探索数据分布特征、发现多维数据之间的关联关系。 展开更多
关键词 数据流模型 航线网络 可视分析 多视图协同 实时交互 网络结构
下载PDF
基于离散数据流分割算法的预测方法
7
作者 孙丽君 李方方 胡祥培 《管理科学学报》 CSSCI CSCD 北大核心 2024年第9期48-61,共14页
离散数据流具有不确定性高、演变趋势多变以及多极值性等特征.针对这些特征带来的预测难以兼顾准确性和实时性的问题,提出了基于离散数据流分割算法的预测方法.该方法融合了短期趋势提取与分割点在线自适应检测:预测前基于非参数回归短... 离散数据流具有不确定性高、演变趋势多变以及多极值性等特征.针对这些特征带来的预测难以兼顾准确性和实时性的问题,提出了基于离散数据流分割算法的预测方法.该方法融合了短期趋势提取与分割点在线自适应检测:预测前基于非参数回归短期预测模型和改进的趋势提取算法获取短期(预测日)趋势,提前挖掘、分析预测日的短期趋势规律,以用于在线预测;预测时主要针对在线的数据流,基于假设检验自适应地检测分割点,以解决分割点难以确定的问题,并基于短期趋势修正分割点处的预测模型,减少了预测模型对缓冲数据的依赖.数值实验结果验证了本研究所提预测方法的有效性和可行性. 展开更多
关键词 离散数据流预测 在线数据流分割 非参数回归 趋势提取
下载PDF
流程型生产安全数据流的多Agent节点协同分流优化方法
8
作者 张伟 李泽亚 +1 位作者 张充 赵挺生 《中国安全生产科学技术》 CAS CSCD 北大核心 2024年第8期5-12,共8页
为实现流程型生产安全监测系统的及时、准确决策,结合数据流采集与隐患识别过程,分析非关键数据的冗余、关键数据的缺失和数据计算时延较大的问题,提出基于多Agent的流程型生产安全数据流网络分流调度规划方法和节点流量划分识别机制。... 为实现流程型生产安全监测系统的及时、准确决策,结合数据流采集与隐患识别过程,分析非关键数据的冗余、关键数据的缺失和数据计算时延较大的问题,提出基于多Agent的流程型生产安全数据流网络分流调度规划方法和节点流量划分识别机制。研究结果表明:相较于分簇传输方法,数据流网络分流调度方法可以实现关键隐患数据更高的传输成功率;相较于常规的复杂事件处理方法,本文提出的流量划分识别机制在2种类型数据集上实现隐患事件识别均有更低的计算时延。研究结果可为流程行业安全生产数字化管控模式和数据高质量获取提供参考。 展开更多
关键词 流程型生产 安全生产 数据流 多AGENT 数据分流
下载PDF
基于数据流架构的雷达信号调制方式识别加速
9
作者 黄湘松 王振 潘大鹏 《实验技术与管理》 CAS 北大核心 2024年第5期23-30,共8页
在雷达电子战中,快速并准确地识别敌方雷达信号调制技术对于获得战术优势至关重要,而传统依赖于图形处理单元(graphics processing unit,GPU)的识别方法难以满足此应用场景的低延迟要求。为此,该文设计了一种基于数据流架构(dataflow ar... 在雷达电子战中,快速并准确地识别敌方雷达信号调制技术对于获得战术优势至关重要,而传统依赖于图形处理单元(graphics processing unit,GPU)的识别方法难以满足此应用场景的低延迟要求。为此,该文设计了一种基于数据流架构(dataflow architecture,DF)的雷达信号调制方式识别加速系统。该系统通过对卷积神经网络权值进行二值化来减少模型参数,便于将算法部署到现场可编程门阵列(field-programmablegatearray,FPGA),同时采用数据流架构加快雷达信号调制方式的识别过程。实验结果表明,在确保整体识别准确率的前提下,该加速系统的推理速度相比i7-11800H CPU提升44.43倍,相比RTX 3050Ti GPU提升2.59倍,系统功耗仅为1.724 W。 展开更多
关键词 调制方式识别 深度学习 数据流架构 二值化神经网络 硬件部署
下载PDF
基于LIBS数据流盘的飞机蒙皮激光除漆在线监测判据研究
10
作者 杨文锋 李果 +5 位作者 林德惠 钱自然 李绍龙 左都全 郑鑫 王迪升 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第8期2340-2348,共9页
等离子体产生及演化过程易受基体效应、环境噪声、脉冲能量抖动等影响,导致光谱数据具有不稳定性,从而难以保证以单条谱线为依据建立的监测判据的有效性。以连续多幅LIBS光谱为对象,并结合统计学方法建立的监测判据,可有效提升基于LIBS... 等离子体产生及演化过程易受基体效应、环境噪声、脉冲能量抖动等影响,导致光谱数据具有不稳定性,从而难以保证以单条谱线为依据建立的监测判据的有效性。以连续多幅LIBS光谱为对象,并结合统计学方法建立的监测判据,可有效提升基于LIBS技术的除漆效果监测精度。论文基于搭建的高频纳秒红外脉冲激光除漆LIBS在线监测平台,实时采集了除漆过程的连续多幅LIBS光谱。光谱数据经基线矫正、归一化预处理后,依据面漆、底漆、铝合金基体光谱特征峰差异,并结合材料成分信息,选定BaⅠ(712.55 nm)、CrⅠ(357.48 nm)、CrⅠ(425.43 nm)、TiⅠ(427.45 nm)、CuⅡ(309.76 nm)、CuⅠ(484.22 nm)6条谱线作为特征谱线并监测除漆效果。研究不同除漆效果中6条特征谱线强度变化规律,建立不同除漆效果与所选特征谱线强度变化区间的映射关系。提取每幅谱线的上述6条特征谱线强度作为一组数据单元、将连续10幅谱线的数据单元作为一组数据集,除漆过程中随时间变化的每10组迭代数据集称为数据流盘。对数据流盘中的数据单元、数据集进行分析,结合置信区间,实时判定除漆区域除漆效果,获得基于数据流盘的监测判据。结果表明:该判据可有效监测仍在面漆、面漆完全去除、仍在底漆、底漆完全去除、基体损伤5类除漆效果。依据SRM手册对漆层去除效果的要求,选择面漆完全去除、基体损伤两类除漆效果展示了验证过程,三维微观形貌分析结果与LIBS数据流盘监测判据所得除漆效果结论一致。其中,面漆去除后三维微观形貌分析表明,面漆完全去除精度达1.2μm,有效验证了基于LIBS数据流盘监测判据的适用性及稳定性。 展开更多
关键词 激光除漆 激光诱导击穿光谱 数据流 监测判据 除漆效果
下载PDF
结合软约束的演化数据流模糊聚类算法
11
作者 代少升 边志奇 袁中明 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第2期287-298,共12页
多源局部放电检测中,不同类型的局放信号同时存在且不断变化使得信号的分离更具挑战,而这种情况同样存在于许多数据流的聚类分析场景中。为了能够适应类簇内的不均匀密度和类簇间的重叠边界问题,同时对数据流的漂移和演化进行及时跟踪,... 多源局部放电检测中,不同类型的局放信号同时存在且不断变化使得信号的分离更具挑战,而这种情况同样存在于许多数据流的聚类分析场景中。为了能够适应类簇内的不均匀密度和类簇间的重叠边界问题,同时对数据流的漂移和演化进行及时跟踪,提出了一种结合软约束的实时数据流模糊聚类算法。算法引入2种模糊性软约束来描述微簇距离和密度上的不确定度,通过阈值划分出核心微簇、边界微簇和离群微簇;在类簇边缘使用模糊隶属度,给予微簇分属不同类簇的可能性,保证类簇的完整性并提高聚类效果;使用两阶段的流程结构和2种时间窗口模型,赋予算法具有对可变化数据流的适应能力和更低的时间空间占用率。在多种数据集上的实验表明,该算法相比同类型算法在聚类效果上提升了1%~3%,且平均运行时间缩短5%~20%,在实际硬件平台的测试中也验证了算法的聚类分离性能。 展开更多
关键词 数据流聚类 密度聚类 模糊聚类 概念漂移 局部放电
下载PDF
不确定大数据流分类的决策树模型构建仿真
12
作者 杨知玲 谭树杰 《计算机仿真》 2024年第5期532-535,542,共5页
在不确定大数据流分类过程中,受噪声和孤立点的干扰,导致处理效果和分类精度无法达到预期要求。为解决上述问题,提出一种基于决策树模型的不确定大数据流分类算法。通过采用在线字典学习算法,对不确定大数据流去噪处理,消除噪声对分类... 在不确定大数据流分类过程中,受噪声和孤立点的干扰,导致处理效果和分类精度无法达到预期要求。为解决上述问题,提出一种基于决策树模型的不确定大数据流分类算法。通过采用在线字典学习算法,对不确定大数据流去噪处理,消除噪声对分类过程产生的干扰。构建决策树,在剪枝过程中通过特征过滤算法,滤除不确定大数据流中掺杂的孤立点。将去噪后的不确定大数据流,输入决策树模型中,完成分类工作。实验结果表明,所提算法处理后的不确定大数据流振幅明显减小,且分类精度高,具有一定的应用价值。 展开更多
关键词 决策树模型 在线字典学习算法 特征过滤 不确定大数据流 数据分类
下载PDF
树状结构在数据流求均值中的应用
13
作者 刘薇 陈文 《电脑与电信》 2024年第3期81-83,88,共4页
数据采集过程中,随着数据的增加,数据的平均值持续发生变化。为了研究平均值的变化过程,分析平均值序列的计算方法是有必要的。传统的方法是使用线性顺序存储方式计算均值序列,总的时间复杂度高达O(n2)。提出利用树状结构存储方法求取... 数据采集过程中,随着数据的增加,数据的平均值持续发生变化。为了研究平均值的变化过程,分析平均值序列的计算方法是有必要的。传统的方法是使用线性顺序存储方式计算均值序列,总的时间复杂度高达O(n2)。提出利用树状结构存储方法求取均值序列,并介绍其实现方法,该方法时间复杂度大大降低,仅为O(n*lnn)。 展开更多
关键词 算法 数据流 搜索树 平均值
下载PDF
基于概率推断性语言模型的大数据流分析框架研究:应用于近乎实时的情感分析
14
作者 郭丽 《九江学院学报(自然科学版)》 CAS 2024年第3期85-89,117,共6页
在大数据时代,线上社交网络、传感器网络、移动设备以及企业系统产生了海量数据。这一现象为企业提供了前所未有的机遇,可以利用大数据分析来挖掘有价值的商业信息。然而,传统的商业分析方法可能无法应对大数据的洪流。文章主要贡献是... 在大数据时代,线上社交网络、传感器网络、移动设备以及企业系统产生了海量数据。这一现象为企业提供了前所未有的机遇,可以利用大数据分析来挖掘有价值的商业信息。然而,传统的商业分析方法可能无法应对大数据的洪流。文章主要贡献是展示了一种新型的大数据分析框架BDSASA的开发,该框架利用概率语言模型来分析数亿在线消费者评论中蕴含的消费者情绪。特别是,一个推理模型被嵌入到经典语言建模框架中,以增强对消费者情绪的预测。文章研究工作的实际应用意义在于,组织可以应用文章的大数据分析框架来分析消费者的产品偏好,从而制定更有效的营销和生产策略。 展开更多
关键词 数据 数据流分析 情感分析 在线评论
下载PDF
基于决策树算法的电子通信网络数据流冗余消除方法
15
作者 宋坚 《无线互联科技》 2024年第19期1-3,共3页
现有的消除方法在消除数据流冗余数据时,空间缩减比例过低,导致消除效果不理想。针对这一问题,文章引入决策树算法,设计了新的电子通信网络数据流冗余消除方法。在对电子通信网络数据进行集成处理后,文章利用决策树算法,对电子通信网络... 现有的消除方法在消除数据流冗余数据时,空间缩减比例过低,导致消除效果不理想。针对这一问题,文章引入决策树算法,设计了新的电子通信网络数据流冗余消除方法。在对电子通信网络数据进行集成处理后,文章利用决策树算法,对电子通信网络数据流进行分类。然后,结合相同类别数据的相似度计算结果,文章对数据流中的冗余数据进行了迭代消除。实验表明:应用新方法后,电子通信网络数据流空间缩减比例显著提升,说明新方法的消除效果更理想。 展开更多
关键词 决策树算法 冗余消除 数据流 电子通信
下载PDF
基于模糊聚类的网络敏感数据流动态挖掘 被引量:1
16
作者 鲁江 《电子设计工程》 2024年第9期152-155,160,共5页
为解决网络敏感数据流相似性较高且差异性较大,导致挖掘量下降的问题,该文设计基于模糊聚类的网络敏感数据流动态挖掘方法。构建模糊矩阵,计算不同网络敏感数据流样本间马氏距离,衡量两个样本间相似性,消除变量之间的差异性。引入速度... 为解决网络敏感数据流相似性较高且差异性较大,导致挖掘量下降的问题,该文设计基于模糊聚类的网络敏感数据流动态挖掘方法。构建模糊矩阵,计算不同网络敏感数据流样本间马氏距离,衡量两个样本间相似性,消除变量之间的差异性。引入速度收敛阈值,根据不同数据间模糊关系,对网络敏感数据流进行动态分类。利用遗传迭代算法迭代处理敏感数据流最大散度,获取最优离散性迭代值,通过对特征点进行聚类和均匀分配,结合动态挖掘误差拟合实现数据动态挖掘流。由实验结果可知,该方法挖掘到的数据量较多,无论是相似性数据还是差异性数据均能够被全部挖掘出来,挖掘结果具备可靠性。 展开更多
关键词 模糊聚类 网络敏感 数据流 动态挖掘 模糊关系
下载PDF
基于聚簇模型重用的概念漂移数据流半监督分类算法 被引量:1
17
作者 康伟 黎利辉 文益民 《计算机科学》 CSCD 北大核心 2024年第4期124-131,共8页
带概念漂移的半监督数据流分类任务中,仅有少部分的数据被标记,这给分类器的训练、概念漂移的检测以及分类器对新概念的适应带来了巨大的挑战。现有的半监督聚簇分类算法仅对分类器池中的聚簇模型进行简单的增量更新,未能有效重用历史... 带概念漂移的半监督数据流分类任务中,仅有少部分的数据被标记,这给分类器的训练、概念漂移的检测以及分类器对新概念的适应带来了巨大的挑战。现有的半监督聚簇分类算法仅对分类器池中的聚簇模型进行简单的增量更新,未能有效重用历史聚簇模型。因此,文中提出了一种新的聚簇模型重用的半监督分类算法,称为CDCMR。首先,数据流以数据块的形式到来,对数据块分完类后,训练一个簇数自适应确定的聚簇模型。其次,通过计算分类器池中的各组件分类器与聚簇模型之间的相似度,挑选多个组件分类器。再次,用当前数据块对挑选出来的组件分类器进行模型重用后,与聚簇模型集成。然后,将分类器池划分为新旧更替和多样性最大化分类器池进行更新。最后,对下一个数据块的样本进行集成分类。在多个人工和真实数据集上进行实验,结果表明,所提算法1)能有效适应概念漂移,与现有方法相比其性能有显著性提升。 展开更多
关键词 数据流 半监督学习 概念漂移 聚簇模型重用 集成学习
下载PDF
基于增量加权的不平衡漂移数据流分类算法
18
作者 蔡博 张海清 +3 位作者 李代伟 向筱铭 于曦 邓钧予 《计算机应用研究》 CSCD 北大核心 2024年第3期854-860,共7页
概念漂移是数据流学习领域中的一个难点问题,同时数据流中存在的类不平衡问题也会严重影响算法的分类性能。针对概念漂移和类不平衡的联合问题,在基于数据块集成的方法上引入在线更新机制,结合重采样和遗忘机制提出了一种增量加权集成... 概念漂移是数据流学习领域中的一个难点问题,同时数据流中存在的类不平衡问题也会严重影响算法的分类性能。针对概念漂移和类不平衡的联合问题,在基于数据块集成的方法上引入在线更新机制,结合重采样和遗忘机制提出了一种增量加权集成的不平衡数据流分类方法(incremental weighted ensemble for imbalance learning,IWEIL)。该方法以集成框架为基础,利用基于可变大小窗口的遗忘机制确定基分类器对窗口内最近若干实例的分类性能,并计算基分类器的权重,随着新实例的逐个到达,在线更新IWEIL中每个基分器及其权重。同时,使用改进的自适应最近邻SMOTE方法生成符合新概念的新少数类实例以解决数据流中类不平衡问题。在人工数据集和真实数据集上进行实验,结果表明,相比于DWMIL算法,IWEIL在HyperPlane数据集上的G-mean和recall指标分别提升了5.77%和6.28%,在Electricity数据集上两个指标分别提升了3.25%和6.47%。最后,IWEIL在安卓应用检测问题上表现良好。 展开更多
关键词 数据流 不平衡数据 概念漂移 增量加权 集成学习
下载PDF
基于采样的数据流差分隐私快速发布算法
19
作者 王修君 莫磊 +4 位作者 郑啸 卫琳娜 董俊 刘志 郭龙坤 《计算机研究与发展》 EI CSCD 北大核心 2024年第10期2433-2447,共15页
基于云原生数据库的许多应用场景需要处理海量的数据流.为了实时分析数据流中的群体趋势信息而又不泄露单个用户的隐私,这些应用需要在每个时刻都可以为数据流中的最近数据集快速创建可以安全发布的差分隐私直方图.然而,现有的直方图发... 基于云原生数据库的许多应用场景需要处理海量的数据流.为了实时分析数据流中的群体趋势信息而又不泄露单个用户的隐私,这些应用需要在每个时刻都可以为数据流中的最近数据集快速创建可以安全发布的差分隐私直方图.然而,现有的直方图发布方法因缺乏高效数据结构,导致无法快速提取关键信息以确保数据的实时可用性.为解决此问题,深入分析数据采样与隐私保护之间的关系,提出基于采样的数据流差分隐私快速发布算法SPF(sampling based fast publishing algorithm with differential privacy for data stream).SPF首创高效数据流采样草图结构(efficient data stream sampling sketch structure,EDS),EDS对滑动窗口内数据进行采样统计估计,并过滤不合理数据,实现了对关键信息的快速提取.然后,证明EDS结构输出的近似值理论上等效于对真实值添加差分隐私噪声.最后,为了满足用户所提供的隐私保护强度,并且避免正确反映原始数据流的真实情况,提出了一种基于高效数据流采样的自适应加噪算法.根据用户的隐私保护强度和EDS结构所提供的隐私保护强度之间的关系,通过隐私分配的方式自适应生成最终可发布直方图.实验证明,相较于现有算法,SPF在保持相同数据可用性的前提下显著降低了时间和空间开销. 展开更多
关键词 云原生数据 滑动窗口 数据流 差分隐私 数据采样 数据发布
下载PDF
基于数据流传播路径学习的智能合约时间戳漏洞检测
20
作者 张卓 刘业鹏 +3 位作者 薛建新 鄢萌 陈嘉弛 毛晓光 《软件学报》 EI CSCD 北大核心 2024年第5期2325-2339,共15页
智能合约是一种被大量部署在区块链上的去中心化的应用.由于其具有经济属性,智能合约漏洞会造成潜在的巨大经济和财产损失,并破坏以太坊的稳定生态.因此,智能合约的漏洞检测具有十分重要的意义.当前主流的智能合约漏洞检测方法(诸如Oye... 智能合约是一种被大量部署在区块链上的去中心化的应用.由于其具有经济属性,智能合约漏洞会造成潜在的巨大经济和财产损失,并破坏以太坊的稳定生态.因此,智能合约的漏洞检测具有十分重要的意义.当前主流的智能合约漏洞检测方法(诸如Oyente和Securify)采用基于人工设计的启发式算法,在不同应用场景下的复用性较弱且耗时高,准确率也不高.为了提升漏洞检测效果,针对智能合约的时间戳漏洞,提出基于数据流传播路径学习的智能合约漏洞检测方法Scruple.所提方法首先获取时间戳漏洞的潜在的数据传播路径,然后对其进行裁剪并利用融入图结构的预训练模型对传播路径进行学习,最后对智能合约是否具有时间戳漏洞进行检测.相比而言,Scruple具有更强的漏洞捕捉能力和泛化能力,传播路径学习的针对性强,避免了对程序整体依赖图学习时造成的层次太深而无法聚焦漏洞的问题.为了验证Scruple的有效性,在真实智能合约的数据集上,开展Scruple方法与13种主流智能合约漏洞检测方法的对比实验.实验结果表明,Scruple在检测时间戳漏洞上的准确率,召回率和F1值分别可以达到0.96,0.90和0.93,与13种当前主流方法相比,平均相对提升59%,46%和57%,从而大幅提升时间戳漏洞的检测能力. 展开更多
关键词 智能合约 时间戳漏洞 漏洞检测 数据流传播路径 预训练
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部