期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
概念漂移数据流集成分类算法综述 被引量:13
1
作者 杜诗语 韩萌 +2 位作者 申明尧 张春砚 孙蕊 《计算机工程》 CAS CSCD 北大核心 2020年第1期15-24,30,共11页
针对概念漂移数据流集成分类算法的基本概念、相关工作、适用范围及优缺点等方面进行具体阐述,重点分析突变型、渐变型、重复型和增量型集成分类算法,以及集成分类中的Bagging、Boosting、基分类器组合学习策略与在线学习、基于块的集... 针对概念漂移数据流集成分类算法的基本概念、相关工作、适用范围及优缺点等方面进行具体阐述,重点分析突变型、渐变型、重复型和增量型集成分类算法,以及集成分类中的Bagging、Boosting、基分类器组合学习策略与在线学习、基于块的集成、增量学习关键技术,指出现阶段概念漂移数据流集成分类算法所需解决的主要问题,并对集成基分类器的动态更新与加权组合、多类型概念漂移的快速检测等研究方向进行分析和展望。 展开更多
关键词 动态数据流 集成 分类 概念漂移 增量学习
下载PDF
基于Boosting的迭代加权集成分类算法 被引量:1
2
作者 杜诗语 韩萌 +2 位作者 申明尧 张春砚 孙蕊 《计算机应用研究》 CSCD 北大核心 2021年第4期1038-1043,共6页
在集成分类中,如何对基分类器实现动态更新和为基分类器分配合适的权值一直是研究的重点。针对以上两点,提出了BIE和BIWE算法。BIE算法通过最新训练的基分类器的准确率确定集成是否需要替换性能较差的基分类器及需替换的个数,实现对集... 在集成分类中,如何对基分类器实现动态更新和为基分类器分配合适的权值一直是研究的重点。针对以上两点,提出了BIE和BIWE算法。BIE算法通过最新训练的基分类器的准确率确定集成是否需要替换性能较差的基分类器及需替换的个数,实现对集成分类器的动态迭代更新;BIWE算法在此基础上提出了一个加权函数,对具有不同参数特征的数据流可以有针对性地获得基分类器的最佳权值,从而提升集成分类器的整体性能。实验结果表明,BIE算法相较对比算法在准确率持平或略高的情况下,可以减少生成树的叶子数、节点数和树的深度;BIWE算法相较对比算法不仅准确率较高,而且能大幅度减少生成树的规模。 展开更多
关键词 数据流 分类算法 集成学习 BOOSTING
下载PDF
数据流决策树分类方法综述 被引量:16
3
作者 贾涛 韩萌 +2 位作者 王少峰 杜诗语 申明尧 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2019年第4期49-60,共12页
数据流的特征是海量的、高速流动的、实时处理的.由于一些数据分布随着时间而改变,因此将这些数据流称为概念漂移.首先按照分类模型对数据流决策树进行分类,分为单分类决策树和集成分类决策树.单分类模型分为快速决策树、变异决策树和... 数据流的特征是海量的、高速流动的、实时处理的.由于一些数据分布随着时间而改变,因此将这些数据流称为概念漂移.首先按照分类模型对数据流决策树进行分类,分为单分类决策树和集成分类决策树.单分类模型分为快速决策树、变异决策树和其他决策树算法.集成分类模型分为衍生快速决策树和随机决策树变体算法.其次介绍了概念漂移处理技术,包括概念漂移问题的描述、常见的概念漂移处理技术和用于解决概念漂移的决策树算法.接着介绍了增量模型决策树算法,最后对本文介绍的决策树算法进行分析总结. 展开更多
关键词 数据流挖掘 分类 决策树 概念漂移 集成分类
下载PDF
融合XGBoost和Multi-GRU的数据中心服务器能耗优化算法 被引量:5
4
作者 申明尧 韩萌 +2 位作者 杜诗语 孙蕊 张春砚 《计算机应用》 CSCD 北大核心 2022年第1期198-208,共11页
随着云计算技术的快速发展,数据中心的数量大幅增加,随之而来的能源消耗问题逐渐成为一个研究热点。针对服务器能耗优化问题,提出了一种融合极限梯度提升(XGBoost)和多个门控循环单元(Multi-GRU)的数据中心服务器能耗优化(ECOXG)算法。... 随着云计算技术的快速发展,数据中心的数量大幅增加,随之而来的能源消耗问题逐渐成为一个研究热点。针对服务器能耗优化问题,提出了一种融合极限梯度提升(XGBoost)和多个门控循环单元(Multi-GRU)的数据中心服务器能耗优化(ECOXG)算法。首先利用Linux终端监控命令和功耗仪收集服务器各部件的资源占用信息和能耗等数据,并对其进行数据预处理来得到资源利用率。其次将资源利用率串联构造成向量形式的时间序列,用其训练Multi-GRU负载预测模型,并根据预测结果对服务器进行模拟降频,以得到降频后的负载数据。然后将服务器的资源利用率与相同时刻的能耗数据相结合,并用其训练XGBoost能耗预测模型。最后将降频后的负载数据输入到训练后的XGBoost模型中,从而预测出降频后的服务器能耗。在6台物理服务器实际资源利用率数据上的实验表明,与卷积神经网络(CNN)、长短期记忆(LSTM)网络、CNN-GRU和CNN-LSTM模型相比,ECOXG算法在均方根误差(RMSE)上分别降低了50.9%、31.0%、32.7%、22.9%;同时,与LSTM、CNN-GRU和CNN-LSTM模型相比,ECOXG算法在训练时间上分别节省了43.2%、47.1%、59.9%。实验结果表明,ECOXG算法能够在服务器能耗预测和能耗优化方面提供一定的理论基础,且在准确性和运行效率方面明显优于对比算法。此外,模拟降频后的服务器能耗已明显低于真实能耗,且在服务器的利用率较低时降耗效果显著。 展开更多
关键词 数据中心 能耗优化 负载 极限梯度提升 多个门控循环单元
下载PDF
含负项top-k高效用项集挖掘算法 被引量:4
5
作者 孙蕊 韩萌 +2 位作者 张春砚 申明尧 杜诗语 《计算机应用》 CSCD 北大核心 2021年第8期2386-2395,共10页
含负项高效用项集(HUI)挖掘是新兴的数据挖掘任务之一。为了挖掘满足用户需求的含负项HUI结果集,提出了含负项top-k高效用项集(THN)挖掘算法。为了提升THN算法的时空性能,提出了自动提升最小效用阈值的策略,并采用模式增长方法进行深度... 含负项高效用项集(HUI)挖掘是新兴的数据挖掘任务之一。为了挖掘满足用户需求的含负项HUI结果集,提出了含负项top-k高效用项集(THN)挖掘算法。为了提升THN算法的时空性能,提出了自动提升最小效用阈值的策略,并采用模式增长方法进行深度优先搜索;使用重新定义的子树效用和重新定义的本地效用修剪搜索空间;使用事务合并技术和数据集投影技术解决多次扫描数据库的问题;为了提高效用计数的速度,使用效用数组计数技术计算项集的效用。实验结果表明,THN算法的内存消耗约为HUINIV-Mine算法的1/60,约为FHN算法的1/2;THN算法的执行时间是FHN算法的1/10;而且该算法在密集数据集上的性能更好。 展开更多
关键词 项集挖掘 高效用项集 top-k项集 负项 正项
下载PDF
高效用模式挖掘关键技术综述 被引量:4
6
作者 张春砚 韩萌 +2 位作者 孙蕊 杜诗语 申明尧 《计算机应用研究》 CSCD 北大核心 2021年第2期330-340,共11页
通过分析有关高效用模式挖掘(high utility pattern mining,HUPM)最先进的方法,对其进行全面和结构化的概述。首先,通过介绍HUPM的相关概念、公式并给出应用示例,对HUPM有更深一步的理解;针对用于挖掘不同类型HUPM的最常见和最先进的关... 通过分析有关高效用模式挖掘(high utility pattern mining,HUPM)最先进的方法,对其进行全面和结构化的概述。首先,通过介绍HUPM的相关概念、公式并给出应用示例,对HUPM有更深一步的理解;针对用于挖掘不同类型HUPM的最常见和最先进的关键技术进行分类,包括基于Apriori、基于树、基于列表、基于映射、基于垂直/水平数据格式、基于索引等方法。针对现有关键技术的用途和优缺点进行了全面概述,由于静态数据难以满足实际需要,总结了在数据流上应用的HUPM方法,主要包括基于增量方法、基于滑动窗口模型方法、基于时间衰减模型方法、基于地标模型方法等。最后,给出了现有技术的不足和改进方向,并且有针对性地提出了新的研究方法。 展开更多
关键词 模式挖掘 高效用模式挖掘 数据流 增量型数据
下载PDF
数据流决策树集成分类算法综述 被引量:5
7
作者 申明尧 韩萌 +2 位作者 杜诗语 孙蕊 张春砚 《计算机应用与软件》 北大核心 2022年第9期1-10,共10页
数据流的集成分类方法可以提高预测精度或者可将复杂、困难的学习问题分解为更简单、容易的子问题,且对概念漂移有良好的适应性和恢复性。结合Bagging、Boosting和Stacking三种集成学习框架的工作原理和方法,分别对其相关决策树算法进... 数据流的集成分类方法可以提高预测精度或者可将复杂、困难的学习问题分解为更简单、容易的子问题,且对概念漂移有良好的适应性和恢复性。结合Bagging、Boosting和Stacking三种集成学习框架的工作原理和方法,分别对其相关决策树算法进行了分析和总结。详细介绍了数据流中的概念漂移问题,以及对不同类型的概念漂移的检测处理方法。从所属集成学习框架、对比算法、算法优缺点等多角度对数据流决策树集成分类算法进行了分析和总结。同时对数据流决策树集成分类算法的典型应用和主要平台作了详细介绍。对数据流集成分类领域中的研究趋势进行了探讨,并归纳出下一步的研究方向。 展开更多
关键词 分类 决策树 集成学习框架 概念漂移
下载PDF
精简高效用模式挖掘综述 被引量:2
8
作者 孙蕊 韩萌 +2 位作者 张春砚 申明尧 杜诗语 《计算机应用研究》 CSCD 北大核心 2021年第4期975-981,共7页
全集高效用模式挖掘算法存在的关键问题之一是会产生冗余的高效用项集,这将导致用户很难在大量的高效用项集中发现有用的信息,严重降低了高效用模式挖掘算法的性能。为解决这一问题,衍生出了精简高效用模式挖掘算法,其主要包括最大高效... 全集高效用模式挖掘算法存在的关键问题之一是会产生冗余的高效用项集,这将导致用户很难在大量的高效用项集中发现有用的信息,严重降低了高效用模式挖掘算法的性能。为解决这一问题,衍生出了精简高效用模式挖掘算法,其主要包括最大高效用模式、闭合高效用模式、top-k高效用模式以及三者之间的组合高效用模式挖掘算法等。首先,介绍了精简高效用模式的相关问题描述;然后,从有无候选项集生成、一两阶段挖掘方法、数据结构类型和剪枝策略等角度,重点分类总结了精简高效用模式挖掘方法;最后,给出了精简高效用模式的进一步研究方向,包括处理基于负项的高效用精简模式、处理基于时间的高效用精简模式及处理动态复杂的数据等。 展开更多
关键词 精简高效用模式挖掘 最大高效用模式 闭合高效用模式 top-k高效用模式
下载PDF
漫画风云:马荣成VS黄玉郎
9
作者 杜诗语 《大学时代(A版)》 2006年第7期40-42,共3页
马荣成?如果说漫画《风云》,你大概不会觉得陌生,这是马荣成最广为人们熟悉的经典漫画作品。这本漫画从1989年开始连载,十多年来,一直是全香港销量最高、读者最多的港产漫画,聂风、步惊云的漫画形象可以说是深入人心。如今漫画产业朝着... 马荣成?如果说漫画《风云》,你大概不会觉得陌生,这是马荣成最广为人们熟悉的经典漫画作品。这本漫画从1989年开始连载,十多年来,一直是全香港销量最高、读者最多的港产漫画,聂风、步惊云的漫画形象可以说是深入人心。如今漫画产业朝着多方面发展,以突破自身的局限。黄玉郎的《神兵》也拍成电影。黄玉郞是谁?600万人口的香港,读漫画的人大约有100万,在这100万漫画迷中,没有人不知道黄玉郎的名字。可以说香港近20年漫画的快速兴起,与黄玉郞是分不开的。黄玉郎以自编自画起家,他用带徒弟的传统方式带出了一大批连环画人才。他还对香港漫画有过多项创新,如把原来的横20开本的“公仔书”(小人书)改为16开本的定期出版物;把单色印刷改为彩色印刷;从个人单干改为工厂式的流水作业。此外,还在他的公司配备了现代高科技印刷设备,使漫画的印刷装帧水平都得到了很大的提高。黄玉郎说在香港就是日产漫画了只能占到25%的市场,本土漫画占的比例还是比较大的。虽然钱钟书先生曾经说,看见鸡蛋不一定要知道下蛋的母鸡是哪只。但人难免有好奇心。黄玉郎、马荣成这两位港产漫画的代表人物,在给漫画迷造梦的同时也成就了自己乃至香港漫画业的梦想,他们笔下创造的人物带有港产漫画的浓烈色彩。如果说谢立文、麦家碧夫妇的麦兜在港漫画中非主流化,那么黄玉郎、马荣成的漫画绝对就是港产漫画的主流。 展开更多
关键词 荣成 漫画作品 画风 彩色印刷 代表人物 现代高科技 《风云》 漫画产业 传统方式 流水作业
下载PDF
2006“情人节”:追寻古典爱情
10
作者 杜诗语 妖影瞳瞳 《大学时代(A版)》 2006年第1期26-29,共4页
让我们翻开那些古旧的线装书,看一段段哀伤优雅的爱情纷至沓来:白露凝霜的清晨,蒹葭苍苍和荻花瑟瑟的秋风中,所谓伊人兮,在水之一方;庐州古道旁,刘兰芝与焦仲卿执手相看泪眼,“蒲苇韧如丝,磐石无转移”的誓言穿越千年。那是一个衣冠胜... 让我们翻开那些古旧的线装书,看一段段哀伤优雅的爱情纷至沓来:白露凝霜的清晨,蒹葭苍苍和荻花瑟瑟的秋风中,所谓伊人兮,在水之一方;庐州古道旁,刘兰芝与焦仲卿执手相看泪眼,“蒲苇韧如丝,磐石无转移”的誓言穿越千年。那是一个衣冠胜雪、玉颜如月的年代,那是一个一诺千金、九死无悔的年代。白马秋风塞上,杏花春雨江南;把酒东篱,剪烛西窗。那是一个诗意飘扬如阳春飞絮醉迷人眼的年代,那是一个水墨点染人生如一幅写意的年代。这是多情的年代,这是诗意的年代,这是春江花月夜、秋雨梧桐时的年代,黄花深巷,红叶低窗,如此深夜,且以一曲琵琶酬唱这永恒的诗篇、古典的爱情。 展开更多
关键词 “情人节” 爱情 古典 春江花月夜 年代 线装书 焦仲卿 刘兰芝 诗意
下载PDF
美人相惜 我的世界你最懂
11
作者 杜诗语 《大学时代(A版)》 2006年第10期24-26,共3页
“超级女声”比赛最热时,曾很八卦地留意那些做了大众评委的“超女”如何投票。结果发现,当美女站在PK台时,被淘汰的“偶像派”们多数会将手里的票投给美女。美人相遇,总是要被他人比较,并且被要求互相评价。林志玲和李嘉欣同台走秀,互... “超级女声”比赛最热时,曾很八卦地留意那些做了大众评委的“超女”如何投票。结果发现,当美女站在PK台时,被淘汰的“偶像派”们多数会将手里的票投给美女。美人相遇,总是要被他人比较,并且被要求互相评价。林志玲和李嘉欣同台走秀,互相赞美,给足对方100分,并且说:“大家都很美,都很不容易”。哪怕刹那间的心怜、理解、欣赏,都让人感到这烟花惜了那烟花。 展开更多
关键词 美人 世界 超级女声 美女 烟花 中国 娱乐业 影视明星
下载PDF
跨代趟年,不褪的校园记忆
12
作者 杜诗语 熊梅 《大学时代(A版)》 2006年第6期48-51,共4页
记忆中,大学校园的一切,总是那样的鲜明、纯粹、激烈、丰沛。阳光总是特别的灿烂,草地总是分外的青翠,风雨总是格外的暴烈。曾经睡在上铺的兄弟,挤过一顶蚊帐的姐妹,那一张亲切的脸,是蚀刻在我们成长铜版中最动人的记痕,每一次刷新,那... 记忆中,大学校园的一切,总是那样的鲜明、纯粹、激烈、丰沛。阳光总是特别的灿烂,草地总是分外的青翠,风雨总是格外的暴烈。曾经睡在上铺的兄弟,挤过一顶蚊帐的姐妹,那一张亲切的脸,是蚀刻在我们成长铜版中最动人的记痕,每一次刷新,那些岁月那些热情那些狂欢那些眼泪,便无比新鲜地汹涌而来。 展开更多
关键词 《跨代趟年 不褪的校园记忆》 中国 当代文学作品 报告文学
下载PDF
网乐神话
13
作者 史文娟 杜诗语 《大学时代(A版)》 2006年第3期22-25,共4页
现在网络歌曲唱响大街小巷,《老鼠爱大米》《两只蝴蝶》《别说你的眼泪我无所谓》《c》等。网络歌手蹿红速度之快让众多歌手自叹不如。
关键词 神话 网络 歌手 《老鼠爱大米》 《两只蝴蝶》
下载PDF
基于紧凑效用列表的增量高效用模式挖掘方法 被引量:2
14
作者 张春砚 韩萌 +2 位作者 孙蕊 杜诗语 申明尧 《山东大学学报(工学版)》 CAS CSCD 北大核心 2021年第2期122-128,共7页
针对存在大量冗余数据等问题,提出紧凑增量高效用挖掘算法。采用HUI-trie结构和紧凑效用列表两种结构,前者用于更新高效用项集的效用,后者用于存储信息,而无需生成任何候选项。这两种结构使算法无需再次分析整个数据集,就可以将增加的... 针对存在大量冗余数据等问题,提出紧凑增量高效用挖掘算法。采用HUI-trie结构和紧凑效用列表两种结构,前者用于更新高效用项集的效用,后者用于存储信息,而无需生成任何候选项。这两种结构使算法无需再次分析整个数据集,就可以将增加的数据反映到以前的分析结果中,更有效地处理增量数据集。试验结果表明,该算法在各种数据集上,运行时间平均提高38%,内存平均减少32%,具有一定的可扩展性。 展开更多
关键词 增量数据集 高效用模式 紧凑效用列表 候选项集 效用
原文传递
基于分区列表的增量闭合高效用模式挖掘方法 被引量:1
15
作者 张春砚 韩萌 +2 位作者 孙蕊 杜诗语 申明尧 《山东大学学报(工学版)》 CAS CSCD 北大核心 2022年第4期118-130,共13页
为减少构建效用列表的数量和占用的内存,在时间和空间方面提高挖掘性能,提出增量闭合高效用挖掘算法(incremental closed high utility mining,ICHUM),从增量数据集中有效地挖掘闭合高效用项集。此算法提出一个增量分区效用列表结构,该... 为减少构建效用列表的数量和占用的内存,在时间和空间方面提高挖掘性能,提出增量闭合高效用挖掘算法(incremental closed high utility mining,ICHUM),从增量数据集中有效地挖掘闭合高效用项集。此算法提出一个增量分区效用列表结构,该结构仅通过一次数据库扫描即可构建和更新列表,更有效地处理增量数据。在构造此列表结构的过程中,算法还应用有效的融合修剪策略,从而减少无效列表的构建数量。在各种数据集上的试验结果表明,与对比算法相比,该算法减少了30%的运行时间和33%的内存消耗,具有一定的可扩展性。 展开更多
关键词 增量挖掘 闭合高效用模式 增量分区效用列表 效用 融合修剪策略
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部