期刊文献+
共找到183篇文章
< 1 2 10 >
每页显示 20 50 100
数据挖掘工具集TH-Miner
1
作者 任靖 陆甡 +3 位作者 翟旭君 戴涛 刘璧松 李春平 《计算机工程》 CAS CSCD 北大核心 2006年第4期79-81,共3页
TH-Miner是以Java实现的跨平台数据挖掘可视化系统。在TH-Miner中实现了多种经典的数据挖掘算法,并构造了几种新的改进算法。TH-Miner包括可视化聚类挖掘工具、分类算法工具、序列模式挖掘算法工具以及文本分类工具。
关键词 数据挖掘工具 分类 聚类 序列模式挖掘 文本分类
下载PDF
Mapping frequent spatio-temporal wind profile patterns using multi-dimensional sequential pattern mining
2
作者 Norhakim Yusof Raul Zurita-Milla 《International Journal of Digital Earth》 SCIE EI 2017年第3期238-256,共19页
Holistic understanding of wind behaviour over space,time and height is essential for harvesting wind energy application.This study presents a novel approach for mapping frequent wind profile patterns using multidimen... Holistic understanding of wind behaviour over space,time and height is essential for harvesting wind energy application.This study presents a novel approach for mapping frequent wind profile patterns using multidimensional sequential pattern mining(MDSPM).This study is illustrated with a time series of 24 years of European Centre for Medium-Range Weather Forecasts European Reanalysis-Interim gridded(0.125°×0.125°)wind data for the Netherlands every 6 h and at six height levels.The wind data were first transformed into two spatio-temporal sequence databases(for speed and direction,respectively).Then,the Linear time Closed Itemset Miner Sequence algorithm was used to extract the multidimensional sequential patterns,which were then visualized using a 3D wind rose,a circular histogram and a geographical map.These patterns were further analysed to determine their wind shear coefficients and turbulence intensities as well as their spatial overlap with current areas with wind turbines.Our analysis identified four frequent wind profile patterns.One of them highly suitable to harvest wind energy at a height of 128 m and 68.97%of the geographical area covered by this pattern already contains wind turbines.This study shows that the proposed approach is capable of efficiently extracting meaningful patterns from complex spatio-temporal datasets. 展开更多
关键词 Spatio-temporal data mining multi-dimensional sequential pattern mining wind shear coefficient turbulence intensity wind energy
原文传递
生态脆弱煤矿区水体中微生物群落特征及矿井充水指示 被引量:2
3
作者 范立民 李涛 +2 位作者 高颖 白如鸿 孙强 《煤炭科学技术》 EI CAS CSCD 北大核心 2024年第1期255-266,共12页
我国生态脆弱矿区水资源整体匮乏,但局部地区矿井涌水却异常巨大。对生态脆弱矿区异常矿井充水水源识别,对矿区生态环境保护意义重大。研究以涌水量超过1 000 m^(3)/h的榆树湾煤矿为背景,在分析矿井涌水量特征的基础上,采集了研究区主... 我国生态脆弱矿区水资源整体匮乏,但局部地区矿井涌水却异常巨大。对生态脆弱矿区异常矿井充水水源识别,对矿区生态环境保护意义重大。研究以涌水量超过1 000 m^(3)/h的榆树湾煤矿为背景,在分析矿井涌水量特征的基础上,采集了研究区主要含水层和矿井涌水点的30个水样,开展了水样高通量微生物测序研究。对测序结果采用Alpha多样性分析、Beta多样性分析及微生物构成差异分析,系统研究了矿井水体中微生物群落特征,分析了矿井充水来源。研究结果表明:高通量测试结果通过了Coverage指数检验,验证了其用于矿井充水识别的可行性。但人类活动密切接触的水样显示出微生物更加丰富,需要在取样中有效规避。榆树湾煤矿浅表松散含水层中微生物丰富度和多样性都较高,以新鞘脂菌属(Novosphingobium)、梭杆菌属(Fusobacterium)和硫属(Sulfuricum)等微生物丰度最高;直罗组为代表的基岩含水层微生物丰富度较低,但微生物多样性较高,以丛毛单胞菌属(Comamonas)、蛲虫属(Vermiphilaceae)和巴氏杆菌(Paeniglutamicibacter)等微生物丰度最高。所有水样中最为优势的门类为变形菌门,占比达到35.5%~89.7%。Alpha多样性、PCoA和NSDM分析揭示了榆树湾矿井充水水源主要来自松散含水层和直罗组含水层。但Beta多样性分析发现,随着直罗组静储量的释放,松散层中离石组黄土充水比例进一步增大。综合分析显示,榆树湾煤矿目前为基岩含水层快速释水+离石组含水层持续释水模式的充水模式,矿井涌水统计分析结果验证了这一结论。研究为相似化学成分含水层充水识别,提供了新的方法。 展开更多
关键词 保水采煤 高通量测序 矿井充水 微生物群落 涌水规律
下载PDF
一种对比序列模式挖掘算法
4
作者 谢婷萱 武优西 +1 位作者 王月华 李艳 《小型微型计算机系统》 CSCD 北大核心 2024年第8期1808-1815,共8页
对比序列模式挖掘作为序列模式挖掘领域的一个重要分支,可以有效识别不同类别间差异显著的模式,并被广泛应用在序列分类、特征提取等场景中.但传统的对比序列模式挖掘仅考虑了模式在序列中是否出现,忽略了模式在序列中的重复性;并且需... 对比序列模式挖掘作为序列模式挖掘领域的一个重要分支,可以有效识别不同类别间差异显著的模式,并被广泛应用在序列分类、特征提取等场景中.但传统的对比序列模式挖掘仅考虑了模式在序列中是否出现,忽略了模式在序列中的重复性;并且需要用户预先设置间隙约束值,导致算法的灵活性较差.为了解决上述问题,本文提出一次性条件下自适应对比序列模式挖掘算法OSCP,该算法采用逆向填充策略计算模式支持度,不仅关注了模式在序列中的具体出现情况,还提高了算法的计算效率;同时采用模式连接策略以减少候选模式数量.此外,本文采用自适应间隙,无需用户预先设置间隙约束,可基于序列的实际特征计算模式的支持度.实验结果表明,OSCP算法的挖掘性能和分类效果均优于其他对比算法. 展开更多
关键词 序列模式挖掘 对比模式 候选模式生成 序列分类
下载PDF
基于组合服务执行信息的服务选取方法研究 被引量:18
5
作者 张明卫 魏伟杰 +2 位作者 张斌 张锡哲 朱志良 《计算机学报》 EI CSCD 北大核心 2008年第8期1398-1411,共14页
组合服务选取问题是服务计算领域的一个研究热点问题,已往的选取方法大多基于难以准确获取的服务QoS信息,且算法思路复杂.文中提出了一种基于组合服务执行信息的服务选取方法.该方法分为3个阶段:数据生成阶段、数据挖掘阶段和服务选取阶... 组合服务选取问题是服务计算领域的一个研究热点问题,已往的选取方法大多基于难以准确获取的服务QoS信息,且算法思路复杂.文中提出了一种基于组合服务执行信息的服务选取方法.该方法分为3个阶段:数据生成阶段、数据挖掘阶段和服务选取阶段,分别进行组合服务执行信息的记载和相关数据集的生成、路径分支关联规则和服务执行顺序序列模式的挖掘以及基于挖掘产生的知识模式进行服务选取.文中首先给出一种可以方便记载日志的服务组合系统架构;然后提出一种基于时间加权的算法模型,以有效地进行路径分支关联规则和顺序序列模式的挖掘;最后对文中的组合服务选取方法进行描述.实验结果表明:文中方法在选取出的组合服务健壮性方面要优于基于QoS的方法. 展开更多
关键词 组合服务 服务选取 关联规则 序列模式 数据挖掘
下载PDF
免预设间隔约束的对比序列模式高效挖掘 被引量:15
6
作者 王慧锋 段磊 +3 位作者 左劼 王文韬 李钟麒 唐常杰 《计算机学报》 EI CSCD 北大核心 2016年第10期1979-1991,共13页
对比序列模式在识别不同类别序列样本集合的特征上有着重要的作用.已有对比序列模式挖掘算法需要用户预设间隔约束.在不具备充分先验知识情况下,用户不易准确地预设恰当的间隔约束,进而导致不能发现有用的模式.对此,文中设计了带紧凑间... 对比序列模式在识别不同类别序列样本集合的特征上有着重要的作用.已有对比序列模式挖掘算法需要用户预设间隔约束.在不具备充分先验知识情况下,用户不易准确地预设恰当的间隔约束,进而导致不能发现有用的模式.对此,文中设计了带紧凑间隔约束的最小对比序列模式挖掘算法,实现免预设间隔约束,并对候选模式自动计算最适合的间隔约束.此外,设计了3种剪枝策略来提高算法的执行效率.通过蛋白质序列、DNA序列、行为序列数据集验证了提出的算法的有效性和高效率. 展开更多
关键词 对比序列模式 间隔约束 序列数据挖掘
下载PDF
数据挖掘技术在网络型异常入侵检测系统中的应用 被引量:15
7
作者 宋世杰 胡华平 +1 位作者 胡笑蕾 金士尧 《计算机应用》 CSCD 北大核心 2003年第12期20-23,共4页
网络型异常检测的关键问题在于建立正常模式,将当前的系统或用户行为与建立好的正常模式进行比较,判断其偏离程度。简单介绍了数据挖掘算法以及基于数据挖掘的入侵检测系统的分类,从不同分类的角度介绍了数据挖掘方法在入侵检测系统中... 网络型异常检测的关键问题在于建立正常模式,将当前的系统或用户行为与建立好的正常模式进行比较,判断其偏离程度。简单介绍了数据挖掘算法以及基于数据挖掘的入侵检测系统的分类,从不同分类的角度介绍了数据挖掘方法在入侵检测系统中的应用。重点对比了模式比较的各种方法,并且使用网络型异常检测方法验证收集的正常数据是否充足的问题。 展开更多
关键词 数据挖掘 异常检测 关联规则 序列模式
下载PDF
DNA序列数据挖掘技术 被引量:37
8
作者 朱扬勇 熊赟 《软件学报》 EI CSCD 北大核心 2007年第11期2766-2781,共16页
DNA序列数据是一类重要的生物数据.研究DNA序列数据解读其含义是后基因组时代的主要研究任务.数据挖掘是目前最有效的数据分析手段之一,用于发现大量数据所隐含的各种规律,也是生物信息学采用的主要数据分析技术.将数据挖掘技术用于DNA... DNA序列数据是一类重要的生物数据.研究DNA序列数据解读其含义是后基因组时代的主要研究任务.数据挖掘是目前最有效的数据分析手段之一,用于发现大量数据所隐含的各种规律,也是生物信息学采用的主要数据分析技术.将数据挖掘技术用于DNA序列数据分析,已得到了广泛关注和快速发展,并取得了许多研究成果.综述了DNA序列数据挖掘领域的研究状况和进展,提出了3个研究阶段:基于统计的挖掘方法应用阶段、一般化挖掘方法应用阶段和专门的DNA序列数据挖掘方法设计阶段.阐述了DNA序列数据挖掘的基础是序列相似性,评述了DNA序列数据挖掘领域所采用的关键技术,包括DNA序列模式、关联、聚类、分类和异常挖掘等,分析讨论了其相应的生物应用背景和意义.最后给出DNA序列数据挖掘进一步研究的热点问题,包括DNA序列数据新的存储和索引机制的设计、根据生物领域知识的数据挖掘新模型和算法的设计等. 展开更多
关键词 DNA序列 数据挖掘 生物信息学 序列模式 序列相似性
下载PDF
数据挖掘技术在网络型误用入侵检测系统中的应用 被引量:9
9
作者 宋世杰 胡华平 +1 位作者 胡笑蕾 金士尧 《计算机工程》 CAS CSCD 北大核心 2004年第16期126-127,175,共3页
重点描述了数据挖掘技术在网络型误用入侵检测中的应用,实现了从网络审计数据中挖掘关联规则和序列模式,选择和构建临时统计特征,最后使用RIPPER分类器建立了误用检测模型。
关键词 数据挖掘 误用检测 关联规则 序列模式
下载PDF
WINEPI挖掘算法在入侵检测中的应用 被引量:11
10
作者 李永忠 孙彦 罗军生 《计算机工程》 CAS CSCD 北大核心 2006年第23期159-161,共3页
针对入侵检测系统的特点,将序列模式挖掘算法应用于入侵检测系统中。分析了WINEPI算法,并通过一个示例描述了数据挖掘的具体过程,讨论了挖掘结果的解释评估。
关键词 入侵检测 数据挖掘 序列模式
下载PDF
一种基于大项集重用的序列模式挖掘算法 被引量:10
11
作者 宋世杰 胡华平 +1 位作者 周嘉伟 金士尧 《计算机研究与发展》 EI CSCD 北大核心 2006年第1期68-74,共7页
在重新定义序列模式的长度、增加了序列模式的挖掘粒度的基础上,提出一种基于大项集重用的序列模式挖掘算法HVSM·该算法采用垂直位图法表示数据库,先横向扩展项集,将挖掘出的所有大项集组成一大序列项集,再纵向扩展序列,将每个一... 在重新定义序列模式的长度、增加了序列模式的挖掘粒度的基础上,提出一种基于大项集重用的序列模式挖掘算法HVSM·该算法采用垂直位图法表示数据库,先横向扩展项集,将挖掘出的所有大项集组成一大序列项集,再纵向扩展序列,将每个一大序列项集作为“集成块”,在挖掘k大序列时重用大项集·并以兄弟节点为种子生成候选大序列,利用1st-TID对支持度进行计数·实验表明,对于大规模事务数据库,该算法有效地提高了挖掘效率· 展开更多
关键词 序列模式挖掘 位图表示法 项集扩展 序列扩展
下载PDF
基于投影数据库的序列模式挖掘增量式更新算法 被引量:5
12
作者 陆介平 刘月波 +2 位作者 倪巍伟 陈耿 孙志挥 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第3期457-462,共6页
针对序列模式挖掘中的增量挖掘问题,提出一种序列模式更新算法ISPBP.算法引入序列数据库结构来存储从原始数据库中挖掘出的所有项、最大频繁模式以及它们的支持数,采用间接拼接方法,只需处理增量数据库,避免了对更新后数据库的重新计算... 针对序列模式挖掘中的增量挖掘问题,提出一种序列模式更新算法ISPBP.算法引入序列数据库结构来存储从原始数据库中挖掘出的所有项、最大频繁模式以及它们的支持数,采用间接拼接方法,只需处理增量数据库,避免了对更新后数据库的重新计算.对于因增量数据库新产生的频繁模式,利用了在增量数据库中出现的频繁项集来减小投影数据库,进一步提高了算法的效率.理论分析和实验表明,算法是有效可行的,并且增量数据库越大,算法在效率上的优越性越明显,算法ISPBP优于传统增量式更新算法. 展开更多
关键词 序列模式 数据挖掘 投影数据库 增量式更新
下载PDF
改进的PrefixSpan算法及其在序列模式挖掘中的应用 被引量:11
13
作者 张巍 刘峰 滕少华 《广东工业大学学报》 CAS 2013年第4期49-54,共6页
由于序列模式挖掘需要花费大量计算时间,并需要占用大量存储空间.减少计算量、节省存储空间开销成为序列模式挖掘的关键.因PrefixSpan算法不产生候选,而适当应用Bitmap数据结构可避免重复扫描数据库,基于此,本文提出了BM-PrefixSpan算法... 由于序列模式挖掘需要花费大量计算时间,并需要占用大量存储空间.减少计算量、节省存储空间开销成为序列模式挖掘的关键.因PrefixSpan算法不产生候选,而适当应用Bitmap数据结构可避免重复扫描数据库,基于此,本文提出了BM-PrefixSpan算法,用于序列模式挖掘,设计并构造了PFPBM(Prefix of First Position on BitMap)表用于记录序列中的每个项在位图中第1次出现的位置.实验结果表明,BM-PrefixSpan算法综合了PrefixSpan和SPAM算法的优点,能够更快、更好地挖掘出序列模式. 展开更多
关键词 序列模式 前缀投影序列模式挖掘 序列模式挖掘 位图 数据挖掘
下载PDF
频繁序列模式挖掘算法 被引量:4
14
作者 管恩政 周春光 +1 位作者 王喆 徐秀娟 《吉林大学学报(信息科学版)》 CAS 2005年第3期267-272,共6页
为解决从数据库中挖掘长模式和支持度较低时可能遇到计算复杂度较高的问题,提出一种新的算法———EFSPAN(EffectiveFrequentSequentialPAtterNminingalgorithm)。算法采用了深度优先挖掘策略,并将基于前缀序列格的深度优先遍历与两种... 为解决从数据库中挖掘长模式和支持度较低时可能遇到计算复杂度较高的问题,提出一种新的算法———EFSPAN(EffectiveFrequentSequentialPAtterNminingalgorithm)。算法采用了深度优先挖掘策略,并将基于前缀序列格的深度优先遍历与两种高效的剪枝策略相结合。实验结果表明:新算法在模式较长和支持度较低时,能使搜索空间中60%以上的节点免被搜索;从而大大缩小了搜索空间,降低了序列模式挖掘算法的计算复杂度。 展开更多
关键词 频繁模式 序列模式 数据挖掘 深度优先 长模式
下载PDF
路由器日志序列模式挖掘 被引量:2
15
作者 庄军 郭平 +2 位作者 周杨 周劲 蔡日旭 《计算机科学》 CSCD 北大核心 2005年第11期179-181,共3页
随着网络技术的发展,人们对网络质量的要求也越来越高,作为网络传输中重要环节之一的路由器的工作状态的变化直接影响到网络运行质量。从路由器日志中挖掘出的知识既可用于评价网络质量,又可用于改善网络信息服务。本文分析了路由器日... 随着网络技术的发展,人们对网络质量的要求也越来越高,作为网络传输中重要环节之一的路由器的工作状态的变化直接影响到网络运行质量。从路由器日志中挖掘出的知识既可用于评价网络质量,又可用于改善网络信息服务。本文分析了路由器日志中一些常见信息,采用序列挖掘方法对日志进行了挖掘,并对挖掘结果进行了解释和分析。 展开更多
关键词 路由器日志 序列模式 数据挖掘 序列模式挖掘 路由器 日志 网络信息服务 网络技术 网络质量 运行质量
下载PDF
城市居民时空行为序列模式挖掘方法 被引量:11
16
作者 李雄 马修军 +2 位作者 王晨星 迪丽娜尔.牙生 柴彦威 《地理与地理信息科学》 CSCD 北大核心 2009年第2期10-14,共5页
通过问卷调查获得北京市500个家庭的活动日志数据。运用序列比对方法对时空行为序列数据进行序列模式挖掘,对每类序列模式通过频繁模式挖掘出其中潜在有用的行为模式。试验结果表明,序列比对方法与频繁模式挖掘相结合在城市居民行为模... 通过问卷调查获得北京市500个家庭的活动日志数据。运用序列比对方法对时空行为序列数据进行序列模式挖掘,对每类序列模式通过频繁模式挖掘出其中潜在有用的行为模式。试验结果表明,序列比对方法与频繁模式挖掘相结合在城市居民行为模式分析中应用成功,其弥补了传统数据分析方法的不足,为复杂时空行为数据的分析提供了一种新视角。 展开更多
关键词 行为模式 序列比对 数据挖掘 时空数据获取
下载PDF
Web日志挖掘中的用户序列模式识别 被引量:6
17
作者 李明星 衡萍 +1 位作者 董沛武 陈健 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2005年第11期1570-1572,1602,共4页
为研究W eb日志挖掘中的序列模式识别问题,针对传统关联规则算法中阈值固定不变,大序列的数目与序列长度成反向增长的问题,对传统的关联规则算法进行改进,提出IAx算法,使长序列只需较小的支持度技术就能达到阈值,从而发现更多有意义的... 为研究W eb日志挖掘中的序列模式识别问题,针对传统关联规则算法中阈值固定不变,大序列的数目与序列长度成反向增长的问题,对传统的关联规则算法进行改进,提出IAx算法,使长序列只需较小的支持度技术就能达到阈值,从而发现更多有意义的序列模式,同时运用理论证明该方法的正确性. 展开更多
关键词 WEB日志挖掘 阈值 序列模式识别 IA^x算法
下载PDF
基于图结构的候选序列生成算法 被引量:4
18
作者 郭平 刘潭仁 《计算机科学》 CSCD 北大核心 2004年第1期136-139,141,共5页
先生成候选序列再判断候选序列是否为频繁序列,最后获得频繁序列是序列数据挖掘中基于候选序列挖掘算法的一般结构,如Apriori类算法,GSP算法,SPADE算法等。因此,研究候选序列生成算法具有普遍意义。本文首先研究了序列数据集(序列数据库... 先生成候选序列再判断候选序列是否为频繁序列,最后获得频繁序列是序列数据挖掘中基于候选序列挖掘算法的一般结构,如Apriori类算法,GSP算法,SPADE算法等。因此,研究候选序列生成算法具有普遍意义。本文首先研究了序列数据集(序列数据库)与图结构间的关系,证明了一个序列是频繁序列的必要条件是该序列对应于一个完全子图。以此为基础提出了基于图结构的候选序列生成算法,文中给出了算法正确性证明。在T25I10D10K和T25I20D100K数据集上的挖掘实验表明在本文提出的候选序列生成算法上进行挖掘比用Apriori算法进行挖掘的效率更高。 展开更多
关键词 图结构 候选序列 频繁序列 数据挖掘 序列挖掘
下载PDF
序列模式挖掘中的隐私保护方法研究 被引量:4
19
作者 朱玉全 胡天寒 +1 位作者 陈耿 常鹏 《计算机应用研究》 CSCD 北大核心 2009年第7期2489-2491,共3页
目前,已提出了一些关联规则挖掘中的隐私保护方法,而对序列模式挖掘中隐私保护的研究却很少。为此,提出了一种有效的敏感序列隐藏算法CLSDA(current leasts equences delete algorithm),该算法对候选序列加权,在删除序列的过程中随时更... 目前,已提出了一些关联规则挖掘中的隐私保护方法,而对序列模式挖掘中隐私保护的研究却很少。为此,提出了一种有效的敏感序列隐藏算法CLSDA(current leasts equences delete algorithm),该算法对候选序列加权,在删除序列的过程中随时更新权值,使用贪心算法获得局部最优解,尽可能减少对原始数据库的改动。实验结果表明,与现有序列模式隐藏方法相比,算法CLSDA将具有更好的隐藏效果。 展开更多
关键词 数据挖掘 隐私保护 序列模式 敏感序列
下载PDF
基于车牌识别流数据的车辆伴随模式发现方法 被引量:12
20
作者 朱美玲 刘晨 +1 位作者 王雄斌 韩燕波 《软件学报》 EI CSCD 北大核心 2017年第6期1498-1515,共18页
针对伴随车辆检测这一新兴的智能交通应用,在一种特殊的流式时空大数据——车牌识别流式大数据(ANPR)下,重新定义了Platoon伴随模式,提出PlatoonFinder算法,即时地在车牌识别数据流上挖掘Platoon伴随模式.主要贡献包括:第一,将Platoon... 针对伴随车辆检测这一新兴的智能交通应用,在一种特殊的流式时空大数据——车牌识别流式大数据(ANPR)下,重新定义了Platoon伴随模式,提出PlatoonFinder算法,即时地在车牌识别数据流上挖掘Platoon伴随模式.主要贡献包括:第一,将Platoon伴随模式发现问题映射为数据流上的带有时空约束的频繁序列挖掘问题,与传统频繁序列挖掘算法仅考虑序列元素之间位置关系不同,该算法能够在频繁序列挖掘的过程中有效处理序列元素之间复杂的时空约束关系;第二,该算法融入了伪投影等性能优化技术,针对数据流的特点进行了性能优化,能够有效应对车牌识别流式大数据的速率和规模,从而实现车辆Platoon伴随模式的即时发现.通过在真实车牌识别数据集上的实验分析表明:PlatoonFinder算法的平均延时显著低于经典的Aprior和PrefixSpan等频繁模式挖掘算法,也低于真实情况下交通摄像头的车牌识别最小时间间隔.因此,所提出的算法可以有效地发现伴随车辆组及其移动模式. 展开更多
关键词 流式时空大数据 大数据分析 伴随模式 频繁序列挖掘
下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部