期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
一种挖掘频繁模式的数据库划分新方法 被引量:3
1
作者 叶飞跃 王建东 +1 位作者 庄毅 吕宗磊 《系统工程与电子技术》 EI CSCD 北大核心 2004年第11期1666-1668,1745,共4页
提出了一种新的数据库划分方法。该方法应用于需要产生候选项的频繁模式的挖掘过程,可以大大减少对数据库的扫描操作,提高数据挖掘效率,特别是对于较长模式的数据挖掘更是如此。该方法是将交易数据库按照交易的长度(或者说模式的长度)... 提出了一种新的数据库划分方法。该方法应用于需要产生候选项的频繁模式的挖掘过程,可以大大减少对数据库的扫描操作,提高数据挖掘效率,特别是对于较长模式的数据挖掘更是如此。该方法是将交易数据库按照交易的长度(或者说模式的长度)划分成若干个子数据库,将等长度的交易划分到同一个子数据库中,这样在获取候选项的支持度时,只需要扫描模式长度大于等于相应候选项长度的子数据库即可,从而减少了对数据库的扫描操作。给出了基于数据库划分的挖掘算法,通过理论推导和实验证明了该方法的有效性。 展开更多
关键词 数据挖掘 频繁模式 数据库划分
下载PDF
基于数据库划分的高效关联规则挖掘算法研究 被引量:7
2
作者 伊卫国 卫金茂 +1 位作者 王名扬 王兴通 《东北师大学报(自然科学版)》 CAS CSCD 北大核心 2004年第4期45-50,共6页
 在现有的关联规则改进算法的基础上,深入分析了经典算法的内涵,提出了不产生候选二项集的改进算法,而且减少了扫描数据库的大小.与Apri ori算法相比,在较大型的交易数据库中,效率明显提高.
关键词 数据挖掘 交易数据库 关联规则 数据库划分
下载PDF
一种适应大型数据库的多支持度关联规则算法 被引量:1
3
作者 薛永庆 徐维祥 《计算机工程与应用》 CSCD 北大核心 2008年第2期182-185,共4页
关联规则挖掘一直是数据挖掘中的重要组成部分。提出一个新算法DPCFP-growth算法。DPCFP-growth算法是基于MSApirori算法,采用了CFP-growth分而治之的思想,并弥补了CFP-growth算法的不足。CFP-growth算法运行时要把整个数据库中的数据... 关联规则挖掘一直是数据挖掘中的重要组成部分。提出一个新算法DPCFP-growth算法。DPCFP-growth算法是基于MSApirori算法,采用了CFP-growth分而治之的思想,并弥补了CFP-growth算法的不足。CFP-growth算法运行时要把整个数据库中的数据压缩到一个MIS-tree中然后进行频繁模式挖掘。在大型数据库中CFP-growth算法会建立一个深度很深宽度很宽的CFP-tree,以至于内存往往不能满足其要求,被迫使用大量的辅存,致使算法的运行效率急剧下降。DPCFP-growth算法根据CFP-tree的特征,有效地把大数据库分为若干个内存可以满足其要求的子数据库,然后在每个子数据库中进行局部频繁模式挖掘,最终汇总这些频繁模式生成全局频繁模式。实验表明该算法是正确的,并且在大型数据挖掘中,比CFP-growth算法有一定的优越性。 展开更多
关键词 数据挖掘 数据库划分 多支持度 频繁模式
下载PDF
改进Apriori算法处理海量数据的研究 被引量:1
4
作者 段艳明 肖辉辉 《电脑与信息技术》 2013年第1期22-24,共3页
随着Internet的迅猛发展和日益普及,各种数据信息急剧膨胀,各行各业积累的数据量急剧增长,如何从海量的数据中提取有用的信息成为当务之急。文章讨论海量数据处理中的机器学习算法——关联规则挖掘Apriori算法,针对Apriori算法需要多次... 随着Internet的迅猛发展和日益普及,各种数据信息急剧膨胀,各行各业积累的数据量急剧增长,如何从海量的数据中提取有用的信息成为当务之急。文章讨论海量数据处理中的机器学习算法——关联规则挖掘Apriori算法,针对Apriori算法需要多次扫描数据库的缺点,对数据库进行划分,从而提高海量数据挖掘的效率。 展开更多
关键词 APRIORI算法 数据挖掘 海量数据 划分数据库
下载PDF
5种流行假脸视频检测网络性能分析和比较 被引量:6
5
作者 高逸飞 胡永健 +2 位作者 余泽琼 林育仪 刘琲贝 《应用科学学报》 CAS CSCD 北大核心 2019年第5期590-608,共19页
为对抗假脸视频的危害,研究者目前已经提出了多种不同的基于卷积神经网络(convolutional neural networks,CNN)的假脸视频检测器,然而这些检测器所存在的一个共同问题是库内检测通常能达到较高的准确率,但跨库检测时性能出现严重下降,... 为对抗假脸视频的危害,研究者目前已经提出了多种不同的基于卷积神经网络(convolutional neural networks,CNN)的假脸视频检测器,然而这些检测器所存在的一个共同问题是库内检测通常能达到较高的准确率,但跨库检测时性能出现严重下降,即存在严重的泛化能力不足问题.该文对基于MesoInception-4、MISLnet、ShallowNetV1、Inception-v3、Xception这5种流行网络的假脸视频检测器,在现有3个假脸视频库上进行库内和跨库测试,重点分析数据库的划分方式、数据增广操作以及检测阈值选取这3个因素对假脸视频检测器泛化能力的影响. 展开更多
关键词 假脸视频检测 深度网络 泛化能力 数据库划分 数据增广 阈值选取
下载PDF
基于等价类的Apriori优化算法 被引量:2
6
作者 俞有光 钟子发 马捷 《计算机工程》 CAS CSCD 北大核心 2010年第22期66-68,共3页
介绍关联规则挖掘中的经典算法——Apriori算法的关键思想。针对传统Apriori算法效率上的不足,提出一种改进的Apriori算法——Ec-Apriori算法。该算法采用划分的方法,按照频繁1-项集支持度对数据库进行划分,在各自独立的子数据库上运用... 介绍关联规则挖掘中的经典算法——Apriori算法的关键思想。针对传统Apriori算法效率上的不足,提出一种改进的Apriori算法——Ec-Apriori算法。该算法采用划分的方法,按照频繁1-项集支持度对数据库进行划分,在各自独立的子数据库上运用等价类的方法生成候选集,优化连接操作,同时利用位对象操作简化支持度的计算,较好地提高了算法效率。实验结果表明,改进后的算法具有较好的有效性。 展开更多
关键词 关联规则 APRIORI算法 数据库划分 等价类 位对象
下载PDF
一种快速的自适应频繁模式挖掘方法
7
作者 叶飞跃 王建东 庄毅 《控制与决策》 EI CSCD 北大核心 2004年第8期867-871,880,共6页
提出一种自适应的频繁模式挖掘算法:AD-Mine算法.该算法采用超结构,根据计算机可用内存自动确定一次性产生超结构的大小,能够自动适应各类不同特性的数据,进行高效率的频繁模式挖掘工作.同时提出了一种能够有效地减少扫描记录数的新颖... 提出一种自适应的频繁模式挖掘算法:AD-Mine算法.该算法采用超结构,根据计算机可用内存自动确定一次性产生超结构的大小,能够自动适应各类不同特性的数据,进行高效率的频繁模式挖掘工作.同时提出了一种能够有效地减少扫描记录数的新颖的数据库划分方法. 展开更多
关键词 数据挖掘 频繁模式 划分数据库 自适应
下载PDF
决策系统的一体化:三级图:述评
8
作者 陈云卿 《管理观察》 1995年第10期6-6,共1页
考察了个人的、小组的和整个组织的三种决策系统。尽管概念基础是相同的,但每一种都有自己的结构和特点。按照传统,每一种系统是彼此独立地制定的,但由于它们在一个组织内运行,因此必须使其一体化以达到共同的目标和任务。这些系统... 考察了个人的、小组的和整个组织的三种决策系统。尽管概念基础是相同的,但每一种都有自己的结构和特点。按照传统,每一种系统是彼此独立地制定的,但由于它们在一个组织内运行,因此必须使其一体化以达到共同的目标和任务。这些系统的共同要素是基础模型、数据库和知识库。建议利用ANSI/X3/SPARC数据库按这些要素进行一体化。该数据库划分为三个层次:外部层次(用户)、概念层次(组织)和内部层次(电子计算机存储器)。一体化的困难在于各个层次应用的准则和模型种类太多。以制订营销计划为例,表明了各系统的协同动作。文章结尾提出了进一步研究的方向:制定屏幕式总体结构.存储器结构规格化,以及研究决策图的效益。 展开更多
关键词 决策系统 一体化 述评 数据库划分 概念层次 计算机存储器 存储器结构 知识库 外部层次 共同要素
下载PDF
An Improved Hilbert Curve for Parallel Spatial Data Partitioning 被引量:7
9
作者 MENG Lingkui HUANG Changqing ZHAO Chunyu LIN Zhiyong 《Geo-Spatial Information Science》 2007年第4期282-286,共5页
A novel Hilbert-curve is introduced for parallel spatial data partitioning, with consideration of the huge-amount property of spatial information and the variable-length characteristic of vector data items. Based on t... A novel Hilbert-curve is introduced for parallel spatial data partitioning, with consideration of the huge-amount property of spatial information and the variable-length characteristic of vector data items. Based on the improved Hilbert curve, the algorithm can be designed to achieve almost-uniform spatial data partitioning among multiple disks in parallel spatial databases. Thus, the phenomenon of data imbalance can be significantly avoided and search and query efficiency can be enhanced. 展开更多
关键词 parallel spatial database spatial data partitioning data imbalance Hilbert curve
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部