期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
54
篇文章
<
1
2
3
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
数据库规模估算数学模型研究
被引量:
2
1
作者
任永昌
邢涛
+1 位作者
于忠党
王晓轩
《微电子学与计算机》
CSCD
北大核心
2009年第7期13-16,共4页
数据库规模估算是软件规模估算的基础.定义了数据库规模是综合指标的概念,运用文字叙述、表格及图形等方法分析了表类型、表结构、表元组、存储过程等因素对数据库规模的影响,设计了数据库规模估算的数学模型,并对模型中的各个参数进行...
数据库规模估算是软件规模估算的基础.定义了数据库规模是综合指标的概念,运用文字叙述、表格及图形等方法分析了表类型、表结构、表元组、存储过程等因素对数据库规模的影响,设计了数据库规模估算的数学模型,并对模型中的各个参数进行了详细解释,指出了在软件生命周期前、后阶段进行估算的方法.
展开更多
关键词
数据库规模
估算
数学模型
数据库
对象
软件
规模
估算
下载PDF
职称材料
数据库规模估算方法的研究
被引量:
2
2
作者
任永昌
邢涛
王丽艳
《渤海大学学报(自然科学版)》
CAS
2007年第4期373-376,共4页
数据库规模估算是软件成本估算的基础。介绍了数据库规模的概念,运用文字叙述、表格及图形等方法分析了表类型、表结构、表元组对数据库规模的影响,设计了数据库规模估算的数学模型,并对模型中的各个参数进行了详细的解释,指出了在软件...
数据库规模估算是软件成本估算的基础。介绍了数据库规模的概念,运用文字叙述、表格及图形等方法分析了表类型、表结构、表元组对数据库规模的影响,设计了数据库规模估算的数学模型,并对模型中的各个参数进行了详细的解释,指出了在软件生命周期前、后阶段进行估算的方法。
展开更多
关键词
数据库规模
估算
数据库
对象
软件成本估算
下载PDF
职称材料
关于新药上市前临床安全性数据库规模的探讨
被引量:
1
3
作者
杨焕
《中国临床药理学杂志》
CAS
CSCD
北大核心
2009年第3期273-276,共4页
本文参考和介绍了国外发达国家的风险评估和风险控制理念,基于现行我国注册法规的要求,对新药上市前临床安全性数据库的规模进行了探讨,其目的是为临床试验的研究者和注册申请人提供参考和建议。
关键词
新药上市前
临床安全性
数据库规模
下载PDF
职称材料
一个面向大规模数据库的数据挖掘系统
被引量:
28
4
作者
钱卫宁
魏藜
+2 位作者
王焱
钱海蕾
周傲英
《软件学报》
EI
CSCD
北大核心
2002年第8期1540-1545,共6页
数据挖掘融合了数据库技术、人工智能和统计学,是目前的研究热点.为了能够集成当前数据挖掘的主要技术并使它们协同工作,在进行数据挖掘基本算法研究的基础上研制开发了一个数据挖掘系统——Golden-Eye.系统实现了在数据挖掘研究中的一...
数据挖掘融合了数据库技术、人工智能和统计学,是目前的研究热点.为了能够集成当前数据挖掘的主要技术并使它们协同工作,在进行数据挖掘基本算法研究的基础上研制开发了一个数据挖掘系统——Golden-Eye.系统实现了在数据挖掘研究中的一些最新成果,集成了泛化、数据清洗这两个数据准备操作以及关联规则发现、例外规则发现、时序模式发现、分类器构造、聚类分析等基本数据挖掘操作,并实现了对挖掘操作的基本管理和结果的图形化显示.整个框架设计充分体现了系统的完整性、协调性和高效性:自底向上将存储控制模块、数据预处理模块、挖掘操作模块、挖掘库管理模块有机地结合在一起,在底层实现了对包括中间结果在内的数据的统一管理,在上层为用户提供了可视化的界面.实验结果表明,该系统能够在大规模数据库上成功地完成用户所指定的数据挖掘操作.
展开更多
关键词
大
规模
数据库
数据
挖掘系统
数据
预处理
存储控制
知识发现
下载PDF
职称材料
大规模交易数据库的一种有效聚类算法(英文)
被引量:
17
5
作者
陈宁
陈安
+1 位作者
周龙骧
CHEN Ning
《软件学报》
EI
CSCD
北大核心
2001年第4期475-484,共10页
研究大规模交易数据库的聚类问题 ,提出了一种二次聚类算法—— CATD.该算法首先将数据库划分成若干分区 ,在每个分区内利用层次聚类算法进行局部聚类 ,把交易初步划分成若干亚聚类 ,亚聚类的个数由聚类间的距离参数控制 .然后对所有的...
研究大规模交易数据库的聚类问题 ,提出了一种二次聚类算法—— CATD.该算法首先将数据库划分成若干分区 ,在每个分区内利用层次聚类算法进行局部聚类 ,把交易初步划分成若干亚聚类 ,亚聚类的个数由聚类间的距离参数控制 .然后对所有的亚聚类进行全局聚类 ,同时识别出噪声 .由于采用了分区方法和聚类的支持向量表示法 ,该算法只需扫描一次数据库 ,聚类过程在内存中进行 ,因此能处理大规模的数据库 .
展开更多
关键词
数据
挖掘
层次聚类
大
规模
交易
数据库
聚类算法
下载PDF
职称材料
大规模文本数据库中的短文分类方法
被引量:
4
6
作者
王永恒
贾焰
杨树强
《计算机工程与应用》
CSCD
北大核心
2006年第22期5-7,共3页
信息技术的飞速发展造成了大量的文本数据累积,其中很大一部分是短文本数据。文本分类技术对于从这些海量短文中自动获取知识具有重要意义。但是由于短文中的关键词出现次数少,而且带标签的训练样本又通常数量很少,现有的一般文本挖掘...
信息技术的飞速发展造成了大量的文本数据累积,其中很大一部分是短文本数据。文本分类技术对于从这些海量短文中自动获取知识具有重要意义。但是由于短文中的关键词出现次数少,而且带标签的训练样本又通常数量很少,现有的一般文本挖掘算法很难得到可接受的准确度。一些基于语义的分类方法获得了较好的准确度但又由于其低效性而无法适用于海量数据。文本提出了一个新颖的短文分类算法。该算法基于文本语义特征图,并使用类似kNN的方法进行分类。实验表明该算法在对海量短文进行分类时,其准确度和性能超过其它的算法。
展开更多
关键词
文本挖掘
分类
短文
大
规模
文本
数据库
下载PDF
职称材料
大规模数据库实时自主存取控制方法研究
被引量:
3
7
作者
徐艳
董涛
《科学技术与工程》
北大核心
2017年第13期205-209,共5页
近年来数据库存取压力逐渐增大,当前存取控制方法扩展性差、效率低、并发性能低。为此,提出一种新的大规模数据库实时自主存取控制方法。通过贝尔-拉帕丢拉模型对大规模数据库关系分析,将其划分成能够完成操作的主动元素和储存信息的被...
近年来数据库存取压力逐渐增大,当前存取控制方法扩展性差、效率低、并发性能低。为此,提出一种新的大规模数据库实时自主存取控制方法。通过贝尔-拉帕丢拉模型对大规模数据库关系分析,将其划分成能够完成操作的主动元素和储存信息的被动元素。大规模数据库关系模型依据元素级的密级标识将密级划分成4个等级:绝密、机密、秘密、公开,依据密级实现对数据库模型的定义。介绍了大规模数据库关系模型中的密级区间、用户与角色及数据范围。依据实际应用中的特点,针对某类信息或某些"字段"将数据的密级划分至属性级,实现大规模数据库实时自主存取控制。给出数据库存取规则,详细分析了读规则、更新规则和插入规则。实验结果表明,所提方法查询效率、读取和更新效率及插入效率均较高,存取性能优。
展开更多
关键词
大
规模
数据库
实时
自主
存取控制
下载PDF
职称材料
阈值上限一定时超大规模数据库的查询方法研究
被引量:
3
8
作者
黄瑜
《科学技术与工程》
北大核心
2017年第12期218-222,共5页
在确定查询阈值上限时,当前数据库查询方法只能使用查询树的一条路径,并行性能较差;在对超大规模数据进行查询时,具有查询时间长、响应不及时的弊端。为此,提出一种新的阈值上限一定时超大规模数据库的查询方法,通过RSA算法对超大规模...
在确定查询阈值上限时,当前数据库查询方法只能使用查询树的一条路径,并行性能较差;在对超大规模数据进行查询时,具有查询时间长、响应不及时的弊端。为此,提出一种新的阈值上限一定时超大规模数据库的查询方法,通过RSA算法对超大规模数据库进行加密和解密处理,依据多叉树的定义构造多叉索引树,在此基础上计算各代表数据点与查询点之间的距离;在阈值上限一定时,利用多个从节点机并行处理后,使用主节点机汇集结果,运用后续子树递归处理,直至获取查询结果。实验结果表明,所提方法不仅具有很高的查询效率,而且CPU使用率很高。
展开更多
关键词
阈值
超大
规模
数据库
查询
下载PDF
职称材料
面向大规模数据库的数据挖掘系统的设计
被引量:
1
9
作者
张毅
《科技传播》
2010年第7期123-123,共1页
近年来,数据挖掘引起了信息产业的极大关注,数据挖掘系统是一个很重要、很活跃的研究课题,在现实生活中有着广泛的应用。包括生产管理、商场控制、市场分析、工业设计等。本文简单介绍了数据挖掘的概念和分类,对在进行数据挖掘基本算法...
近年来,数据挖掘引起了信息产业的极大关注,数据挖掘系统是一个很重要、很活跃的研究课题,在现实生活中有着广泛的应用。包括生产管理、商场控制、市场分析、工业设计等。本文简单介绍了数据挖掘的概念和分类,对在进行数据挖掘基本算法研究的基础上开发的一个大规模数据挖掘系统——Golden-Eye.进行了分析。
展开更多
关键词
数据
挖掘
大
规模
数据库
系统设计
下载PDF
职称材料
混合的大规模数据库自动模式抽象方法
被引量:
4
10
作者
王雪
周烜
王珊
《计算机学报》
EI
CSCD
北大核心
2013年第8期1616-1625,共10页
随着数据库规模的扩大,其模式的复杂度也不断地增加,复杂的模式和文档的缺乏使得理解和操作数据库更加困难.现有的模式抽象方法大多通过关系表中的主外键信息查找出模式中最重要的表,然后使用这些最重要的表来构成单层次的模式总结.在...
随着数据库规模的扩大,其模式的复杂度也不断地增加,复杂的模式和文档的缺乏使得理解和操作数据库更加困难.现有的模式抽象方法大多通过关系表中的主外键信息查找出模式中最重要的表,然后使用这些最重要的表来构成单层次的模式总结.在现实应用中,这些模式总结的主题并不明确.文中陈述了现有方法的不足,然后给出了一种为大规模数据库生成多层次模式抽象的方法.在此方法中,首先使用不同类型的社区社团检测算法来将数据库模式划分为"团",然后使用元聚类方法将这些"团"集成为数据库的主题组,每一个主题组代表数据库的一个主题.最后将这些主题组进行进一步的聚类以生成主题组类,并为每一个主题组类挑选标签以生成多层次的模式抽象.在Freebase——开源的大规模数据库上验证了文中算法的有效性.实验证明文中算法不仅能够精确地识别大规模数据库的主题,同时可以依据数据库的主题生成易于理解、能够帮助用户浏览和检索数据库的多层次模式抽象.
展开更多
关键词
模式
抽象
大
规模
数据库
主题组
混合
下载PDF
职称材料
混合的大规模数据库自动模式抽象方法研究
11
作者
雷萌
孙海霞
《安徽电子信息职业技术学院学报》
2015年第4期1-3,共3页
对于数据信息数量过大的大规模数据库而言,这类数据库的模式、使用方式以及检索方式很难被用户理解,目前,自动模式抽象技术是解决这些问题的最佳方法,模式抽象技术的应用存在一定的局限性,不适合用于中小型规模的数据库中,是适合用于大...
对于数据信息数量过大的大规模数据库而言,这类数据库的模式、使用方式以及检索方式很难被用户理解,目前,自动模式抽象技术是解决这些问题的最佳方法,模式抽象技术的应用存在一定的局限性,不适合用于中小型规模的数据库中,是适合用于大规模的数据库上。
展开更多
关键词
大
规模
数据库
自动模式抽象法
研究
下载PDF
职称材料
基于大规模数据库的备份恢复模型
被引量:
1
12
作者
夏斌
王乐
+1 位作者
杨树强
韩伟红
《郑州大学学报(理学版)》
CAS
2007年第4期40-44,共5页
结合事务处理的思想,提出了一个可并行的多层事务备份恢复模型,该模型具有备份速度快、容错能力强、对在线系统影响小等特点.通过在一个实际的、由多个数据库节点组成的大规模数据库系统平台上对该备份恢复模型的实现和应用,证明了该模...
结合事务处理的思想,提出了一个可并行的多层事务备份恢复模型,该模型具有备份速度快、容错能力强、对在线系统影响小等特点.通过在一个实际的、由多个数据库节点组成的大规模数据库系统平台上对该备份恢复模型的实现和应用,证明了该模型的合理性和可用性.
展开更多
关键词
大
规模
数据库
备份
恢复
事务
设计
下载PDF
职称材料
医学专题事实型数据库的探讨
被引量:
13
13
作者
何玮
雷春炳
《中华医学图书情报杂志》
CAS
2002年第2期3-6,共4页
阐述了数据库的类型、专题数据库的特征 ,并对事实型数据库的概况及其与目录型数据库的区别进行了探讨 ,对医学专题事实型数据库的国内外发展现状进行了综述 ,对该类型数据库的构建及如何发展我国医学专题事实型数据库提出了建议。
关键词
医学专题
数据库
事实型
数据库
构建
文献目录型
数据库
数据库规模
数据库
结构
下载PDF
职称材料
大规模数据库系统中的面向服务架构研究
被引量:
1
14
作者
李慧
宋怀明
+3 位作者
焦丽梅
刘莹
王洋
王启荣
《计算机工程》
CAS
CSCD
北大核心
2007年第2期85-87,96,共4页
为了满足复杂的大规模数据库系统所要求的简单、高效、高可靠的需求,该文定义了面向服务的架构。该架构把繁杂多变的系统模块分为多个服务模块,每个模块独立实现其功能,介绍了面向服务的架构如何处理服务间的协调、部署、通信和高可用方...
为了满足复杂的大规模数据库系统所要求的简单、高效、高可靠的需求,该文定义了面向服务的架构。该架构把繁杂多变的系统模块分为多个服务模块,每个模块独立实现其功能,介绍了面向服务的架构如何处理服务间的协调、部署、通信和高可用方案,使诸多松散耦合的服务保持统一的管理和彼此间的联系,面向服务的架构大大简化了复杂的大规模数据库系统,并使整个系统的结构清晰化。
展开更多
关键词
大
规模
数据库
系统
面向服务的架构
互联网通信引擎
下载PDF
职称材料
关于高校图书馆自建特色数据库的探讨
被引量:
56
15
作者
徐云
《图书情报知识》
CSSCI
北大核心
2001年第2期56-58,共3页
分析了高校图书馆自建特色数据库的动因与现状 ,探讨了高校图书馆自建特色数据库的建库原则。
关键词
高校图书馆
特色
数据库
专题
数据库
建设原则
质量控制
数据库规模
数据
源
下载PDF
职称材料
应用Aprion算法实现大规模数据库关联规则挖掘的技术研究
被引量:
15
16
作者
郝海涛
马元元
《现代电子技术》
北大核心
2016年第7期124-126,共3页
随着信息技术的发展,大数据时代的到来,在这种环境下必须进行数据挖掘工作。从大量的应用数据中将潜在的有价值的知识和信息挖掘出来,以便将其应用在实际工作的改进中。目前,数据挖掘的方法有很多,其中关联规则挖掘技术应用比较广泛,这...
随着信息技术的发展,大数据时代的到来,在这种环境下必须进行数据挖掘工作。从大量的应用数据中将潜在的有价值的知识和信息挖掘出来,以便将其应用在实际工作的改进中。目前,数据挖掘的方法有很多,其中关联规则挖掘技术应用比较广泛,这种数据挖掘方式利用Aprion算法,挖掘出置信度和支持度均比较高的关联信息,反映出数据库中的数据相互之间的复杂性和有趣性,进而挖掘出数据之间的有益关联,促进大规模数据库信息挖掘技术的发展,主要从Aprion算法方面分析大规模数据库关联规则挖掘的技术。
展开更多
关键词
Aprion算法
大
规模
数据库
关联规则挖掘
置信度
支持度
下载PDF
职称材料
四川省高校图书馆特色数据库建设情况分析研究
被引量:
21
17
作者
张毓晗
《情报杂志》
CSSCI
北大核心
2003年第3期105-106,共2页
针对四川地区高校图书馆自建特色数据库的现状 ,分析了其存在的问题并提出了建设特色数据库应遵循的原则。
关键词
四川
高校图书馆
特色
数据库
建设
标准化
规范化
数据库规模
下载PDF
职称材料
大规模数据库高危攻击数据实时挖掘仿真研究
被引量:
4
18
作者
李浩
汤哲君
《计算机仿真》
北大核心
2018年第10期381-384,共4页
对大规模数据库的高危攻击数据进行挖掘,能有效提高数据挖掘的精度,提高数据库防攻击的性能。当前利用关联规则的映射挖掘算法,对攻击数据进行挖掘时,由于数据较多,数据挖掘的准确度较低,降低了高危数据挖掘的精度。提出基于粒子群优化...
对大规模数据库的高危攻击数据进行挖掘,能有效提高数据挖掘的精度,提高数据库防攻击的性能。当前利用关联规则的映射挖掘算法,对攻击数据进行挖掘时,由于数据较多,数据挖掘的准确度较低,降低了高危数据挖掘的精度。提出基于粒子群优化的攻击数据检测的算法。利用粗糙集的理论对大规模数据库高危攻击的数据进行属性的约简,提高攻击数据属性的依赖度,利用粒子群优化检测算法对大规模数据库高危的攻击数据进行检测,针对粒子群算法存在局部的早熟收敛的问题,采用改进粒子的属性,对粒子群算法进行改进,增加粒子的多样性,经过种群的初始化以速度与位置进行的更新,对粒子适应度的值进行计算,对粒子全局的极值进行更新,进行粒子循环的迭代,得出最优的解,完成对大规模数据库的高危攻击的数据实时的挖掘。实验的结果表明,利用所提的算法,在减少内存的占用容量的同时,有效地提高了数据实时挖掘的精度。
展开更多
关键词
大
规模
数据库
高危攻击
数据
数据
挖掘
粒子群优化检测
下载PDF
职称材料
基于深度学习的大规模数据库重复记录删除研究
被引量:
2
19
作者
职晓晓
《现代电子技术》
2021年第5期114-116,共3页
重复记录直接影响数据库管理的效率,当前重复记录删除的正确率低、误删率高,为了提高重复记录删除的正确率,满足重复记录管理的要求,提出基于深度学习的大规模数据库重复记录删除方法。首先对已有数据库重复记录删除方法进行分析,找到...
重复记录直接影响数据库管理的效率,当前重复记录删除的正确率低、误删率高,为了提高重复记录删除的正确率,满足重复记录管理的要求,提出基于深度学习的大规模数据库重复记录删除方法。首先对已有数据库重复记录删除方法进行分析,找到引起数据库重复记录删除不理想的因素;然后采用深度学习算法对数据库重复记录数据进行学习,建立数据库重复记录的分类器,根据分类结果进行数据库重复记录删除操作;最后通过仿真实验分析数据库重复记录删除效果。结果表明,深度学习算法可以对数据库重复记录进行准确分类和识别,获得较高的删除正确率,误删率明显小于其他数据库重复记录删除方法,研究结果具有一定的理论和实际价值。
展开更多
关键词
重复记录删除
大
规模
数据库
数据库
管理
分类器建立
深度学习算法
效果分析
下载PDF
职称材料
《全国报刊索引数据库》网络版简介
20
作者
崔建华
杨慧
《中国索引》
2004年第2期52-52,共1页
在简要介绍《全国报刊索引数据库》的基础上,分析2003年网络版的优点,以及在使用中遇到的一些问题,并且相应提出了一些改进意见和设想。
关键词
《全国报刊索引
数据库
》
网络版
数据库
检索
数据库规模
下载PDF
职称材料
题名
数据库规模估算数学模型研究
被引量:
2
1
作者
任永昌
邢涛
于忠党
王晓轩
机构
渤海大学信息科学与工程学院
北京城市系统工程研究中心
出处
《微电子学与计算机》
CSCD
北大核心
2009年第7期13-16,共4页
基金
国家“八六三”计划项目(2005AA501560)
北京市科学技术研究院萌芽基金项目(20070108)
文摘
数据库规模估算是软件规模估算的基础.定义了数据库规模是综合指标的概念,运用文字叙述、表格及图形等方法分析了表类型、表结构、表元组、存储过程等因素对数据库规模的影响,设计了数据库规模估算的数学模型,并对模型中的各个参数进行了详细解释,指出了在软件生命周期前、后阶段进行估算的方法.
关键词
数据库规模
估算
数学模型
数据库
对象
软件
规模
估算
Keywords
database scale estimation
mathematical model
database object
software scale estimation
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
数据库规模估算方法的研究
被引量:
2
2
作者
任永昌
邢涛
王丽艳
机构
辽宁工业大学计算机科学与工程学院
北京城市系统工程研究中心
出处
《渤海大学学报(自然科学版)》
CAS
2007年第4期373-376,共4页
基金
国家"863"计划基金项目(No:2005AA501560)
北京市科学技术研究院萌芽基金项目(No:20070108).
文摘
数据库规模估算是软件成本估算的基础。介绍了数据库规模的概念,运用文字叙述、表格及图形等方法分析了表类型、表结构、表元组对数据库规模的影响,设计了数据库规模估算的数学模型,并对模型中的各个参数进行了详细的解释,指出了在软件生命周期前、后阶段进行估算的方法。
关键词
数据库规模
估算
数据库
对象
软件成本估算
Keywords
database scale estimation
database object
software cost estimation
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
关于新药上市前临床安全性数据库规模的探讨
被引量:
1
3
作者
杨焕
机构
国家食品药品监督管理局药品审评中心
出处
《中国临床药理学杂志》
CAS
CSCD
北大核心
2009年第3期273-276,共4页
文摘
本文参考和介绍了国外发达国家的风险评估和风险控制理念,基于现行我国注册法规的要求,对新药上市前临床安全性数据库的规模进行了探讨,其目的是为临床试验的研究者和注册申请人提供参考和建议。
关键词
新药上市前
临床安全性
数据库规模
分类号
R954 [医药卫生—药学]
R969.3 [医药卫生—药理学]
下载PDF
职称材料
题名
一个面向大规模数据库的数据挖掘系统
被引量:
28
4
作者
钱卫宁
魏藜
王焱
钱海蕾
周傲英
机构
复旦大学计算机科学与工程系
复旦大学智能信息处理开放实验室
出处
《软件学报》
EI
CSCD
北大核心
2002年第8期1540-1545,共6页
基金
~~国家自然科学基金资助项目(60003016)
国家重点基础研究发展规划973资助项目(G1998030414)
文摘
数据挖掘融合了数据库技术、人工智能和统计学,是目前的研究热点.为了能够集成当前数据挖掘的主要技术并使它们协同工作,在进行数据挖掘基本算法研究的基础上研制开发了一个数据挖掘系统——Golden-Eye.系统实现了在数据挖掘研究中的一些最新成果,集成了泛化、数据清洗这两个数据准备操作以及关联规则发现、例外规则发现、时序模式发现、分类器构造、聚类分析等基本数据挖掘操作,并实现了对挖掘操作的基本管理和结果的图形化显示.整个框架设计充分体现了系统的完整性、协调性和高效性:自底向上将存储控制模块、数据预处理模块、挖掘操作模块、挖掘库管理模块有机地结合在一起,在底层实现了对包括中间结果在内的数据的统一管理,在上层为用户提供了可视化的界面.实验结果表明,该系统能够在大规模数据库上成功地完成用户所指定的数据挖掘操作.
关键词
大
规模
数据库
数据
挖掘系统
数据
预处理
存储控制
知识发现
Keywords
data mining
system
data preprocessing
storage control
mining base
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
大规模交易数据库的一种有效聚类算法(英文)
被引量:
17
5
作者
陈宁
陈安
周龙骧
CHEN Ning
机构
中国科学院数学与系统科学研究院
北京航空航天大学管理学院
Economics and Mathematics Institute
出处
《软件学报》
EI
CSCD
北大核心
2001年第4期475-484,共10页
文摘
研究大规模交易数据库的聚类问题 ,提出了一种二次聚类算法—— CATD.该算法首先将数据库划分成若干分区 ,在每个分区内利用层次聚类算法进行局部聚类 ,把交易初步划分成若干亚聚类 ,亚聚类的个数由聚类间的距离参数控制 .然后对所有的亚聚类进行全局聚类 ,同时识别出噪声 .由于采用了分区方法和聚类的支持向量表示法 ,该算法只需扫描一次数据库 ,聚类过程在内存中进行 ,因此能处理大规模的数据库 .
关键词
数据
挖掘
层次聚类
大
规模
交易
数据库
聚类算法
Keywords
data mining
clustering
single linkage
分类号
TP311.132 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
大规模文本数据库中的短文分类方法
被引量:
4
6
作者
王永恒
贾焰
杨树强
机构
国防科技大学计算机学院网络研究所
出处
《计算机工程与应用》
CSCD
北大核心
2006年第22期5-7,共3页
基金
国家863高技术研究发展计划资助项目(编号:2004AA112020
2003AA115210
2003AA111020)
文摘
信息技术的飞速发展造成了大量的文本数据累积,其中很大一部分是短文本数据。文本分类技术对于从这些海量短文中自动获取知识具有重要意义。但是由于短文中的关键词出现次数少,而且带标签的训练样本又通常数量很少,现有的一般文本挖掘算法很难得到可接受的准确度。一些基于语义的分类方法获得了较好的准确度但又由于其低效性而无法适用于海量数据。文本提出了一个新颖的短文分类算法。该算法基于文本语义特征图,并使用类似kNN的方法进行分类。实验表明该算法在对海量短文进行分类时,其准确度和性能超过其它的算法。
关键词
文本挖掘
分类
短文
大
规模
文本
数据库
Keywords
text mining,classification,short document,very large text database
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
大规模数据库实时自主存取控制方法研究
被引量:
3
7
作者
徐艳
董涛
机构
电子科技大学成都学院
出处
《科学技术与工程》
北大核心
2017年第13期205-209,共5页
基金
四川省教育厅科研项目(16ZB0443)资助
文摘
近年来数据库存取压力逐渐增大,当前存取控制方法扩展性差、效率低、并发性能低。为此,提出一种新的大规模数据库实时自主存取控制方法。通过贝尔-拉帕丢拉模型对大规模数据库关系分析,将其划分成能够完成操作的主动元素和储存信息的被动元素。大规模数据库关系模型依据元素级的密级标识将密级划分成4个等级:绝密、机密、秘密、公开,依据密级实现对数据库模型的定义。介绍了大规模数据库关系模型中的密级区间、用户与角色及数据范围。依据实际应用中的特点,针对某类信息或某些"字段"将数据的密级划分至属性级,实现大规模数据库实时自主存取控制。给出数据库存取规则,详细分析了读规则、更新规则和插入规则。实验结果表明,所提方法查询效率、读取和更新效率及插入效率均较高,存取性能优。
关键词
大
规模
数据库
实时
自主
存取控制
Keywords
large-scale database
in real time
independent
access control
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
阈值上限一定时超大规模数据库的查询方法研究
被引量:
3
8
作者
黄瑜
机构
钦州学院
出处
《科学技术与工程》
北大核心
2017年第12期218-222,共5页
文摘
在确定查询阈值上限时,当前数据库查询方法只能使用查询树的一条路径,并行性能较差;在对超大规模数据进行查询时,具有查询时间长、响应不及时的弊端。为此,提出一种新的阈值上限一定时超大规模数据库的查询方法,通过RSA算法对超大规模数据库进行加密和解密处理,依据多叉树的定义构造多叉索引树,在此基础上计算各代表数据点与查询点之间的距离;在阈值上限一定时,利用多个从节点机并行处理后,使用主节点机汇集结果,运用后续子树递归处理,直至获取查询结果。实验结果表明,所提方法不仅具有很高的查询效率,而且CPU使用率很高。
关键词
阈值
超大
规模
数据库
查询
Keywords
the threshold value very large scale database the query
分类号
TP399 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向大规模数据库的数据挖掘系统的设计
被引量:
1
9
作者
张毅
机构
四川省宜宾市第一人民医院网络中心
出处
《科技传播》
2010年第7期123-123,共1页
文摘
近年来,数据挖掘引起了信息产业的极大关注,数据挖掘系统是一个很重要、很活跃的研究课题,在现实生活中有着广泛的应用。包括生产管理、商场控制、市场分析、工业设计等。本文简单介绍了数据挖掘的概念和分类,对在进行数据挖掘基本算法研究的基础上开发的一个大规模数据挖掘系统——Golden-Eye.进行了分析。
关键词
数据
挖掘
大
规模
数据库
系统设计
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
混合的大规模数据库自动模式抽象方法
被引量:
4
10
作者
王雪
周烜
王珊
机构
数据工程与知识工程教育部重点实验室(中国人民大学)
中国人民大学信息学院
出处
《计算机学报》
EI
CSCD
北大核心
2013年第8期1616-1625,共10页
基金
国家教育部"新世纪优秀人才支持计划"
国家自然科学基金(61272138)
中国人民大学科学研究基金(12XNLJ01)资助~~
文摘
随着数据库规模的扩大,其模式的复杂度也不断地增加,复杂的模式和文档的缺乏使得理解和操作数据库更加困难.现有的模式抽象方法大多通过关系表中的主外键信息查找出模式中最重要的表,然后使用这些最重要的表来构成单层次的模式总结.在现实应用中,这些模式总结的主题并不明确.文中陈述了现有方法的不足,然后给出了一种为大规模数据库生成多层次模式抽象的方法.在此方法中,首先使用不同类型的社区社团检测算法来将数据库模式划分为"团",然后使用元聚类方法将这些"团"集成为数据库的主题组,每一个主题组代表数据库的一个主题.最后将这些主题组进行进一步的聚类以生成主题组类,并为每一个主题组类挑选标签以生成多层次的模式抽象.在Freebase——开源的大规模数据库上验证了文中算法的有效性.实验证明文中算法不仅能够精确地识别大规模数据库的主题,同时可以依据数据库的主题生成易于理解、能够帮助用户浏览和检索数据库的多层次模式抽象.
关键词
模式
抽象
大
规模
数据库
主题组
混合
Keywords
schema
summarization
large-scale database
subject group
hybrid
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
混合的大规模数据库自动模式抽象方法研究
11
作者
雷萌
孙海霞
机构
西藏民族大学
出处
《安徽电子信息职业技术学院学报》
2015年第4期1-3,共3页
文摘
对于数据信息数量过大的大规模数据库而言,这类数据库的模式、使用方式以及检索方式很难被用户理解,目前,自动模式抽象技术是解决这些问题的最佳方法,模式抽象技术的应用存在一定的局限性,不适合用于中小型规模的数据库中,是适合用于大规模的数据库上。
关键词
大
规模
数据库
自动模式抽象法
研究
Keywords
large-scale database
automatic summarization method
research
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于大规模数据库的备份恢复模型
被引量:
1
12
作者
夏斌
王乐
杨树强
韩伟红
机构
国防科学技术大学计算机学院
出处
《郑州大学学报(理学版)》
CAS
2007年第4期40-44,共5页
基金
国家"八六三"项目
编号2006AA01Z451
国防预研基金项目
文摘
结合事务处理的思想,提出了一个可并行的多层事务备份恢复模型,该模型具有备份速度快、容错能力强、对在线系统影响小等特点.通过在一个实际的、由多个数据库节点组成的大规模数据库系统平台上对该备份恢复模型的实现和应用,证明了该模型的合理性和可用性.
关键词
大
规模
数据库
备份
恢复
事务
设计
Keywords
VLDB
backup
recovery
transaction~ design
分类号
TP309.3 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
医学专题事实型数据库的探讨
被引量:
13
13
作者
何玮
雷春炳
机构
解放军医学图书馆
出处
《中华医学图书情报杂志》
CAS
2002年第2期3-6,共4页
文摘
阐述了数据库的类型、专题数据库的特征 ,并对事实型数据库的概况及其与目录型数据库的区别进行了探讨 ,对医学专题事实型数据库的国内外发展现状进行了综述 ,对该类型数据库的构建及如何发展我国医学专题事实型数据库提出了建议。
关键词
医学专题
数据库
事实型
数据库
构建
文献目录型
数据库
数据库规模
数据库
结构
Keywords
Medicine
Specialized databases
Development of factual databases
分类号
G354.4 [文化科学—情报学]
下载PDF
职称材料
题名
大规模数据库系统中的面向服务架构研究
被引量:
1
14
作者
李慧
宋怀明
焦丽梅
刘莹
王洋
王启荣
机构
中国科学院计算技术研究所
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第2期85-87,96,共4页
文摘
为了满足复杂的大规模数据库系统所要求的简单、高效、高可靠的需求,该文定义了面向服务的架构。该架构把繁杂多变的系统模块分为多个服务模块,每个模块独立实现其功能,介绍了面向服务的架构如何处理服务间的协调、部署、通信和高可用方案,使诸多松散耦合的服务保持统一的管理和彼此间的联系,面向服务的架构大大简化了复杂的大规模数据库系统,并使整个系统的结构清晰化。
关键词
大
规模
数据库
系统
面向服务的架构
互联网通信引擎
Keywords
Large-scale database system
Service-oriented architecture(SOA)
Internet communications engine (ICE)
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
关于高校图书馆自建特色数据库的探讨
被引量:
56
15
作者
徐云
机构
暨南大学图书馆
出处
《图书情报知识》
CSSCI
北大核心
2001年第2期56-58,共3页
文摘
分析了高校图书馆自建特色数据库的动因与现状 ,探讨了高校图书馆自建特色数据库的建库原则。
关键词
高校图书馆
特色
数据库
专题
数据库
建设原则
质量控制
数据库规模
数据
源
分类号
G258.6 [文化科学—图书馆学]
G250.74 [文化科学—图书馆学]
下载PDF
职称材料
题名
应用Aprion算法实现大规模数据库关联规则挖掘的技术研究
被引量:
15
16
作者
郝海涛
马元元
机构
中山市广播电视大学
中山职业技术学院信息工程学院
出处
《现代电子技术》
北大核心
2016年第7期124-126,共3页
文摘
随着信息技术的发展,大数据时代的到来,在这种环境下必须进行数据挖掘工作。从大量的应用数据中将潜在的有价值的知识和信息挖掘出来,以便将其应用在实际工作的改进中。目前,数据挖掘的方法有很多,其中关联规则挖掘技术应用比较广泛,这种数据挖掘方式利用Aprion算法,挖掘出置信度和支持度均比较高的关联信息,反映出数据库中的数据相互之间的复杂性和有趣性,进而挖掘出数据之间的有益关联,促进大规模数据库信息挖掘技术的发展,主要从Aprion算法方面分析大规模数据库关联规则挖掘的技术。
关键词
Aprion算法
大
规模
数据库
关联规则挖掘
置信度
支持度
Keywords
Aprion algorithm
large-scale database
association rule mining
confidence coefficient
support degree
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
四川省高校图书馆特色数据库建设情况分析研究
被引量:
21
17
作者
张毓晗
机构
电子科技大学
出处
《情报杂志》
CSSCI
北大核心
2003年第3期105-106,共2页
文摘
针对四川地区高校图书馆自建特色数据库的现状 ,分析了其存在的问题并提出了建设特色数据库应遵循的原则。
关键词
四川
高校图书馆
特色
数据库
建设
标准化
规范化
数据库规模
分类号
G259.256 [文化科学—图书馆学]
G250.74 [文化科学—图书馆学]
下载PDF
职称材料
题名
大规模数据库高危攻击数据实时挖掘仿真研究
被引量:
4
18
作者
李浩
汤哲君
机构
宁夏大学教务处
宁夏大学物理与电子电气工程学院
出处
《计算机仿真》
北大核心
2018年第10期381-384,共4页
文摘
对大规模数据库的高危攻击数据进行挖掘,能有效提高数据挖掘的精度,提高数据库防攻击的性能。当前利用关联规则的映射挖掘算法,对攻击数据进行挖掘时,由于数据较多,数据挖掘的准确度较低,降低了高危数据挖掘的精度。提出基于粒子群优化的攻击数据检测的算法。利用粗糙集的理论对大规模数据库高危攻击的数据进行属性的约简,提高攻击数据属性的依赖度,利用粒子群优化检测算法对大规模数据库高危的攻击数据进行检测,针对粒子群算法存在局部的早熟收敛的问题,采用改进粒子的属性,对粒子群算法进行改进,增加粒子的多样性,经过种群的初始化以速度与位置进行的更新,对粒子适应度的值进行计算,对粒子全局的极值进行更新,进行粒子循环的迭代,得出最优的解,完成对大规模数据库的高危攻击的数据实时的挖掘。实验的结果表明,利用所提的算法,在减少内存的占用容量的同时,有效地提高了数据实时挖掘的精度。
关键词
大
规模
数据库
高危攻击
数据
数据
挖掘
粒子群优化检测
Keywords
Large -scale database
High- risk attack data
Data mining
Particle swarm optimization detection
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于深度学习的大规模数据库重复记录删除研究
被引量:
2
19
作者
职晓晓
机构
河南大学民生学院
出处
《现代电子技术》
2021年第5期114-116,共3页
基金
2018年度河南省科技攻关项目:基于视频图像处理的交通流量数据采集和检测技术研究(82102410064)。
文摘
重复记录直接影响数据库管理的效率,当前重复记录删除的正确率低、误删率高,为了提高重复记录删除的正确率,满足重复记录管理的要求,提出基于深度学习的大规模数据库重复记录删除方法。首先对已有数据库重复记录删除方法进行分析,找到引起数据库重复记录删除不理想的因素;然后采用深度学习算法对数据库重复记录数据进行学习,建立数据库重复记录的分类器,根据分类结果进行数据库重复记录删除操作;最后通过仿真实验分析数据库重复记录删除效果。结果表明,深度学习算法可以对数据库重复记录进行准确分类和识别,获得较高的删除正确率,误删率明显小于其他数据库重复记录删除方法,研究结果具有一定的理论和实际价值。
关键词
重复记录删除
大
规模
数据库
数据库
管理
分类器建立
深度学习算法
效果分析
Keywords
duplicate record deletion
large scale database
database management
classifier building
deep learning algorithm
effect analysis
分类号
TN911.1-34 [电子电信—通信与信息系统]
TM614 [电气工程—电力系统及自动化]
下载PDF
职称材料
题名
《全国报刊索引数据库》网络版简介
20
作者
崔建华
杨慧
机构
北京师范大学图书馆
出处
《中国索引》
2004年第2期52-52,共1页
文摘
在简要介绍《全国报刊索引数据库》的基础上,分析2003年网络版的优点,以及在使用中遇到的一些问题,并且相应提出了一些改进意见和设想。
关键词
《全国报刊索引
数据库
》
网络版
数据库
检索
数据库规模
分类号
G353.21 [文化科学—情报学]
G354.4 [文化科学—情报学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
数据库规模估算数学模型研究
任永昌
邢涛
于忠党
王晓轩
《微电子学与计算机》
CSCD
北大核心
2009
2
下载PDF
职称材料
2
数据库规模估算方法的研究
任永昌
邢涛
王丽艳
《渤海大学学报(自然科学版)》
CAS
2007
2
下载PDF
职称材料
3
关于新药上市前临床安全性数据库规模的探讨
杨焕
《中国临床药理学杂志》
CAS
CSCD
北大核心
2009
1
下载PDF
职称材料
4
一个面向大规模数据库的数据挖掘系统
钱卫宁
魏藜
王焱
钱海蕾
周傲英
《软件学报》
EI
CSCD
北大核心
2002
28
下载PDF
职称材料
5
大规模交易数据库的一种有效聚类算法(英文)
陈宁
陈安
周龙骧
CHEN Ning
《软件学报》
EI
CSCD
北大核心
2001
17
下载PDF
职称材料
6
大规模文本数据库中的短文分类方法
王永恒
贾焰
杨树强
《计算机工程与应用》
CSCD
北大核心
2006
4
下载PDF
职称材料
7
大规模数据库实时自主存取控制方法研究
徐艳
董涛
《科学技术与工程》
北大核心
2017
3
下载PDF
职称材料
8
阈值上限一定时超大规模数据库的查询方法研究
黄瑜
《科学技术与工程》
北大核心
2017
3
下载PDF
职称材料
9
面向大规模数据库的数据挖掘系统的设计
张毅
《科技传播》
2010
1
下载PDF
职称材料
10
混合的大规模数据库自动模式抽象方法
王雪
周烜
王珊
《计算机学报》
EI
CSCD
北大核心
2013
4
下载PDF
职称材料
11
混合的大规模数据库自动模式抽象方法研究
雷萌
孙海霞
《安徽电子信息职业技术学院学报》
2015
0
下载PDF
职称材料
12
基于大规模数据库的备份恢复模型
夏斌
王乐
杨树强
韩伟红
《郑州大学学报(理学版)》
CAS
2007
1
下载PDF
职称材料
13
医学专题事实型数据库的探讨
何玮
雷春炳
《中华医学图书情报杂志》
CAS
2002
13
下载PDF
职称材料
14
大规模数据库系统中的面向服务架构研究
李慧
宋怀明
焦丽梅
刘莹
王洋
王启荣
《计算机工程》
CAS
CSCD
北大核心
2007
1
下载PDF
职称材料
15
关于高校图书馆自建特色数据库的探讨
徐云
《图书情报知识》
CSSCI
北大核心
2001
56
下载PDF
职称材料
16
应用Aprion算法实现大规模数据库关联规则挖掘的技术研究
郝海涛
马元元
《现代电子技术》
北大核心
2016
15
下载PDF
职称材料
17
四川省高校图书馆特色数据库建设情况分析研究
张毓晗
《情报杂志》
CSSCI
北大核心
2003
21
下载PDF
职称材料
18
大规模数据库高危攻击数据实时挖掘仿真研究
李浩
汤哲君
《计算机仿真》
北大核心
2018
4
下载PDF
职称材料
19
基于深度学习的大规模数据库重复记录删除研究
职晓晓
《现代电子技术》
2021
2
下载PDF
职称材料
20
《全国报刊索引数据库》网络版简介
崔建华
杨慧
《中国索引》
2004
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
3
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部