期刊文献+
共找到86篇文章
< 1 2 5 >
每页显示 20 50 100
Designing a Model to Study Data Mining in Distributed Environment
1
作者 Md. Abadur Rahman Masud Karim 《Journal of Data Analysis and Information Processing》 2021年第1期23-29,共7页
To make business policy, market analysis, corporate decision, fraud detection, etc., we have to analyze and work with huge amount of data. Generally, such data are taken from different sources. Researchers are using d... To make business policy, market analysis, corporate decision, fraud detection, etc., we have to analyze and work with huge amount of data. Generally, such data are taken from different sources. Researchers are using data mining to perform such tasks. Data mining techniques are used to find hidden information from large data source. Data mining is using for various fields: Artificial intelligence, Bank, health and medical, corruption, legal issues, corporate business, marketing, etc. Special interest is given to associate rules, data mining algorithms, decision tree and distributed approach. Data is becoming larger and spreading geographically. So it is difficult to find better result from only a central data source. For knowledge discovery, we have to work with distributed database. On the other hand, security and privacy considerations are also another factor for de-motivation of working with centralized data. For this reason, distributed database is essential for future processing. In this paper, we have proposed a framework to study data mining in distributed environment. The paper presents a framework to bring out actionable knowledge. We have shown some level by which we can generate actionable knowledge. Possible tools and technique for these levels are discussed. 展开更多
关键词 data mining distributed database Knowledge Discovery Classification Algorithm
下载PDF
A New Approach for Knowledge Discovery in Distributed Databases Using Fragmented Data Storage Model
2
作者 Masoud Pesaran Behbahani Islam Choudhury Souheil Khaddaj 《Chinese Business Review》 2013年第12期834-845,共12页
Since the early 1990, significant progress in database technology has provided new platform for emerging new dimensions of data engineering. New models were introduced to utilize the data sets stored in the new genera... Since the early 1990, significant progress in database technology has provided new platform for emerging new dimensions of data engineering. New models were introduced to utilize the data sets stored in the new generations of databases. These models have a deep impact on evolving decision-support systems. But they suffer a variety of practical problems while accessing real-world data sources. Specifically a type of data storage model based on data distribution theory has been increasingly used in recent years by large-scale enterprises, while it is not compatible with existing decision-support models. This data storage model stores the data in different geographical sites where they are more regularly accessed. This leads to considerably less inter-site data transfer that can reduce data security issues in some circumstances and also significantly improve data manipulation transactions speed. The aim of this paper is to propose a new approach for supporting proactive decision-making that utilizes a workable data source management methodology. The new model can effectively organize and use complex data sources, even when they are distributed in different sites in a fragmented form. At the same time, the new model provides a very high level of intellectual management decision-support by intelligent use of the data collections through utilizing new smart methods in synthesizing useful knowledge. The results of an empirical study to evaluate the model are provided. 展开更多
关键词 data mining decision-support system distributed databases knowledge discovery in database (KDD)
下载PDF
Design and Implementation of Key-Value Database for Ship Virtual Test Platform Based on Distributed System
3
作者 Kejia Zhang Qingyu Meng +2 位作者 Haiwei Pan Maocai Yuan Baoying Ma 《国际计算机前沿大会会议论文集》 EI 2023年第1期109-123,共15页
The virtual test platform is a vital tool for ship simulation and testing.However,the numerical pool ship virtual test platform is a complex system that comprises multiple heterogeneous data types,such as relational d... The virtual test platform is a vital tool for ship simulation and testing.However,the numerical pool ship virtual test platform is a complex system that comprises multiple heterogeneous data types,such as relational data,files,text,images,and animations.The analysis,evaluation,and decision-making processes heavily depend on data,which continue to increase in size and complexity.As a result,there is an increasing need for a distributed database system to manage these data.In this paper,we propose a Key-Value database based on a distributed system that can operate on any type of data,regardless of its size or type.This database architecture supports class column storage and load balancing and optimizes the efficiency of I/O bandwidth and CPU resource utilization.Moreover,it is specif-ically designed to handle the storage and access of largefiles.Additionally,we propose a multimodal data fusion mechanism that can connect various descrip-tions of the same substance,enabling the fusion and retrieval of heterogeneous multimodal data to facilitate data analysis.Our approach focuses on indexing and storage,and we compare our solution with Redis,MongoDB,and MySQL through experiments.We demonstrate the performance,scalability,and reliability of our proposed database system while also analysing its architecture’s defects and providing optimization solutions and future research directions.In conclu-sion,our database system provides an efficient and reliable solution for the data management of the virtual test platform of numerical pool ships. 展开更多
关键词 Key-Value databases multimodal data fusion heterogeneous data distributed systems columnar-like storage INDEXING
原文传递
跨院区分布式医疗数据采集融合平台设计与实现
4
作者 杜青 孙晓玮 +2 位作者 冷金昌 黄士琴 李爽 《中国卫生信息管理杂志》 2024年第4期518-525,533,共9页
目的 解决区域性数据中心或多院区医疗机构进行跨院区数据采集、融合所面临的突出困难。方法综合运用全增量无缝衔接、数据变更捕获、一致性比对、容错机制及带宽优化等关键技术,设计了数据汇聚部署、同步组织、管理控制等平台功能模块... 目的 解决区域性数据中心或多院区医疗机构进行跨院区数据采集、融合所面临的突出困难。方法综合运用全增量无缝衔接、数据变更捕获、一致性比对、容错机制及带宽优化等关键技术,设计了数据汇聚部署、同步组织、管理控制等平台功能模块。结果 构建了分布式数据采集融合平台,解决多源异构数据归一性、完整性和保鲜性问题,实现跨院区、跨系统、跨领域的医疗数据实时汇聚融合。结论 分布式数据采集融合平台支持区域性数据中心或多院区医疗机构对医疗、管理、科研等方面数据价值进行挖掘,对满足全量实时贴源数据的迫切需求进行有效的技术性探索。 展开更多
关键词 区域性数据中心 多院区医疗机构 多源异构数据库归一 数据变更捕获 分布式数据采集融合
下载PDF
基于XML的分布式异构数据库数据同步系统的研究 被引量:36
5
作者 沈敏 许华虎 +1 位作者 季永华 万杰 《计算机工程与应用》 CSCD 北大核心 2005年第5期184-186,共3页
采用“事件-条件-动作”的数据驱动机制,利用DBMS的触发器和存储过程实现数据库变更事件的实时获取和XML数据打包,通过多个通讯代理协同工作完成异构数据库间的数据同步传输。
关键词 分布式异构数据库 XML 数据同步 触发器 存储过程
下载PDF
分布式异构数据库数据同步系统的研究与实现 被引量:25
6
作者 张瑛 夏克俭 +1 位作者 张法明 蒋晨晓 《小型微型计算机系统》 CSCD 北大核心 2007年第10期1803-1806,共4页
针对分布式异构数据库的"信息孤岛"问题,为了能够将各个业务端的数据有机地结合在一起,达到紧耦合,实现数据的动态实时同步,提出了构建基于J2EE(主要是JMS)和XML技术的数据同步平台的解决方案,分析和描述了系统的工作流程及... 针对分布式异构数据库的"信息孤岛"问题,为了能够将各个业务端的数据有机地结合在一起,达到紧耦合,实现数据的动态实时同步,提出了构建基于J2EE(主要是JMS)和XML技术的数据同步平台的解决方案,分析和描述了系统的工作流程及其框架结构,对于应用到的关键性技术给予了充分说明,通过实例说明了数据同步平台的应用.综合分析及实践表明,该系统具有统一、通用、独立、实时、安全、准确、可靠等优点. 展开更多
关键词 分布式异构数据库 数据同步 XML JMS 缓存表 MAP映射
下载PDF
关于分布式、异构、历史遗留数据的数据挖掘研究 被引量:3
7
作者 艾迪明 齐剑锋 涂序彦 《计算机工程与应用》 CSCD 北大核心 2003年第1期191-194,共4页
主要研究在分布式、异构和历史遗留数据库中进行数据挖掘的方法和策略。首先讨论分布式数据库的挖掘方法,在此基础上进行扩展讨论异构数据源的数据挖掘方法;最后,讨论历史遗留数据库的挖掘方法。
关键词 数据挖掘 遗留数据 分布式数据库 异构数据库 历史遗留数据库
下载PDF
快速挖掘全局频繁项目集 被引量:35
8
作者 杨明 孙志挥 吉根林 《计算机研究与发展》 EI CSCD 北大核心 2003年第4期620-626,共7页
分布式环境中 ,全局频繁项目集的挖掘是数据挖掘中最重要的研究课题之一 传统的全局频繁项目集挖掘算法采用Apriori算法框架 ,须多遍扫描数据库并产生大量的候选项目集 ,且通过传送局部频繁项目集求全局频繁项目集的网络通信代价高 为... 分布式环境中 ,全局频繁项目集的挖掘是数据挖掘中最重要的研究课题之一 传统的全局频繁项目集挖掘算法采用Apriori算法框架 ,须多遍扫描数据库并产生大量的候选项目集 ,且通过传送局部频繁项目集求全局频繁项目集的网络通信代价高 为此 ,提出了一种分布数据库的全局频繁项目集快速挖掘算法———FMAGF FMAGF算法采用传送条件频繁模式树或条件模式基来挖掘全局频繁项目集 ,可有效地减小网络通信量 ,提高全局频繁项目集挖掘效率 展开更多
关键词 数据挖掘 全局频繁项目集 频繁模式树 快速挖掘算法 布尔型关联规则 数据库 APRIORI算法
下载PDF
分布式多层关联规则挖掘 被引量:8
9
作者 任家东 任东英 高伟 《计算机工程》 CAS CSCD 北大核心 2003年第5期96-98,共3页
提出了在分布式环境下对于每一层使用不同支持度的多层关联规则挖掘问题及其算法DMARM。该算法使用轮询方法处理分布式系统中各个节点间的通信问题,在各个节点上利用集合“或”和“与”运算,在求候选频繁模式的同时求出了模式的支持... 提出了在分布式环境下对于每一层使用不同支持度的多层关联规则挖掘问题及其算法DMARM。该算法使用轮询方法处理分布式系统中各个节点间的通信问题,在各个节点上利用集合“或”和“与”运算,在求候选频繁模式的同时求出了模式的支持度,减少了数据库的扫描次数。 展开更多
关键词 数据挖掘 关联规则 分布式数据库 数据仓库 APRIORITID算法
下载PDF
基于频繁概念直乘分布的全局闭频繁项集挖掘算法 被引量:19
10
作者 柴玉梅 张卓 王黎明 《计算机学报》 EI CSCD 北大核心 2012年第5期990-1001,共12页
基于概念格的集中式数据挖掘算法,不能充分地利用分布式计算资源来改善概念格构造效率,从而影响了挖掘算法的性能.文中进一步分析了Iceberg概念格并置集成的内在并行特性;以频繁概念直乘及其下覆盖为最小粒度,对Iceberg概念格并置集成... 基于概念格的集中式数据挖掘算法,不能充分地利用分布式计算资源来改善概念格构造效率,从而影响了挖掘算法的性能.文中进一步分析了Iceberg概念格并置集成的内在并行特性;以频繁概念直乘及其下覆盖为最小粒度,对Iceberg概念格并置集成过程进行分解和分布式计算;在对其正确性理论证明的基础上,提出了一个新颖的异构分布式环境下闭频繁项集全局挖掘算法.此算法利用Iceberg概念格的半格以及可并置集成特性,充分发挥了分布式环境下计算资源的优势.实验证明,在稠密数据集和稀疏数据集上,该挖掘算法都表现出较好的性能. 展开更多
关键词 Iceberg概念格 分布式数据挖掘 并置集成 异构数据库 闭频繁项集
下载PDF
分布式异构数据库同步系统的研究与应用 被引量:32
11
作者 林源 陈志泊 《计算机工程与设计》 CSCD 北大核心 2010年第24期5278-5281,共4页
当前各数字森林生态站经过多年的观测积累了大量的观测数据,但是由于处理手段的落后,每个生态站都是一个信息孤岛。结合森林生态站的现状以及实际森林生态站的需求,针对中国森林生态系统定位研究网络各生态站的异构数据库同步的问题,在... 当前各数字森林生态站经过多年的观测积累了大量的观测数据,但是由于处理手段的落后,每个生态站都是一个信息孤岛。结合森林生态站的现状以及实际森林生态站的需求,针对中国森林生态系统定位研究网络各生态站的异构数据库同步的问题,在研究MSF(Microsoft sync framework)框架的基础上,提出了一套分布式异构数据库同步方案。论述了该方案的原理,并基于.NET平台实现了该方案,实现各生态站异构数据库之间同步,优化了各个生态站数据资源的利用率。 展开更多
关键词 分布式 异构数据库 微软同步框架 数据同步 森林生态站
下载PDF
基于JDBC的异构分布式数据库访问 被引量:5
12
作者 张少中 王秀坤 张志勇 《计算机工程》 CAS CSCD 北大核心 2002年第12期273-275,共3页
实现异构分布式数据库共享所要解决的主要问题是数据库转换和数据库的透明访问,目前流行的实现异构数据库互联访问的两种方式是采用公共程序编程接口和专业数据库网关产品。基于JDBC的异构分布式数据库访问方法是以程序编程接口为思想... 实现异构分布式数据库共享所要解决的主要问题是数据库转换和数据库的透明访问,目前流行的实现异构数据库互联访问的两种方式是采用公共程序编程接口和专业数据库网关产品。基于JDBC的异构分布式数据库访问方法是以程序编程接口为思想的实现方案。该文详细讨论了JDBC的工作原理和基于JDBC的异构分布式数据库访问的实现方法。 展开更多
关键词 JDBC 异构分布式数据库 数据共享 数据库访问 数据处理 计算机
下载PDF
基于PowerBuilder的异构分布式数据库访问 被引量:7
13
作者 张少中 杨南海 王秀坤 《计算机工程与应用》 CSCD 北大核心 2003年第18期199-201,共3页
实现异构分布式数据库共享所要解决的主要问题是数据库转换和数据库的透明访问,目前流行的实现异构分布式数据库互连访问的两种方式是采用公共程序编程接口和专业数据库网关产品。基于PowerBuilder的异构分布式数据库访问方法是以程序... 实现异构分布式数据库共享所要解决的主要问题是数据库转换和数据库的透明访问,目前流行的实现异构分布式数据库互连访问的两种方式是采用公共程序编程接口和专业数据库网关产品。基于PowerBuilder的异构分布式数据库访问方法是以程序编程接口为思想的实现方案。论文详细讨论了PowerBuilder的工作原理和基于PowerBuilder的异构分布式数据库访问的实现方法。 展开更多
关键词 异构分布式数据库 数据访问 0DBC POWERBUILDER
下载PDF
分布式异构计算环境下的洗钱侦测系统体系结构——基于数据挖掘技术 被引量:8
14
作者 陈云开 卢正鼎 +1 位作者 李瑞轩 李玉华 《计算机工程与应用》 CSCD 北大核心 2006年第29期202-204,共3页
本文从我国反洗钱的现状出发,提出分布式异构计算环境下基于数据挖掘技术的洗钱侦测系统体系结构。并从逻辑层次结构、系统基本框架和系统基本流程三个方面对洗钱侦测系统的体系结构进行阐述。
关键词 反洗钱 分布异构 数据挖掘
下载PDF
基于模糊粗糙集理论的综合数据挖掘方法在空间负荷预测中的应用 被引量:13
15
作者 熊浩 李卫国 +2 位作者 黄彦浩 张海峰 畅广辉 《电网技术》 EI CSCD 北大核心 2007年第14期36-40,56,共6页
基于模糊粗糙集理论,提出了一种综合数据挖掘方法,并将其应用于空间负荷预测中。基于规则约简方法提出了循环采样方法,采用数据库知识获取技术按采集的样本属性值将样本聚类,根据聚类中心对连续取值的属性设定模糊值,根据决策属性的包... 基于模糊粗糙集理论,提出了一种综合数据挖掘方法,并将其应用于空间负荷预测中。基于规则约简方法提出了循环采样方法,采用数据库知识获取技术按采集的样本属性值将样本聚类,根据聚类中心对连续取值的属性设定模糊值,根据决策属性的包含度对模糊粗糙规则进行筛选,并采用数据库知识获取技术实现了用地类型的转换。算例结果表明该方法简单灵活,可用于短期、中期和长期空间负荷预测中。 展开更多
关键词 空间负荷预测 数据挖掘 数据库知识获取(KDD) 模糊粗糙集 配电网规划
下载PDF
多数据库中间件的模型研究 被引量:13
16
作者 齐德昱 胡镜林 张鹏 《计算机工程与设计》 CSCD 北大核心 2005年第10期2602-2605,共4页
提出一种新的多数据库中间件架构,使得异源独立分布数据的“上推/受访/集成”模型化,从而使异源独立分布数据的存取/复用/集成,能像单一关系数据库那样走向模型化,建立“DBMS的DBMS”;讨论了该模型中的几个主要关键技术,如数据的一致性... 提出一种新的多数据库中间件架构,使得异源独立分布数据的“上推/受访/集成”模型化,从而使异源独立分布数据的存取/复用/集成,能像单一关系数据库那样走向模型化,建立“DBMS的DBMS”;讨论了该模型中的几个主要关键技术,如数据的一致性、数据的复制策略、局部数据源的即插即用研究、缓冲区系统中的数据名空间。 展开更多
关键词 多数据库中间件 异源独立分布数据 全局数据对象模型
下载PDF
综合性医院住院患者年龄分布特征的探讨 被引量:12
17
作者 宇传华 余松林 徐勇勇 《中国卫生统计》 CSCD 北大核心 2005年第6期373-376,共4页
目的探讨医院住院者的疾病种类、住院费用、住院天数的年龄分布特征.方法采用共计55万余住院者的综合性医院病案首页数据库数据,以入院日期与出生日期来计算每一住院者的实足年龄,按出院第一诊断的ICD-9编码进行疾病分类.结果住院者年... 目的探讨医院住院者的疾病种类、住院费用、住院天数的年龄分布特征.方法采用共计55万余住院者的综合性医院病案首页数据库数据,以入院日期与出生日期来计算每一住院者的实足年龄,按出院第一诊断的ICD-9编码进行疾病分类.结果住院者年龄分布曲线存在一个低谷和四个高峰;除20~49岁年龄组外,其余年龄女性住院者比率均低于男性;肿瘤、循环系统疾病等住院者人数随年龄变化具有特定的分布特征.结论病案首页数据库数据蕴藏着丰富的信息,是疾病统计的宝贵资源.用它来探讨住院者年龄分布特征具有一定的合理性. 展开更多
关键词 病案首页数据 数据挖掘 年龄分布特征 ICD-9
下载PDF
基于垂直数据分布的大型稠密数据库快速关联规则挖掘算法 被引量:24
18
作者 崔建 李强 杨龙坡 《计算机科学》 CSCD 北大核心 2011年第4期216-220,共5页
为进一步解决对大型事务数据库进行关联规则挖掘时产生的CPU时间开销大和I/O操作频繁的问题,给出了一种基于垂直数据分布的改进关联规则挖掘算法,称为VARMLDb算法。该算法首先有效地把数据库分为内存可以满足要求的若干划分,然后结合有... 为进一步解决对大型事务数据库进行关联规则挖掘时产生的CPU时间开销大和I/O操作频繁的问题,给出了一种基于垂直数据分布的改进关联规则挖掘算法,称为VARMLDb算法。该算法首先有效地把数据库分为内存可以满足要求的若干划分,然后结合有向无环图和垂直数据形式diffset差集来存储和计算频繁项集,极大地减少了存储中间结果所需的内存大小,解决了传统垂直数据挖掘算法对稠密数据库挖掘效率低下的问题,使该算法可有效地适用于大型稠密数据库的关联规则挖掘。整个算法吸取CARMA算法的优势,只需扫描两次数据库便可完成挖掘过程。实验结果表明该算法是正确的,在大型稠密数据库中,VARMLDb算法具有较高的执行效率。 展开更多
关键词 CARMA算法 DAG diffset差集 垂直数据分布 稠密数据库
下载PDF
基于分布式数据库的森林病虫害信息网络框架设计与应用 被引量:7
19
作者 景天忠 王志英 《东北林业大学学报》 CAS CSCD 北大核心 2003年第1期24-26,共3页
针对目前我国森林病虫害防治中信息化程度不高和对已有成果利用率低的现状 ,通过对当前基于Web和分布式数据库的开发应用现状的分析 ,提出了建立基于分布式数据库的森林病虫害信息网络 ,并讨论了其框架设计和预期应用。
关键词 森林病虫害 信息网络 框架设计 应用 分布式数据库
下载PDF
IDSS 中数据仓库和数据挖掘的研究与实现 被引量:14
20
作者 王冰清 怀进鹏 《北京航空航天大学学报》 EI CAS CSCD 北大核心 1998年第4期399-402,共4页
讨论了数据仓库、数据库知识发现和分布式对象的概念和技术,提出了一种集成化的IDSS(InteligenceDecisionSupportSystems)的开发环境,将传统的DSS四库结构与数据仓库相结合,把数据挖掘作... 讨论了数据仓库、数据库知识发现和分布式对象的概念和技术,提出了一种集成化的IDSS(InteligenceDecisionSupportSystems)的开发环境,将传统的DSS四库结构与数据仓库相结合,把数据挖掘作为一种特殊的模型应用于数据库中的知识发现.同时,在系统实现上采用分布式对象技术,实现接口规范和应用程序相分离.最后进一步对数据仓库的设计与实现及数据库知识发现的设计与实现进行了介绍. 展开更多
关键词 决策支持系统 数据库 数据仓库 数据挖掘 IDSS
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部