期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
An Overview of Data Mining and Knowledge Discovery 被引量:8
1
作者 范建华 李德毅 《Journal of Computer Science & Technology》 SCIE EI CSCD 1998年第4期348-368,共21页
With massive amounts of data stored in databases, mining information and knowledge in databases has become an important issue in recent research. Researchers in many different fields have shown great interest in data ... With massive amounts of data stored in databases, mining information and knowledge in databases has become an important issue in recent research. Researchers in many different fields have shown great interest in data mining and knowledge discovery in databases. Several emerging applications in information providing services, such as data warehousing and on-line services over the Internet, also call for various data mining and knowledge discovery techniques to understand user behavior better, to improve the service provided, and to increase the business opportunities. In response to such a demand, this article is to provide a comprehensive survey on the data mining and knowledge discovery techniques developed recently, and introduce some real application systems as well. In conclusion, this article also lists some problems and challenges for further research. 展开更多
关键词 knowledge discovery in databases data mining machine learning association rule CLASSIFICATION data clustering data generalization pattern searching
原文传递
一种改进的Bayesian网络结构学习算法 被引量:14
2
作者 羌磊 肖田元 乔桂秀 《计算机研究与发展》 EI CSCD 北大核心 2002年第10期1221-1226,共6页
基于模型选择的 Bayesian网络 ( BN)结构学习是 NP难的可行解搜索过程 .针对现有算法在复杂系统求解中时间效率低的问题 ,提出了一种新的基于最小描述长度 ( minimal description length)理论的结构学习算法 I-B &B-MDL .这种算法... 基于模型选择的 Bayesian网络 ( BN)结构学习是 NP难的可行解搜索过程 .针对现有算法在复杂系统求解中时间效率低的问题 ,提出了一种新的基于最小描述长度 ( minimal description length)理论的结构学习算法 I-B &B-MDL .这种算法将独立性测度与预测估计相结合 ,在学习过程中引入小计算量的独立性测试为 MDL搜索提供启发性知识 ,限制可行解搜索空间 ,从而加速问题求解过程 .针对新算法讨论了改进策略对求解精度的影响 ,并结合算例分析了独立性测试的阶数选择问题 .通过对一实际问题进行验证表明 ,在保证结果精度的前提下 ,新算法在时间性能上比仅基于预测估计的 B & B-MDL 展开更多
关键词 bayesian网络 结构学习算法 数据挖掘 知识发现 机器学习 知识表达 信息处理
下载PDF
论空间数据挖掘和知识发现 被引量:181
3
作者 李德仁 王树良 +1 位作者 史文中 王新洲 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2001年第6期491-499,共9页
随着现代科技和传感器的发展和应用 ,复杂多变的空间数据日益膨胀 ,远远超出了人的解译能力 ,迫切需要数据挖掘和知识发现为其提供知识。本文研究了空间数据挖掘和知识发现的含义、可发现的空间的关联、特征、分类和聚类等知识 ,以及它... 随着现代科技和传感器的发展和应用 ,复杂多变的空间数据日益膨胀 ,远远超出了人的解译能力 ,迫切需要数据挖掘和知识发现为其提供知识。本文研究了空间数据挖掘和知识发现的含义、可发现的空间的关联、特征、分类和聚类等知识 ,以及它与数据挖掘和知识发现、机器学习、地学数据分析、空间数据库、空间数据仓库、数字地球等相关学科的关系 ,概述了SDMKD的产生和发展 。 展开更多
关键词 空间数据挖掘 知识发现 机器学习 SDMKD DMKD 计算机技术 数据库
下载PDF
用于数据采掘的贝叶斯分类器研究 被引量:30
4
作者 林士敏 田凤占 陆玉昌 《计算机科学》 CSCD 北大核心 2000年第10期73-76,共4页
所谓分类器是一个函数f(x),它给需要分类的实例x赋予类标签c,∈C(j=1,2,…,m),实例x由一组属性值a_1,…,a_n描述,C是类变量,取有限个值,可看成有限个元素的集合。进行分类首先要构造一个分类器。从预先分类的实例进行有导师学习并建立... 所谓分类器是一个函数f(x),它给需要分类的实例x赋予类标签c,∈C(j=1,2,…,m),实例x由一组属性值a_1,…,a_n描述,C是类变量,取有限个值,可看成有限个元素的集合。进行分类首先要构造一个分类器。从预先分类的实例进行有导师学习并建立分类器,是机器学习的中心问题之一。已有的分类器如决策树、决策表、神经网络、决策图和规则等。 展开更多
关键词 数据采掘 数据库 贝叶斯分类器 机器学习
下载PDF
贝叶斯学习、贝叶斯网络与数据采掘 被引量:34
5
作者 林士敏 田凤占 陆玉昌 《计算机科学》 CSCD 北大核心 2000年第10期69-72,共4页
自从50~60年代贝叶斯学派形成后,关于贝叶斯分析的研究久盛不衰。早在80年代,贝叶斯网络就成功地应用于专家系统,成为表示不确定性专家知识和推理的一种流行方法。90年代以来,贝叶斯学习一直是机器学习研究的重要方向。
关键词 贝叶斯学习 贝叶斯网络 数据采掘 机器学习
下载PDF
数据采掘与知识发现:回顾和展望 被引量:32
6
作者 郑之开 张广凡 邵惠鹤 《信息与控制》 CSCD 北大核心 1999年第5期357-365,共9页
如何从大规模数据库中发掘深层次的知识和信息,而不仅仅是那些从传统数据库查询方法所获得的平凡内容,这方面的研究正受到越来越多的关注.作为一门独立于应用的研究课题,它已成为众多研究领域的热点内容,已经有相当多的应用报道并... 如何从大规模数据库中发掘深层次的知识和信息,而不仅仅是那些从传统数据库查询方法所获得的平凡内容,这方面的研究正受到越来越多的关注.作为一门独立于应用的研究课题,它已成为众多研究领域的热点内容,已经有相当多的应用报道并取得了丰硕的成果.本文试就数据采掘和知识发现的各方面内容:如采掘过程、方法、算法和应用等,作一个完整的回顾,文章也讨论了这一领域未来的工作和挑战. 展开更多
关键词 数据采掘 知识发现 机器学习 关联规则 数据库
下载PDF
从故障实例数据库中挖掘振动信号特征 被引量:4
7
作者 关惠玲 张优云 +2 位作者 韩捷 董辛旻 郝伟 《振动工程学报》 EI CSCD 北大核心 2002年第3期337-342,共6页
复杂、并发故障诊断的难点在于这些故障的振动信号很复杂 ,特征很难获取。文中阐述了从实例数据库中挖掘故障特征的整体结构 ,定义了信号的绝对、相对和梯度特征及相应的绝对、相对和梯度模式实例 ,进而阐述了应用模糊聚类分析挖掘特征... 复杂、并发故障诊断的难点在于这些故障的振动信号很复杂 ,特征很难获取。文中阐述了从实例数据库中挖掘故障特征的整体结构 ,定义了信号的绝对、相对和梯度特征及相应的绝对、相对和梯度模式实例 ,进而阐述了应用模糊聚类分析挖掘特征模式的方法。最后以往复式压缩机实例挖掘系统为例说明了该原理的应用。 展开更多
关键词 振动信号 故障诊断 数据挖掘 特征提取 知识获取 实例学习
下载PDF
基于条件对数似然函数导数的贝叶斯网络分类器优化算法 被引量:19
8
作者 王中锋 王志海 《计算机学报》 EI CSCD 北大核心 2012年第2期364-374,共11页
通常基于鉴别式学习策略训练的贝叶斯网络分类器有较高的精度,但在具有冗余边的网络结构之上鉴别式参数学习算法的性能受到一定的限制.为了在实际应用中进一步提高贝叶斯网络分类器的分类精度,该文定量描述了网络结构与真实数据变量分... 通常基于鉴别式学习策略训练的贝叶斯网络分类器有较高的精度,但在具有冗余边的网络结构之上鉴别式参数学习算法的性能受到一定的限制.为了在实际应用中进一步提高贝叶斯网络分类器的分类精度,该文定量描述了网络结构与真实数据变量分布之间的关系,提出了一种不存在冗余边的森林型贝叶斯网络分类器及其相应的FAN学习算法(Forest-Augmented Nave Bayes Algorithm),FAN算法能够利用对数条件似然函数的偏导数来优化网络结构学习.实验结果表明常用的限制性贝叶斯网络分类器通常存在一些冗余边,其往往会降低鉴别式参数学习算法的性能;森林型贝叶斯网络分类器减少了结构中的冗余边,更加适合于采用鉴别式学习策略训练参数;应用条件对数似然函数偏导数的FAN算法在大多数实验数据集合上提高了分类精度. 展开更多
关键词 机器学习 数据挖掘 分类器 贝叶斯网络 鉴别式训练策略
下载PDF
四种贝叶斯分类器及其比较 被引量:8
9
作者 邓甦 付长贺 《沈阳师范大学学报(自然科学版)》 CAS 2008年第1期31-33,共3页
首先介绍了贝叶斯网络及贝叶斯网络分类器,并对四种典型贝叶斯分类器的特点进行了介绍与分析.在总结各种贝叶斯分类器特点的基础上,通过选取的UCI数据库中的10个数据集对其分类效果进行了实验比较,并根据实验结果讨论各自的特点,从而得... 首先介绍了贝叶斯网络及贝叶斯网络分类器,并对四种典型贝叶斯分类器的特点进行了介绍与分析.在总结各种贝叶斯分类器特点的基础上,通过选取的UCI数据库中的10个数据集对其分类效果进行了实验比较,并根据实验结果讨论各自的特点,从而得出针对具有不同特点数据集选取适当分类器的方法. 展开更多
关键词 贝叶斯网络 分类器 数据挖掘 机器学习
下载PDF
KDD研究中的若干问题与方法 被引量:10
10
作者 欧阳为民 郑诚 《安徽大学学报(自然科学版)》 CAS 1999年第1期41-52,共12页
在数据库中发现知识,又称为数据发掘,其目标是从大型数据集中发现先前未知的潜在有用的模式或知识。本文对该领域进行简要综述,并主要从数据库角度讨论若干数据发掘问题与方法。
关键词 知识发现 数据发掘 机器学习 数据库 KDD
下载PDF
贝叶斯网络分类器结构与变量分布的差异性分析 被引量:1
11
作者 王中锋 王志海 付彬 《北京交通大学学报》 CAS CSCD 北大核心 2011年第2期32-35,47,共5页
为了提高鉴别式学习策略训练的贝叶斯网络分类器的分类精度,分析了贝叶斯网络结构与数据中变量分布之间的差异对贝叶斯网络分类器性能的影响,实验以网络结构的实际联合概率分布的树型近似描述为基准,删除在条件对数似然函数极大化过程... 为了提高鉴别式学习策略训练的贝叶斯网络分类器的分类精度,分析了贝叶斯网络结构与数据中变量分布之间的差异对贝叶斯网络分类器性能的影响,实验以网络结构的实际联合概率分布的树型近似描述为基准,删除在条件对数似然函数极大化过程中不起作用的边,生成具有同一联合概率分布的不同描述程度的网络结构.实验结果表明,只有当网络结构表现力不足时,鉴别式参数学习才能起积极作用;而当网络结构中有多余的边时,反而容易受其制约.从而验证了网络中多余的边对分类器性能没有影响的观点是片面的. 展开更多
关键词 数据挖掘 机器学习 贝叶斯网络 分类器 结构学习 参数学习 鉴别式学习
下载PDF
数据发掘论题研究 被引量:3
12
作者 刘发升 黎志明 杨炳儒 《赣南师范学院学报》 1999年第3期67-72,共6页
数据库中知识发现(KDD)是一个从数据中识别有效、新颖、潜在有用及完全可理解模式的非平凡过程。数据发掘(DataMining)是KDD的核心构件。本文从一个新的角度来论述KDD研究及应用的各个方面。
关键词 数据发掘 数据库 知识发现 机器学习
下载PDF
决策树分类器在分析基因微阵列数据中的应用 被引量:1
13
作者 项婧 任劼 《计算机工程与设计》 CSCD 北大核心 2006年第15期2905-2908,共4页
近年来,需要深入研究癌症细胞的基因表达技术正在不断增多。机器学习算法已经被广泛用于当今世界的许多领域,但是却很少应用于生物信息领域。系统研究了决策树的生成、修剪的原理和算法以及其它与决策树相关的问题;并且根据CAMDA2000(cr... 近年来,需要深入研究癌症细胞的基因表达技术正在不断增多。机器学习算法已经被广泛用于当今世界的许多领域,但是却很少应用于生物信息领域。系统研究了决策树的生成、修剪的原理和算法以及其它与决策树相关的问题;并且根据CAMDA2000(criticalassessmentofmicroarraydataanalysis)提供的急性淋巴白血病(ALL)和急性骨髓白血病(AML)数据集,设计并实现了一个基于ID3算法的决策树分类器,并利用后剪枝算法简化决策树。最后通过实验验证算法的有效性,实验结果表明利用该决策树分类器对白血病微阵列实验数据进行判别分析,分类准确率很高,证明了决策树算法在医学数据挖掘领域有着广泛的应用前景。 展开更多
关键词 机器学习 决策树 剪枝算法 微阵列数据分析 数据挖掘 知识发现
下载PDF
数据开采及其在超市中的应用 被引量:1
14
作者 田容 陈立潮 张晋 《华北工学院学报》 2001年第2期138-141,共4页
目的 介绍数据开采技术及其在超市中的应用 .方法 通过介绍数据开采技术的起源、发展和现状 ,提出了一种基于超市管理的决策系统模型 ,并对其超市的各方面的应用作了探讨性研究 .结果 将数据开采技术应用于商业领域 ,产生的价值将是... 目的 介绍数据开采技术及其在超市中的应用 .方法 通过介绍数据开采技术的起源、发展和现状 ,提出了一种基于超市管理的决策系统模型 ,并对其超市的各方面的应用作了探讨性研究 .结果 将数据开采技术应用于商业领域 ,产生的价值将是十分可观的 .结论 数据开采技术作为一种新型技术 。 展开更多
关键词 数据开采 知识发现 机器学习 智能决策 超级市场
下载PDF
KDD:数据库中的知识发现 被引量:26
15
作者 朱廷劭 高文 《计算机科学》 CSCD 北大核心 1997年第6期5-9,共5页
一引言 随着数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据急剧增大。但目前数据库系统所能做到的只是对数据库中已有的数据进行存取。
关键词 数据库 知识发现 KDD 机器学习
下载PDF
数据库中知识发现与挖掘
16
作者 杨勇 祝峰 +1 位作者 许亚睛 严向奎 《新疆石油学院学报》 1999年第2期61-63,85,共4页
本文对当今计算机科学中的热点研究问题──数据库中知识发现进行了全面的介绍。讨论了其与其它学科的关系,并介绍了数据库中知识发现的重要阶段──数据挖掘中的一些概念。
关键词 数据挖掘 知识发现 数据库 模式
下载PDF
Bayesian方法的计算学习机制和问题求解 被引量:30
17
作者 林士敏 王双成 陆玉昌 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2000年第9期61-64,共4页
从信息熵的角度讨论了无信息先验分布的Bayesian假设的合理性 ,着重分析了贝叶斯方法的计算学习机制 ,得出贝叶斯定理是将先验分布中的期望值与样本均值按各自的精度进行加权平均 ,精度越高者其权值越大 ,合理地综合了先验信息和后验信... 从信息熵的角度讨论了无信息先验分布的Bayesian假设的合理性 ,着重分析了贝叶斯方法的计算学习机制 ,得出贝叶斯定理是将先验分布中的期望值与样本均值按各自的精度进行加权平均 ,精度越高者其权值越大 ,合理地综合了先验信息和后验信息。在共轭先验分布的前提下 ,可以将后验信息作为新的一轮计算的先验 ,用 Bayesian定理与进一步得到的样本信息进行综合。多次重复这个过程后 ,样本信息的影响越来越显著。因此 ,合理正确地指派先验分布对提高学习的效率和质量有重要意义。 Bayesian方法既可避免只使用先验信息可能带来的主观偏见 ,和缺乏样本信息时的大量盲目搜索 ,也可避免只使用后验信息带来的噪音的影响。因此 ,适用于具有概率统计特征的数据采掘和知识发现问题 ,尤其是样本难得或代价昂贵的问题。 展开更多
关键词 机器学习 贝叶斯方法 计算学习机制 问题求解
原文传递
基于Matlab的贝叶斯分类器实验平台MBNC 被引量:27
18
作者 程泽凯 林士敏 +2 位作者 陆玉昌 蒋望东 陆小艺 《复旦学报(自然科学版)》 CAS CSCD 北大核心 2004年第5期729-732,共4页
为了测试评估贝叶斯分类器的性能,用不同数据集进行对比实验是必不可少的.现有的贝叶斯网络实验软件包都是针对特定目的设计的,不能满足不同研究的需要.介绍了用Matlab在BNT软件包基础上建构的贝叶斯分类器实验平台MBNC,阐述了MBNC的系... 为了测试评估贝叶斯分类器的性能,用不同数据集进行对比实验是必不可少的.现有的贝叶斯网络实验软件包都是针对特定目的设计的,不能满足不同研究的需要.介绍了用Matlab在BNT软件包基础上建构的贝叶斯分类器实验平台MBNC,阐述了MBNC的系统结构和主要功能,以及在MBNC上建立的朴素贝叶斯分类器NBC,基于互信息和条件互信息测度的树扩展的贝叶斯分类器TANC,基于K2算法和GS算法的贝叶斯网络分类器BNC.用来自UCI的标准数据集对MBNC进行测试,实验结果表明基于MBNC所建构的贝叶斯分类器的性能优于国外同类工作的结果,编程量大大小于使用同类的实验软件包,所建立的MBNC实验平台工作正确、有效、稳定.在MBNC上已经进行贝叶斯分类器的优化和改进实验,以及处理缺失数据等研究工作. 展开更多
关键词 朴素贝叶斯分类器 实验平台 软件包 贝叶斯网络 数据集 编程 标准数据 同类 建构 测试评估
原文传递
贝叶斯网络的建造及其在数据采掘中的应用 被引量:66
19
作者 林士敏 田凤占 陆玉昌 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2001年第1期49-52,共4页
贝叶斯 (Bayesian)网络近年成为数据采掘引人注目的研究方向。通过剖析 Bayesian网络的结构和建造步骤 ,着重讨论用 Bayesian方法从先验信息和样本数据进行学习以确定网络的结构和概率分布的基本方法 ,分析 Bayesian网络学习的特点 ,探... 贝叶斯 (Bayesian)网络近年成为数据采掘引人注目的研究方向。通过剖析 Bayesian网络的结构和建造步骤 ,着重讨论用 Bayesian方法从先验信息和样本数据进行学习以确定网络的结构和概率分布的基本方法 ,分析 Bayesian网络学习的特点 ,探讨 Bayesian网络的适用性。与数据采掘的其它方法相比 ,Bayesian网络的优点是可以综合先验信息和样本信息 ,这在样本难得时特别有用 ;可以发现数据之间的因果关系 ,适合于处理不完整数据集 ,这是其它模型难以做到的。其缺点是计算开销较大 ;确定合理的先验密度比较困难 ;如何判定实际问题是否满足所要求的假设 。 展开更多
关键词 BFAYESIAN网络 贝叶斯网络 数据采掘 知识发现 机器学习
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部