期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
An Overview of Data Mining and Knowledge Discovery 被引量:8
1
作者 范建华 李德毅 《Journal of Computer Science & Technology》 SCIE EI CSCD 1998年第4期348-368,共21页
With massive amounts of data stored in databases, mining information and knowledge in databases has become an important issue in recent research. Researchers in many different fields have shown great interest in data ... With massive amounts of data stored in databases, mining information and knowledge in databases has become an important issue in recent research. Researchers in many different fields have shown great interest in data mining and knowledge discovery in databases. Several emerging applications in information providing services, such as data warehousing and on-line services over the Internet, also call for various data mining and knowledge discovery techniques to understand user behavior better, to improve the service provided, and to increase the business opportunities. In response to such a demand, this article is to provide a comprehensive survey on the data mining and knowledge discovery techniques developed recently, and introduce some real application systems as well. In conclusion, this article also lists some problems and challenges for further research. 展开更多
关键词 knowledge discovery in databases data mining machine learning association rule CLASSIFICATION data clustering data generalization pattern searching
原文传递
一种改进的Bayesian网络结构学习算法 被引量:14
2
作者 羌磊 肖田元 乔桂秀 《计算机研究与发展》 EI CSCD 北大核心 2002年第10期1221-1226,共6页
基于模型选择的 Bayesian网络 ( BN)结构学习是 NP难的可行解搜索过程 .针对现有算法在复杂系统求解中时间效率低的问题 ,提出了一种新的基于最小描述长度 ( minimal description length)理论的结构学习算法 I-B &B-MDL .这种算法... 基于模型选择的 Bayesian网络 ( BN)结构学习是 NP难的可行解搜索过程 .针对现有算法在复杂系统求解中时间效率低的问题 ,提出了一种新的基于最小描述长度 ( minimal description length)理论的结构学习算法 I-B &B-MDL .这种算法将独立性测度与预测估计相结合 ,在学习过程中引入小计算量的独立性测试为 MDL搜索提供启发性知识 ,限制可行解搜索空间 ,从而加速问题求解过程 .针对新算法讨论了改进策略对求解精度的影响 ,并结合算例分析了独立性测试的阶数选择问题 .通过对一实际问题进行验证表明 ,在保证结果精度的前提下 ,新算法在时间性能上比仅基于预测估计的 B & B-MDL 展开更多
关键词 bayesian网络 结构学习算法 数据挖掘 知识发现 机器学习 知识表达 信息处理
下载PDF
论空间数据挖掘和知识发现 被引量:179
3
作者 李德仁 王树良 +1 位作者 史文中 王新洲 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2001年第6期491-499,共9页
随着现代科技和传感器的发展和应用 ,复杂多变的空间数据日益膨胀 ,远远超出了人的解译能力 ,迫切需要数据挖掘和知识发现为其提供知识。本文研究了空间数据挖掘和知识发现的含义、可发现的空间的关联、特征、分类和聚类等知识 ,以及它... 随着现代科技和传感器的发展和应用 ,复杂多变的空间数据日益膨胀 ,远远超出了人的解译能力 ,迫切需要数据挖掘和知识发现为其提供知识。本文研究了空间数据挖掘和知识发现的含义、可发现的空间的关联、特征、分类和聚类等知识 ,以及它与数据挖掘和知识发现、机器学习、地学数据分析、空间数据库、空间数据仓库、数字地球等相关学科的关系 ,概述了SDMKD的产生和发展 。 展开更多
关键词 空间数据挖掘 知识发现 机器学习 SDMKD DMKD 计算机技术 数据库
下载PDF
贝叶斯学习、贝叶斯网络与数据采掘 被引量:34
4
作者 林士敏 田凤占 陆玉昌 《计算机科学》 CSCD 北大核心 2000年第10期69-72,共4页
自从50~60年代贝叶斯学派形成后,关于贝叶斯分析的研究久盛不衰。早在80年代,贝叶斯网络就成功地应用于专家系统,成为表示不确定性专家知识和推理的一种流行方法。90年代以来,贝叶斯学习一直是机器学习研究的重要方向。
关键词 贝叶斯学习 贝叶斯网络 数据采掘 机器学习
下载PDF
用于数据采掘的贝叶斯分类器研究 被引量:30
5
作者 林士敏 田凤占 陆玉昌 《计算机科学》 CSCD 北大核心 2000年第10期73-76,共4页
所谓分类器是一个函数f(x),它给需要分类的实例x赋予类标签c,∈C(j=1,2,…,m),实例x由一组属性值a_1,…,a_n描述,C是类变量,取有限个值,可看成有限个元素的集合。进行分类首先要构造一个分类器。从预先分类的实例进行有导师学习并建立... 所谓分类器是一个函数f(x),它给需要分类的实例x赋予类标签c,∈C(j=1,2,…,m),实例x由一组属性值a_1,…,a_n描述,C是类变量,取有限个值,可看成有限个元素的集合。进行分类首先要构造一个分类器。从预先分类的实例进行有导师学习并建立分类器,是机器学习的中心问题之一。已有的分类器如决策树、决策表、神经网络、决策图和规则等。 展开更多
关键词 数据采掘 数据库 贝叶斯分类器 机器学习
下载PDF
大数据与数学地球科学研究进展——大数据与数学地球科学专题代序 被引量:84
6
作者 周永章 陈烁 +4 位作者 张旗 肖凡 王树功 刘艳鹏 焦守涛 《岩石学报》 SCIE EI CAS CSCD 北大核心 2018年第2期255-263,共9页
大数据与数学地球科学的核心应用技术包括高维数据降维、图像数据处理、无限数据流挖掘、机器学习、关联规则算法与推荐系统算法等。人工智能地质学,包括大数据-智能矿床成因模型与找矿模型的构建,是具有重要价值的研究方向。高维数据... 大数据与数学地球科学的核心应用技术包括高维数据降维、图像数据处理、无限数据流挖掘、机器学习、关联规则算法与推荐系统算法等。人工智能地质学,包括大数据-智能矿床成因模型与找矿模型的构建,是具有重要价值的研究方向。高维数据降维旨在从初始高维特征集合中选出低维特征集合,有效地消除无关和冗余特征,增强学习结果的易理解性。哈希算法、聚类分析、主成分分析等是较常用的数学降维工具。机器学习是人工智能的核心,是使计算机具有智能的根本途径。机器学习与人工智能各种基础问题的统一性观点正在形成。深度学习的训练模型往往需要海量数据作为支撑,因此迁移学习方法日益受到重视。图像模式识别是大数据挖掘的重要技术。网络中的社区结构识别对理解整个网络的结构和功能有重要价值,可帮助分析、预测网络各元素间的交互关系。沉浸式虚拟现实技术是实现大数据可视化的重要方向,对具有多元、异构、时空性、非线性、多尺度地质矿产勘查数据的展示要求有特别的价值。引入VR技术进行矿产地质大数据的可视化,可实现大数据时代矿产勘查数据的新认知。无限数据流在地质、地球化学、地球物理监测中大量存在,甚至可以持续自动产生。对数据流数据的计算包括对点查询、范围查询、内积查询、分位数计算、频繁项计算等。关联规则和推荐系统算法是大数据挖掘中的重要算法,其应用范围越来越广泛。贝叶斯原理在大数据时代有独特的价值,贝叶斯网络是成因建模的一个革命性工具。智能地质学研究刚刚起步,构建大数据-智能矿床成因模型与找矿模型是智能地质学研究的重要内容。矿床模型研究方式的变革,将出现于互联网、云计算技术环境下全球各地的矿床研究团队的共同参与。 展开更多
关键词 大数据挖掘 高维数据降维 图像数据处理 无限数据流挖掘 机器学习 关联规则 人工智能地质学 智能矿床模型 贝叶斯网络
下载PDF
数据采掘与知识发现:回顾和展望 被引量:32
7
作者 郑之开 张广凡 邵惠鹤 《信息与控制》 CSCD 北大核心 1999年第5期357-365,共9页
如何从大规模数据库中发掘深层次的知识和信息,而不仅仅是那些从传统数据库查询方法所获得的平凡内容,这方面的研究正受到越来越多的关注.作为一门独立于应用的研究课题,它已成为众多研究领域的热点内容,已经有相当多的应用报道并... 如何从大规模数据库中发掘深层次的知识和信息,而不仅仅是那些从传统数据库查询方法所获得的平凡内容,这方面的研究正受到越来越多的关注.作为一门独立于应用的研究课题,它已成为众多研究领域的热点内容,已经有相当多的应用报道并取得了丰硕的成果.本文试就数据采掘和知识发现的各方面内容:如采掘过程、方法、算法和应用等,作一个完整的回顾,文章也讨论了这一领域未来的工作和挑战. 展开更多
关键词 数据采掘 知识发现 机器学习 关联规则 数据库
下载PDF
基于贝叶斯网络的电信客户流失预测分析 被引量:13
8
作者 叶进 程泽凯 林士敏 《计算机工程与应用》 CSCD 北大核心 2005年第14期212-214,共3页
电信客户流失分析常用的数据挖掘方法有自动聚类、决策树和人工神经网络,它们是采用数据本身来训练模型的,没有利用先验知识。电信客户流失是由客户心理、服务质量和对手竞争等诸多复杂的因素造成的,利用这些已有的先验知识,可以提高预... 电信客户流失分析常用的数据挖掘方法有自动聚类、决策树和人工神经网络,它们是采用数据本身来训练模型的,没有利用先验知识。电信客户流失是由客户心理、服务质量和对手竞争等诸多复杂的因素造成的,利用这些已有的先验知识,可以提高预测的精度。该文根据先验知识选取分析变量,采集样本数据,通过贝叶斯网络的结构学习和参数学习,建立客户流失模型并进行客户流失趋势预测,取得了比标准数据集更准确的结果,该结果和决策树方法的预测结果相比还具有较大的优势,说明贝叶斯网络是分析客户流失等不确定性问题的有效工具。 展开更多
关键词 数据挖掘 机器学习 贝叶斯网络 贝叶斯方法 客户流失预测
下载PDF
从故障实例数据库中挖掘振动信号特征 被引量:4
9
作者 关惠玲 张优云 +2 位作者 韩捷 董辛旻 郝伟 《振动工程学报》 EI CSCD 北大核心 2002年第3期337-342,共6页
复杂、并发故障诊断的难点在于这些故障的振动信号很复杂 ,特征很难获取。文中阐述了从实例数据库中挖掘故障特征的整体结构 ,定义了信号的绝对、相对和梯度特征及相应的绝对、相对和梯度模式实例 ,进而阐述了应用模糊聚类分析挖掘特征... 复杂、并发故障诊断的难点在于这些故障的振动信号很复杂 ,特征很难获取。文中阐述了从实例数据库中挖掘故障特征的整体结构 ,定义了信号的绝对、相对和梯度特征及相应的绝对、相对和梯度模式实例 ,进而阐述了应用模糊聚类分析挖掘特征模式的方法。最后以往复式压缩机实例挖掘系统为例说明了该原理的应用。 展开更多
关键词 振动信号 故障诊断 数据挖掘 特征提取 知识获取 实例学习
下载PDF
基于条件对数似然函数导数的贝叶斯网络分类器优化算法 被引量:19
10
作者 王中锋 王志海 《计算机学报》 EI CSCD 北大核心 2012年第2期364-374,共11页
通常基于鉴别式学习策略训练的贝叶斯网络分类器有较高的精度,但在具有冗余边的网络结构之上鉴别式参数学习算法的性能受到一定的限制.为了在实际应用中进一步提高贝叶斯网络分类器的分类精度,该文定量描述了网络结构与真实数据变量分... 通常基于鉴别式学习策略训练的贝叶斯网络分类器有较高的精度,但在具有冗余边的网络结构之上鉴别式参数学习算法的性能受到一定的限制.为了在实际应用中进一步提高贝叶斯网络分类器的分类精度,该文定量描述了网络结构与真实数据变量分布之间的关系,提出了一种不存在冗余边的森林型贝叶斯网络分类器及其相应的FAN学习算法(Forest-Augmented Nave Bayes Algorithm),FAN算法能够利用对数条件似然函数的偏导数来优化网络结构学习.实验结果表明常用的限制性贝叶斯网络分类器通常存在一些冗余边,其往往会降低鉴别式参数学习算法的性能;森林型贝叶斯网络分类器减少了结构中的冗余边,更加适合于采用鉴别式学习策略训练参数;应用条件对数似然函数偏导数的FAN算法在大多数实验数据集合上提高了分类精度. 展开更多
关键词 机器学习 数据挖掘 分类器 贝叶斯网络 鉴别式训练策略
下载PDF
神经网络规则抽取 被引量:19
11
作者 周志华 陈世福 《计算机研究与发展》 EI CSCD 北大核心 2002年第4期398-405,共8页
神经网络是一种黑箱模型,其学习到的知识蕴涵在大量连接权中,不仅影响了用户对利用神经计算技术构建智能系统的信心,还阻碍了神经网络技术在数据挖掘领域的应用.由于对神经网络规则抽取进行研究有助于解决上述问题,因此该领域已成... 神经网络是一种黑箱模型,其学习到的知识蕴涵在大量连接权中,不仅影响了用户对利用神经计算技术构建智能系统的信心,还阻碍了神经网络技术在数据挖掘领域的应用.由于对神经网络规则抽取进行研究有助于解决上述问题,因此该领域已成为机器学习和神经计算界的研究热点.介绍了神经网络规则抽取研究的历史,综述了国际研究现状,对关于这方面研究的不同看法进行了讨论,并指出该领域中一些值得进一步研究的内容. 展开更多
关键词 神经网络 机器学习 规则抽取 知识获取 数据挖掘
下载PDF
KDD研究中的若干问题与方法 被引量:10
12
作者 欧阳为民 郑诚 《安徽大学学报(自然科学版)》 CAS 1999年第1期41-52,共12页
在数据库中发现知识,又称为数据发掘,其目标是从大型数据集中发现先前未知的潜在有用的模式或知识。本文对该领域进行简要综述,并主要从数据库角度讨论若干数据发掘问题与方法。
关键词 知识发现 数据发掘 机器学习 数据库 KDD
下载PDF
四种贝叶斯分类器及其比较 被引量:8
13
作者 邓甦 付长贺 《沈阳师范大学学报(自然科学版)》 CAS 2008年第1期31-33,共3页
首先介绍了贝叶斯网络及贝叶斯网络分类器,并对四种典型贝叶斯分类器的特点进行了介绍与分析.在总结各种贝叶斯分类器特点的基础上,通过选取的UCI数据库中的10个数据集对其分类效果进行了实验比较,并根据实验结果讨论各自的特点,从而得... 首先介绍了贝叶斯网络及贝叶斯网络分类器,并对四种典型贝叶斯分类器的特点进行了介绍与分析.在总结各种贝叶斯分类器特点的基础上,通过选取的UCI数据库中的10个数据集对其分类效果进行了实验比较,并根据实验结果讨论各自的特点,从而得出针对具有不同特点数据集选取适当分类器的方法. 展开更多
关键词 贝叶斯网络 分类器 数据挖掘 机器学习
下载PDF
贝叶斯网络分类器结构与变量分布的差异性分析 被引量:1
14
作者 王中锋 王志海 付彬 《北京交通大学学报》 CAS CSCD 北大核心 2011年第2期32-35,47,共5页
为了提高鉴别式学习策略训练的贝叶斯网络分类器的分类精度,分析了贝叶斯网络结构与数据中变量分布之间的差异对贝叶斯网络分类器性能的影响,实验以网络结构的实际联合概率分布的树型近似描述为基准,删除在条件对数似然函数极大化过程... 为了提高鉴别式学习策略训练的贝叶斯网络分类器的分类精度,分析了贝叶斯网络结构与数据中变量分布之间的差异对贝叶斯网络分类器性能的影响,实验以网络结构的实际联合概率分布的树型近似描述为基准,删除在条件对数似然函数极大化过程中不起作用的边,生成具有同一联合概率分布的不同描述程度的网络结构.实验结果表明,只有当网络结构表现力不足时,鉴别式参数学习才能起积极作用;而当网络结构中有多余的边时,反而容易受其制约.从而验证了网络中多余的边对分类器性能没有影响的观点是片面的. 展开更多
关键词 数据挖掘 机器学习 贝叶斯网络 分类器 结构学习 参数学习 鉴别式学习
下载PDF
数据挖掘技术在网络课程资源配置中的研究 被引量:1
15
作者 甘振韬 梅文 郭玉军 《中国医学教育技术》 2012年第6期635-638,共4页
以第三军医大学网络教学应用系统为背景,通过对基于决策树算法的数据挖掘技术在医学网络课程建设中不同类型的资源配置进行分析,介绍了对其影响的关键因素。
关键词 数据挖掘 网络教学 知识发现 决策树
下载PDF
数据发掘论题研究 被引量:3
16
作者 刘发升 黎志明 杨炳儒 《赣南师范学院学报》 1999年第3期67-72,共6页
数据库中知识发现(KDD)是一个从数据中识别有效、新颖、潜在有用及完全可理解模式的非平凡过程。数据发掘(DataMining)是KDD的核心构件。本文从一个新的角度来论述KDD研究及应用的各个方面。
关键词 数据发掘 数据库 知识发现 机器学习
下载PDF
贝叶斯网络中的贝叶斯学习 被引量:2
17
作者 胡振宇 林士敏 《广西科学院学报》 2000年第4期145-150,共6页
从机器学习的角度研究贝叶斯方法及其学习机制 ,着重讨论了具有完整数据、不完整数据集 ,及在结构不确定时贝叶斯网络进行学习的方法 ,表明贝叶斯网络在数据采掘中是一个有力的工具。文后给出一个基于贝叶斯网络的学习的实例。
关键词 贝叶斯网络 贝叶斯学习 机器学习 数据采掘
全文增补中
决策树分类器在分析基因微阵列数据中的应用 被引量:1
18
作者 项婧 任劼 《计算机工程与设计》 CSCD 北大核心 2006年第15期2905-2908,共4页
近年来,需要深入研究癌症细胞的基因表达技术正在不断增多。机器学习算法已经被广泛用于当今世界的许多领域,但是却很少应用于生物信息领域。系统研究了决策树的生成、修剪的原理和算法以及其它与决策树相关的问题;并且根据CAMDA2000(cr... 近年来,需要深入研究癌症细胞的基因表达技术正在不断增多。机器学习算法已经被广泛用于当今世界的许多领域,但是却很少应用于生物信息领域。系统研究了决策树的生成、修剪的原理和算法以及其它与决策树相关的问题;并且根据CAMDA2000(criticalassessmentofmicroarraydataanalysis)提供的急性淋巴白血病(ALL)和急性骨髓白血病(AML)数据集,设计并实现了一个基于ID3算法的决策树分类器,并利用后剪枝算法简化决策树。最后通过实验验证算法的有效性,实验结果表明利用该决策树分类器对白血病微阵列实验数据进行判别分析,分类准确率很高,证明了决策树算法在医学数据挖掘领域有着广泛的应用前景。 展开更多
关键词 机器学习 决策树 剪枝算法 微阵列数据分析 数据挖掘 知识发现
下载PDF
数据开采及其在超市中的应用 被引量:1
19
作者 田容 陈立潮 张晋 《华北工学院学报》 2001年第2期138-141,共4页
目的 介绍数据开采技术及其在超市中的应用 .方法 通过介绍数据开采技术的起源、发展和现状 ,提出了一种基于超市管理的决策系统模型 ,并对其超市的各方面的应用作了探讨性研究 .结果 将数据开采技术应用于商业领域 ,产生的价值将是... 目的 介绍数据开采技术及其在超市中的应用 .方法 通过介绍数据开采技术的起源、发展和现状 ,提出了一种基于超市管理的决策系统模型 ,并对其超市的各方面的应用作了探讨性研究 .结果 将数据开采技术应用于商业领域 ,产生的价值将是十分可观的 .结论 数据开采技术作为一种新型技术 。 展开更多
关键词 数据开采 知识发现 机器学习 智能决策 超级市场
下载PDF
KDD:数据库中的知识发现 被引量:25
20
作者 朱廷劭 高文 《计算机科学》 CSCD 北大核心 1997年第6期5-9,共5页
一引言 随着数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据急剧增大。但目前数据库系统所能做到的只是对数据库中已有的数据进行存取。
关键词 数据库 知识发现 KDD 机器学习
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部