期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
Discrete rough set analysis of two different soil-behavior-induced landslides in National Shei-Pa Park,Taiwan 被引量:4
1
作者 Shih-Hsun Chang Shiuan Wan 《Geoscience Frontiers》 SCIE CAS CSCD 2015年第6期807-816,共10页
The governing factors that influence landslide occurrences are complicated by the different soil conditions at various sites.To resolve the problem,this study focused on spatial information technology to collect data ... The governing factors that influence landslide occurrences are complicated by the different soil conditions at various sites.To resolve the problem,this study focused on spatial information technology to collect data and information on geology.GIS,remote sensing and digital elevation model(DEM) were used in combination to extract the attribute values of the surface material in the vast study area of SheiPa National Park,Taiwan.The factors influencing landslides were collected and quantification values computed.The major soil component of loam and gravel in the Shei-Pa area resulted in different landslide problems.The major factors were successfully extracted from the influencing factors.Finally,the discrete rough set(DRS) classifier was used as a tool to find the threshold of each attribute contributing to landslide occurrence,based upon the knowledge database.This rule-based knowledge database provides an effective and urgent system to manage landslides.NDVI(Normalized Difference Vegetation Index),VI(Vegetation Index),elevation,and distance from the road are the four major influencing factors for landslide occurrence.The landslide hazard potential diagrams(landslide susceptibility maps) were drawn and a rational accuracy rate of landslide was calculated.This study thus offers a systematic solution to the investigation of landslide disasters. 展开更多
关键词 landslide data mining discrete rough sets taiwan
下载PDF
基于Rough Set的数据预处理 被引量:4
2
作者 施伟 战守义 盛思源 《计算机工程与应用》 CSCD 北大核心 2003年第22期190-191,201,共3页
RoughSet理论是一种新的处理不精确,不完全与不相容知识的数学工具。数据预处理是数据挖掘中必不可少的步骤,处理的结果对下一步数据挖掘有直接影响。论文利用RoughSet一些特性对KDD99中的数据集进行处理,并且针对数据集的特点实现了对... RoughSet理论是一种新的处理不精确,不完全与不相容知识的数学工具。数据预处理是数据挖掘中必不可少的步骤,处理的结果对下一步数据挖掘有直接影响。论文利用RoughSet一些特性对KDD99中的数据集进行处理,并且针对数据集的特点实现了对其进行数据离散化、属性约简等处理。通过这些处理过程为下一步的数据挖掘打下了基础。 展开更多
关键词 rough SET 数据挖掘 离散化 属性约简 决策表
下载PDF
一种基于粗糙集理论的连续属性离散化方法 被引量:18
3
作者 陶志 许宝栋 +1 位作者 汪定伟 李冉 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第8期747-750,共4页
基于粗糙集的有关理论,提出了一种新的连续属性离散化方法·首先说明决策属性支持度的概念,再利用决策属性支持度作为反馈信息,提出一种领域独立的基于决策属性支持度的连续属性离散化算法·该算法能在保证决策表原始分类能力... 基于粗糙集的有关理论,提出了一种新的连续属性离散化方法·首先说明决策属性支持度的概念,再利用决策属性支持度作为反馈信息,提出一种领域独立的基于决策属性支持度的连续属性离散化算法·该算法能在保证决策表原始分类能力不变的前提下,提高约简效率·同时,各个属性拥有较少的分割区间,会使规则集合更加简洁·通过实例分析比较,说明该算法是非常有效的· 展开更多
关键词 粗糙集理论 决策表 决策属性支持度 离散化 数据挖掘
下载PDF
基于粗糙集理论滑坡影响因子评价研究——以三峡库区青干河流域为例 被引量:13
4
作者 刘吉平 刘汉青 +1 位作者 曾忠平 汪华斌 《水文地质工程地质》 CAS CSCD 北大核心 2010年第5期118-122,132,共6页
运用地理信息系统和遥感技术,从LandsatTM遥感图像获取了一系列滑坡及其影响因子数据。结合粗糙集理论,对三峡库区秭归县青干河流域滑坡发生的影响因子进行了分析,提取了一组基本的滑坡影响条件属性因子,并导出了基于该因子集合的判断... 运用地理信息系统和遥感技术,从LandsatTM遥感图像获取了一系列滑坡及其影响因子数据。结合粗糙集理论,对三峡库区秭归县青干河流域滑坡发生的影响因子进行了分析,提取了一组基本的滑坡影响条件属性因子,并导出了基于该因子集合的判断滑坡与非滑坡的规则集。研究结果表明,所选择的坡度、高程、斜坡类型、植被指数和岩石地层单元等5个条件属性因子对滑坡是重要的影响因素(核);由粗糙集生成的对预测滑坡相对较有价值的11条决策规则中,3条主要决策规则可作为滑坡影响因子的评价规则。 展开更多
关键词 滑坡 数据挖掘 粗糙集理论 空间信息
下载PDF
粗糙集方法及其在化学模式分类规则挖掘中的应用 被引量:6
5
作者 束志恒 陈德钊 陈亚秋 《分析化学》 SCIE EI CAS CSCD 北大核心 2004年第7期879-883,共5页
简要介绍了粗糙集的基本概念 ,决策系统的约简步骤和分类规则的挖掘原理 ,提出了基于信息熵的数据离散化方法 ,使之充分结合粗糙集特性 ,具有良好的推广性。又以经典的橄榄油产地判别为例 ,采用粗糙集方法 ,无需先验知识 ,不用设定参数 ... 简要介绍了粗糙集的基本概念 ,决策系统的约简步骤和分类规则的挖掘原理 ,提出了基于信息熵的数据离散化方法 ,使之充分结合粗糙集特性 ,具有良好的推广性。又以经典的橄榄油产地判别为例 ,采用粗糙集方法 ,无需先验知识 ,不用设定参数 ,即能消除冗余的属性和属性值 ,约简化学系统 ,从样本数据中挖掘出简明直接、易于理解的产生式分类规则 ,构建专业意义明确的化学模式分类模型 ,其预报性能良好 ,效果令人满意。 展开更多
关键词 粗糙集 信息熵 数据离散化 数据挖掘 分类规则 化学模式
下载PDF
一种新的基于粗糙集理论的决策表离散化算法 被引量:14
6
作者 张建军 张静波 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2004年第3期469-472,共4页
主要研究了粗糙集理论在决策表离散化中的应用,提出了一种新的基于粗糙集理论的决策表离散化算法.该算法是一种基于决策表属性重要性的算法,首先使用条件属性与决策属性的互信息来度量条件属性的重要性,并据此对条件属性按照重要性由小... 主要研究了粗糙集理论在决策表离散化中的应用,提出了一种新的基于粗糙集理论的决策表离散化算法.该算法是一种基于决策表属性重要性的算法,首先使用条件属性与决策属性的互信息来度量条件属性的重要性,并据此对条件属性按照重要性由小到大排序,然后按排序后的顺序,考察每个条件属性的所有断点,将冗余的断点去掉,从而将条件属性离散化. 展开更多
关键词 粗糙集 决策表离散化 数据挖掘
下载PDF
粗糙集中一种连续属性预处理方法 被引量:3
7
作者 鄂旭 高学东 +1 位作者 谢霖铨 贺海钧 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2005年第3期400-403,共4页
针对在数据挖掘中,连续属性常常需要预处理问题,应用粗糙集理论对连续属性的不完备问题、离散问题进行了研究,提出了一种连续属性预处理方法。基于条件属性与决策属性间的对应关系完成了不完备数据的填补。依据划分区间的概念、连续属... 针对在数据挖掘中,连续属性常常需要预处理问题,应用粗糙集理论对连续属性的不完备问题、离散问题进行了研究,提出了一种连续属性预处理方法。基于条件属性与决策属性间的对应关系完成了不完备数据的填补。依据划分区间的概念、连续属性离散化含义及其本质特征,定义了划分区间的加法运算法则,以此对填补后的信息表进行了划分区间运算,并以分类质量作为离散过程迭代约束条件,实现了信息表中连续属性的离散化。通过C++编写的算法进行数值示例及测试数据库,实验结果表明此算法有效可行。 展开更多
关键词 数据挖掘 粗糙集 预处理 划分区间 离散化
下载PDF
一种连续属性离散化的新方法 被引量:5
8
作者 凌方 王建东 《数据采集与处理》 CSCD 2002年第2期179-182,共4页
提出了一种基于聚类方法、结合粗集理论的连续属性离散化方法。在粗集理论中有一个重要概念 :属性重要度 (Attribute significance) ,它常用来作为生成好的约简所采用的启发式评价函数。受此启发 ,在连续属性离散化方法中可把它用于属... 提出了一种基于聚类方法、结合粗集理论的连续属性离散化方法。在粗集理论中有一个重要概念 :属性重要度 (Attribute significance) ,它常用来作为生成好的约简所采用的启发式评价函数。受此启发 ,在连续属性离散化方法中可把它用于属性选择 ,即从已离散化的属性集中选择出属性重要度最高的属性 ,再把它和待离散化的连续属性一起进行聚类学习 ,得到该连续属性的离散区间。文中介绍了该方法的算法描述 ,并通过实验与其他算法进行了比较。实验结果表明 ,由于这种方法在离散化过程中结合了粗集理论的思想 ,考虑了属性间的相互影响 ,从而产生了比较合理的划分点 ,提高了规则的分类精度。 展开更多
关键词 连续属性离散化 数据挖掘 粗集 聚类学习 数据库
下载PDF
粗集在数据开采中的应用 被引量:6
9
作者 赵卫东 李旗号 《系统工程学报》 CSCD 2002年第4期349-357,共9页
从数据库或数据仓库开采有用的知识 ,是辅助决策的有效手段 .粗集作为一种新的软计算方法 ,是处理不确定、不完全数据的有效方法 .它可以克服其他软计算方法的不足 ,并且和它们具有较强的亲和力 .所以粗集理论得到了广泛的应用 ,尤其是... 从数据库或数据仓库开采有用的知识 ,是辅助决策的有效手段 .粗集作为一种新的软计算方法 ,是处理不确定、不完全数据的有效方法 .它可以克服其他软计算方法的不足 ,并且和它们具有较强的亲和力 .所以粗集理论得到了广泛的应用 ,尤其是在数据开采领域已成为研究的热点 .论文就粗集在数据开采中的几个重要问题进行论述 ,包括决策表的约简、不完全决策表的处理、连续值的离散化、基于粗集数据开采的递增算法以及粗集与其他软计算方法的集成等几个前沿问题 ,同时指出了问题之所在 。 展开更多
关键词 粗集 数据开采 数据库 数据仓库 软计算 约简 离散化 不完全信息
下载PDF
一种基于粗糙集理论的专家系统结构 被引量:2
10
作者 彭佳文 曾炼成 彭剑 《湖南农业大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第4期498-500,共3页
基于S.H.Nguyen提出的布尔逻辑和粗糙集理论相结合的离散化算法,在一种改进的启发式离散化算法基础上,提出了一种基于粗糙集数据挖掘的系统结构;给出了一种基于粗糙集的专家系统结构.该结构可应用于诸多领域,具有较强的实用性和一定的... 基于S.H.Nguyen提出的布尔逻辑和粗糙集理论相结合的离散化算法,在一种改进的启发式离散化算法基础上,提出了一种基于粗糙集数据挖掘的系统结构;给出了一种基于粗糙集的专家系统结构.该结构可应用于诸多领域,具有较强的实用性和一定的通用性. 展开更多
关键词 粗糙集 离散化 数据挖掘 专家系统
下载PDF
一种连续属性值域划分的离散化新方法 被引量:3
11
作者 陈爱萍 张光会 《计算机应用研究》 CSCD 北大核心 2012年第4期1307-1310,共4页
提出一种连续属性值域划分的离散化新方法,该方法定义一个新的离散化函数,依据类与属性之间的相互依赖关系选择最优的离散区间列表;此外,采用变精度粗糙集理论合理地控制数据离散化产生的信息丢失,减少分类错误。仿真结果和统计分析表明... 提出一种连续属性值域划分的离散化新方法,该方法定义一个新的离散化函数,依据类与属性之间的相互依赖关系选择最优的离散区间列表;此外,采用变精度粗糙集理论合理地控制数据离散化产生的信息丢失,减少分类错误。仿真结果和统计分析表明,提出的方法有较好的C5.0决策树分类能力。 展开更多
关键词 离散化 数据挖掘 相互依赖 变精度粗糙集 决策树
下载PDF
基于信息熵的粗糙集属性应急数据去重挖掘算法研究 被引量:4
12
作者 曾维佳 秦放 +1 位作者 李琳 徐鹏 《计算技术与自动化》 2021年第4期64-68,共5页
粗糙集属性应急数据存在冗余特征,降低挖掘效率,提出基于信息熵的粗糙集属性应急数据去重挖掘算法。将粗糙集理论和信息熵相结合,离散化处理应急数据,离散化完成后,约简对于决策表的条件信息熵大小不产生任何影响的属性,设定决策属性集... 粗糙集属性应急数据存在冗余特征,降低挖掘效率,提出基于信息熵的粗糙集属性应急数据去重挖掘算法。将粗糙集理论和信息熵相结合,离散化处理应急数据,离散化完成后,约简对于决策表的条件信息熵大小不产生任何影响的属性,设定决策属性集合和条件属性集合,选取将同约简属性集合B的属性组合数目最小的熵值实现约简,去除冗余特征,完成应急数据去重挖掘。以大型船舶应急数据为研究对象展开数据去重挖掘,结果表明:可有效去重挖掘到船舶旋回性相关应急数据,利用数据增比特征能够分析到各因素对船舶旋回性的影响,并且所研究算法的挖掘效率较高,在数据量为1400条时,耗时仅为0.33 s。 展开更多
关键词 信息熵 粗糙集属性 应急数据 去重挖掘 离散化 约减
下载PDF
基于统计相关系数的数据离散化方法 被引量:5
13
作者 解亚萍 《计算机应用》 CSCD 北大核心 2011年第5期1409-1412,共4页
很多数据挖掘方法只能处理离散值的属性,因此,连续属性必须进行离散化。提出一种统计相关系数的数据离散化方法,基于统计相关理论有效地捕获了类属性间的相互依赖,选取最佳断点。此外,将变精度粗糙集(VPRS)模型纳入离散化中,有效地控制... 很多数据挖掘方法只能处理离散值的属性,因此,连续属性必须进行离散化。提出一种统计相关系数的数据离散化方法,基于统计相关理论有效地捕获了类属性间的相互依赖,选取最佳断点。此外,将变精度粗糙集(VPRS)模型纳入离散化中,有效地控制数据的信息丢失。将所提方法在乳腺癌症诊断以及其他领域数据上进行了应用,实验结果表明,该方法显著地提高了See5决策树的分类学习精度。 展开更多
关键词 离散化 数据挖掘 类属性相互依赖 变精度粗糙集 决策树
下载PDF
一种病理诊断知识获取的RS混合算法 被引量:2
14
作者 邱银安 林小红 《科技通报》 2005年第3期314-320,359,共8页
针对医学诊断知识获取问题,提出了基于Rough Sets理论的知识获取方法,利用该理论对数据进行分析,推理出可能规则,并提出了一种概率优化规则。通过实例分析,具体说明了该方法的实现步骤,包括连续信息系统的离散化、信息系统的约简、决策... 针对医学诊断知识获取问题,提出了基于Rough Sets理论的知识获取方法,利用该理论对数据进行分析,推理出可能规则,并提出了一种概率优化规则。通过实例分析,具体说明了该方法的实现步骤,包括连续信息系统的离散化、信息系统的约简、决策规则提取、决策模型生成等,讨论了知识处理的完整过程,能够有效地解决专家系统中知识获取的瓶颈问题。为人工智能技术在医学诊断领域的应用提供了新的思路。 展开更多
关键词 软件与算法 数据挖掘 roughSET 医学诊断规则 连续信息系统 离散化 规则获取
下载PDF
统计指标离散化方法及应用 被引量:2
15
作者 陈浩 《微电子学与计算机》 CSCD 北大核心 2011年第11期106-109,共4页
连续数据离散化能够提高数据挖掘算法的分类能力.文中提出一种基于统计指标的连续属性离散化方法,凭借相关系数衡量类与属性间的关联度,获取最优区间列表.引入变精度粗糙集模型,有效地控制数据由离散化导致的信息丢失.该方法在声纳传感... 连续数据离散化能够提高数据挖掘算法的分类能力.文中提出一种基于统计指标的连续属性离散化方法,凭借相关系数衡量类与属性间的关联度,获取最优区间列表.引入变精度粗糙集模型,有效地控制数据由离散化导致的信息丢失.该方法在声纳传感器数据识别以及其它领域上进行了应用.实验结果表明,该方法在J48决策树上有很好的分类能力. 展开更多
关键词 离散化 数据挖掘 关联度 变精度粗糙集 决策树
下载PDF
一种新的用于连续值属性离散化的约简算法 被引量:4
16
作者 刘震宇 郭宝龙 杨林耀 《控制与决策》 EI CSCD 北大核心 2002年第5期545-549,共5页
针对在 Nguyen和 Skowron的离散化算法中进行启发式约简时会出现某些属性不能进行离散化问题 ,以及在无核数据集中启发式约简算法计算量比较大等问题 ,在粗糙集理论和属性频率函数的基础上给出一个新概念——候选核 ,并提出一种新的用... 针对在 Nguyen和 Skowron的离散化算法中进行启发式约简时会出现某些属性不能进行离散化问题 ,以及在无核数据集中启发式约简算法计算量比较大等问题 ,在粗糙集理论和属性频率函数的基础上给出一个新概念——候选核 ,并提出一种新的用于连续值属性离散化的约简算法——基于候选核的启发式约简算法 (简称 BCC)。该算法可以寻找到能对所有属性进行离散化的约简。实验表明 ,所提出的 BCC算法能提高大数据集的离散化效果。 展开更多
关键词 连续值属性离散化 约简算法 数据挖掘 粗糙集理论 人工智能
下载PDF
一种基于粗糙集理论的连续属性离散化新算法 被引量:7
17
作者 李慧 闫德勤 韩丽 《计算机应用研究》 CSCD 北大核心 2010年第1期77-78,共2页
粗糙集理论中要求离散化保持原有决策系统的不可分辨关系,但以往的一些算法在离散过程中会使近似精度控制在可以接受的范围,即允许一定的错分。针对此不足,在保证决策属性绝对不改变的情况下,提出一种新的区间拆分方法,更合理有效地对... 粗糙集理论中要求离散化保持原有决策系统的不可分辨关系,但以往的一些算法在离散过程中会使近似精度控制在可以接受的范围,即允许一定的错分。针对此不足,在保证决策属性绝对不改变的情况下,提出一种新的区间拆分方法,更合理有效地对连续属性进行离散化。实验通过C4.5和支持向量机分别对离散化后的数据进行识别与分类预测,实验结果证明了算法的有效性。 展开更多
关键词 连续属性离散化 粗糙集 决策表 离散区间 数据挖掘
下载PDF
动态数据下的三支区间离散模型 被引量:1
18
作者 章耀坤 于洪 胡峰 《小型微型计算机系统》 CSCD 北大核心 2021年第8期1662-1667,共6页
在数据挖掘领域中,数据离散化是将一组连续的数值属性转换为离散的标称属性值,并广泛在音频或视频等连续时间信号的预处理中得到应用.据文献考证,离散区间中的不确定性的空白区间被现有研究所忽略.此外,动态的增量数据将使离散区间更加... 在数据挖掘领域中,数据离散化是将一组连续的数值属性转换为离散的标称属性值,并广泛在音频或视频等连续时间信号的预处理中得到应用.据文献考证,离散区间中的不确定性的空白区间被现有研究所忽略.此外,动态的增量数据将使离散区间更加复杂.针对增量数据下离散问题,本文提出了一种基于三支决策的自适应动态区间离散化方法.本文提出的三支离散化方法可以使离散区间的范围随数据的变化而自适应地变化,并提高了对新增量数据进行离散化的效果.利用本文定义的空白区间的概念,可有效提高新数据和原始数据之间融合的效果.实验结果表明,本文的方法对于处理增量式数据离散化问题具有较好的效果,且运行速度更快. 展开更多
关键词 离散化 增量数据 三支决策 数据挖掘 粗糙集
下载PDF
粗糙集方法及其在化工生产过程中的应用 被引量:2
19
作者 朱振宇 张泉灵 苏宏业 《工业控制计算机》 2006年第8期56-57,60,共3页
随着知识发现和数据挖掘的迅速发展,化工生产过程中,数据挖掘的应用日趋广泛。介绍了粗糙集的基本概念,决策系统的约简方法和分类规则的抽取,提出了基于信息熵的连续属性离散方法。并以三唑磷化合成工生产过程中的实际样本数据为例,采... 随着知识发现和数据挖掘的迅速发展,化工生产过程中,数据挖掘的应用日趋广泛。介绍了粗糙集的基本概念,决策系统的约简方法和分类规则的抽取,提出了基于信息熵的连续属性离散方法。并以三唑磷化合成工生产过程中的实际样本数据为例,采取粗糙集方法,从样本数据中挖掘出简明直接,易于理解的分类规则,实验结果表明,算法有效,结果令人满意。 展开更多
关键词 粗糙集 离散化 信息熵 数据挖掘 分类
下载PDF
知识发现中的数据离散化处理 被引量:2
20
作者 范娟 王红艳 《保定师范专科学校学报》 2006年第2期40-41,共2页
主要讨论了基于粗集的数据挖掘的连续数据离散化处理过程.
关键词 数据挖掘 粗糙集 数据离散化处理
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部