期刊文献+
共找到73篇文章
< 1 2 4 >
每页显示 20 50 100
粗糙集连续属性离散化模型研究与应用要点分析 被引量:15
1
作者 赵荣泳 张浩 +2 位作者 李翠玲 樊留群 王骏 《计算机工程与应用》 CSCD 北大核心 2005年第8期40-42,91,共4页
基于粗糙集理论,研究连续属性离散化问题的本质特点,提出粗糙集指标衡量和优化算法结构相统一的离散化思想,设计通用的离散化方法模型。分析主流的SOM网络、GA、层次聚类、信息熵等主流聚类方法的特点,并基于这种结构模型,给出了相应离... 基于粗糙集理论,研究连续属性离散化问题的本质特点,提出粗糙集指标衡量和优化算法结构相统一的离散化思想,设计通用的离散化方法模型。分析主流的SOM网络、GA、层次聚类、信息熵等主流聚类方法的特点,并基于这种结构模型,给出了相应离散化方法的应用要点。 展开更多
关键词 粗糙集 属性离散 聚类 模型 SOM
下载PDF
基于属性离散和特征度量的决策树构建算法 被引量:10
2
作者 王磊 刘雨 +1 位作者 刘志中 齐俊艳 《河南理工大学学报(自然科学版)》 CAS 北大核心 2021年第3期127-133,共7页
针对基于信息熵的决策树算法中存在多值属性偏向、连续属性处理不佳和时间复杂度较高等问题,提出一种基于离散比概念的决策树特征度量方法。首先采用K-means聚类算法对连续性数值属性进行离散化处理,其次利用属性在各个分类中的权重以... 针对基于信息熵的决策树算法中存在多值属性偏向、连续属性处理不佳和时间复杂度较高等问题,提出一种基于离散比概念的决策树特征度量方法。首先采用K-means聚类算法对连续性数值属性进行离散化处理,其次利用属性在各个分类中的权重以及在整个条件属性中的权重比值,计算出该属性的离散比,避免了计算熵过程中复杂的对数运算,最后根据离散比的大小确定各个特征属性之间的拓扑结构,完成树的构建。结果表明,相较于K_C4.5和Id3_improved两种改进的决策树算法,基于离散比属性分割的算法能更有效地解决多值属性偏向,降低算法的时间复杂度,并且在实际产生的连续性数据集的分类应用上有进一步的突破。 展开更多
关键词 决策树 属性离散 离散 K-MEANS
下载PDF
基于微粒群优化的连续属性离散化算法 被引量:9
3
作者 张腾飞 王锡淮 肖健梅 《计算机工程》 EI CAS CSCD 北大核心 2006年第3期44-46,共3页
连续属性的离散化是粗糙集理论的主要问题之一,也是影响粗糙集理论实用性的瓶颈之一。由于没有最佳离散化形式的统一标准,大多离散化算法采用的启发式带有较强的主观性,也难以得到较满意的离散效果。该文提出了基于微粒群优化的连续属... 连续属性的离散化是粗糙集理论的主要问题之一,也是影响粗糙集理论实用性的瓶颈之一。由于没有最佳离散化形式的统一标准,大多离散化算法采用的启发式带有较强的主观性,也难以得到较满意的离散效果。该文提出了基于微粒群优化的连续属性离散化方法,将各属性的离散化划分点初始化为一群粒子,在保证决策表分类能力不变的情况下,通过粒子间的相互作用寻求理想的离散化划分点,使得决策表引入较少的冲突。实验结果验证了该方法的有效性。 展开更多
关键词 微粒群优化 粗糙集 属性离散
下载PDF
一种基于进化算法的连续属性离散化方法 被引量:7
4
作者 姚望舒 商琳 陈兆乾 《计算机应用与软件》 CSCD 北大核心 2005年第3期37-39,85,共4页
连续属性离散化是知识系统中的一个重要环节 ,一个好的离散化方法能够起到简化知识的描述和便于对知识系统的处理。而求取连续属性值的最优断点集合是一个NP难题 ,本文把连续属性值离散化问题作为一种约束优化问题 ,采用遗传算法来获得... 连续属性离散化是知识系统中的一个重要环节 ,一个好的离散化方法能够起到简化知识的描述和便于对知识系统的处理。而求取连续属性值的最优断点集合是一个NP难题 ,本文把连续属性值离散化问题作为一种约束优化问题 ,采用遗传算法来获得最优解 ,并针对离散化问题设计了相应的编码方式、交叉算子和变异算子。实验结果表明 。 展开更多
关键词 数据库 数据挖掘 知识发现 进化算法 连续属性离散化方法
下载PDF
基于决策的剥离式连续属性离散化算法 被引量:5
5
作者 潘巍 李晋川 +1 位作者 王阳生 杨宏戟 《计算机科学》 CSCD 北大核心 2007年第8期208-210,共3页
针对粗糙集理论只能处理离散数据的局限,提出了基于决策的剥离式连续属性离散化方法,一改传统的候选断点集合的获取方法,直接通过分析连续属性在各决策类的取值范围和计算属性重要度,完成对连续属性的初步离散。此外,本文提出候选断点... 针对粗糙集理论只能处理离散数据的局限,提出了基于决策的剥离式连续属性离散化方法,一改传统的候选断点集合的获取方法,直接通过分析连续属性在各决策类的取值范围和计算属性重要度,完成对连续属性的初步离散。此外,本文提出候选断点集的推移原则,可逐步减小候选断点集的范围。由于每次都是针对尚不能明确分类的样本进行细化,因此随着候选断点集的减少和明确分类样本的增加,系统能够迅速收敛,并且离散化后的决策表总是相容的,这与目前很多离散方法不考虑决策相容性相比,能够最大限度地保留系统的有用信息。本文提出的离散化方法是领域独立的,不需要领域知识,可应用于不同领域的连续属性的离散化。 展开更多
关键词 粗糙集理论 属性离散 候选断点 决策相容性
下载PDF
粗糙集理论中一种属性离散化算法 被引量:14
6
作者 安利平 仝凌云 《河北工业大学学报》 CAS 2002年第3期39-43,共5页
针对定量属性离散化制约粗糙集理论应用这一关键问题,利用分级聚类法和粗糙集理论中依赖度的概念,提出了一种对决策系统中条件属性进行离散化的增类减类算法,实现了决策系统的属性约简.该算法易于理解,计算简单,以实例说明了算法的合理... 针对定量属性离散化制约粗糙集理论应用这一关键问题,利用分级聚类法和粗糙集理论中依赖度的概念,提出了一种对决策系统中条件属性进行离散化的增类减类算法,实现了决策系统的属性约简.该算法易于理解,计算简单,以实例说明了算法的合理性和有效性. 展开更多
关键词 粗糙集 知识表示系统 属性离散 属性选择
下载PDF
基于改进离散粒子群优化的连续属性离散化 被引量:8
7
作者 张荣光 胡晓辉 宗永胜 《计算机工程与应用》 CSCD 北大核心 2017年第18期108-114,235,共8页
为了解决数据挖掘和机器学习领域中连续属性离散化问题,提出一种改进的自适应离散粒子群优化算法。将连续属性的断点集合作为离散粒子群,通过粒子间的相互作用最小化断点子集,同时引入模拟退火算法作为局部搜索策略,提高了粒子群的多样... 为了解决数据挖掘和机器学习领域中连续属性离散化问题,提出一种改进的自适应离散粒子群优化算法。将连续属性的断点集合作为离散粒子群,通过粒子间的相互作用最小化断点子集,同时引入模拟退火算法作为局部搜索策略,提高了粒子群的多样性和寻找全局最优解的能力。利用粗糙集理论中决策属性对条件属性的依赖度来衡量决策表的一致性,从而达到连续属性离散化的目的,最后采用多组数据对此算法的性能进行了检验,并与其他算法做了对比实验,实验结果表明此算法是有效的。 展开更多
关键词 离散粒子群 模拟退火 粗糙集 连续属性离散
下载PDF
基于改进粒子群优化的粗糙集连续属性离散化 被引量:8
8
作者 汪凌 胡培 《计算机工程与应用》 CSCD 北大核心 2010年第15期115-117,158,共4页
提出一种基于改进粒子群优化的连续属性离散化算法。在算法优化方面,采用改进粒子群优化算法。为了克服传统粒子群优化的不足,对种群初始化和自适应调整粒子的惯性权重,提高了粒子群优化算法的全局寻优能力。在粗糙集属性离散化方面,主... 提出一种基于改进粒子群优化的连续属性离散化算法。在算法优化方面,采用改进粒子群优化算法。为了克服传统粒子群优化的不足,对种群初始化和自适应调整粒子的惯性权重,提高了粒子群优化算法的全局寻优能力。在粗糙集属性离散化方面,主要是通过将最小断点集作为优化目标,粗糙集属性依赖度作为约束条件。仿真结果表明,该方法能有效地解决决策表连续属性离散化问题,计算速度快,收敛性好。 展开更多
关键词 改进粒子群优化 粗糙集 连续属性离散
下载PDF
一种连续属性离散化的新方法 被引量:5
9
作者 凌方 王建东 《数据采集与处理》 CSCD 2002年第2期179-182,共4页
提出了一种基于聚类方法、结合粗集理论的连续属性离散化方法。在粗集理论中有一个重要概念 :属性重要度 (Attribute significance) ,它常用来作为生成好的约简所采用的启发式评价函数。受此启发 ,在连续属性离散化方法中可把它用于属... 提出了一种基于聚类方法、结合粗集理论的连续属性离散化方法。在粗集理论中有一个重要概念 :属性重要度 (Attribute significance) ,它常用来作为生成好的约简所采用的启发式评价函数。受此启发 ,在连续属性离散化方法中可把它用于属性选择 ,即从已离散化的属性集中选择出属性重要度最高的属性 ,再把它和待离散化的连续属性一起进行聚类学习 ,得到该连续属性的离散区间。文中介绍了该方法的算法描述 ,并通过实验与其他算法进行了比较。实验结果表明 ,由于这种方法在离散化过程中结合了粗集理论的思想 ,考虑了属性间的相互影响 ,从而产生了比较合理的划分点 ,提高了规则的分类精度。 展开更多
关键词 连续属性离散 数据挖掘 粗集 聚类学习 数据库
下载PDF
连续属性离散化的Imp-Chi2算法 被引量:2
10
作者 桑雨 闫德勤 +1 位作者 刘磊 梁宏霞 《计算机工程》 CAS CSCD 北大核心 2008年第17期39-41,共3页
连续属性离散化是机器学习和数据挖掘领域中的一个重要问题,离散化是否合理决定着表达和提取相关信息的准确性。经过研究Chi2系列算法,提出一种新的基于属性重要性的连续属性离散化方法——Imp-Chi2算法,该算法依据属性重要性程度对属... 连续属性离散化是机器学习和数据挖掘领域中的一个重要问题,离散化是否合理决定着表达和提取相关信息的准确性。经过研究Chi2系列算法,提出一种新的基于属性重要性的连续属性离散化方法——Imp-Chi2算法,该算法依据属性重要性程度对属性离散化的顺序进行了合理的调整,能够更准确地对连续属性进行离散化。文章通过C4.5和支持向量机分别对离散化后的结果进行了实验,在实验过程中,提出一种训练集类比例抽取方法,避免了训练集随机抽取的不均匀性。实验结果证明了所提算法的有效性。 展开更多
关键词 连续属性离散 CHI2算法 属性重要性 训练集类比例抽取
下载PDF
粗糙集连续属性离散化的MDV方法 被引量:1
11
作者 赵荣泳 张浩 +2 位作者 李翠玲 樊留群 王骏 《计算机工程》 CAS CSCD 北大核心 2006年第3期52-54,共3页
分析粗糙集连续属性离散化问题的本质特点,提出满足粗糙集约简指标和优化算法相结合的离散化思想。引入启发式搜索策略,解决属性离散的NP-Hard问题,建立连续属性SOM自组织网络聚类的MDV(Maximum Discernibility Value)搜索方法,并给出... 分析粗糙集连续属性离散化问题的本质特点,提出满足粗糙集约简指标和优化算法相结合的离散化思想。引入启发式搜索策略,解决属性离散的NP-Hard问题,建立连续属性SOM自组织网络聚类的MDV(Maximum Discernibility Value)搜索方法,并给出属性约简的冗余度定义和计算方法。根据实际计算要求,对冗余度的定义进行改进。最后,通过UCI数据库实例验证了MDV方法的有效性。 展开更多
关键词 粗糙集 属性离散 聚类 SOM
下载PDF
基于语言场理论的连续属性离散化方法及实现 被引量:3
12
作者 周颖 杨炳儒 《计算机科学》 CSCD 北大核心 2003年第5期63-66,共4页
The paper introduces author's job on realization of continuous attribute discretization based on languagefield theory that Prof. Yang put forward. It applies a new algorithm of seeking border values and its increm... The paper introduces author's job on realization of continuous attribute discretization based on languagefield theory that Prof. Yang put forward. It applies a new algorithm of seeking border values and its incremental onerather than seeking boundary ones that is a difficulty. The theory of the algorithm is self-contained, and its realiza-tion is simple. And the paper introduces simply four thoughts about defining language values and then discretizing fornon-numerical value that author already realized in KDD * . 展开更多
关键词 知识表示 知识发现 机器学习 语言场理论 连续属性离散化方法
下载PDF
连续属性离散化算法SHD及其改进 被引量:3
13
作者 刘玲 肖嵘 《计算机工程与应用》 CSCD 北大核心 2001年第9期97-99,116,共4页
为了让规则抽取算法能更好地适用于连续属性领域的问题,文章提出了一种有导师的连续属性离散化算法SHD,并将该算法扩展到多连续属性处理领域。在此基础上,文章对该算法的数据预处理过程进行了探讨,提出了一种基于类间离散度矩阵... 为了让规则抽取算法能更好地适用于连续属性领域的问题,文章提出了一种有导师的连续属性离散化算法SHD,并将该算法扩展到多连续属性处理领域。在此基础上,文章对该算法的数据预处理过程进行了探讨,提出了一种基于类间离散度矩阵分析属性空间重构造算法,并将其应用到属性预处理过程中。算法测试证明,对于连续属性领域的问题,使用SHD属性离散化算法将明显改进后继规则抽取算法的效果。 展开更多
关键词 规则抽取 有导师学习 神经网络 连续属性离散化算法 SHD
下载PDF
连续属性离散化的Integral Chi2算法 被引量:2
14
作者 闫德勤 张丽平 《小型微型计算机系统》 CSCD 北大核心 2008年第4期691-693,共3页
连续属性离散化在机器学习和数据挖掘领域中有着重要的作用.连续属性离散化方法是否合理决定着对信息的表达和提取的准确性.Chi2算法基于统计学理论方法,对连续属性离散化研究产生着重要影响.在对Chi2及相关算法中统计量χ2应用意义讨... 连续属性离散化在机器学习和数据挖掘领域中有着重要的作用.连续属性离散化方法是否合理决定着对信息的表达和提取的准确性.Chi2算法基于统计学理论方法,对连续属性离散化研究产生着重要影响.在对Chi2及相关算法中统计量χ2应用意义讨论的基础上,提出了一种新的(IntegralChi2)算法,该算法基于概率统计理论把统计量χ2与分位点χ2α间对应的积分(概率)作为区间合并的依据,能够更合理更准确地对连续属性进行离散化.实验结果证明了算法的有效性. 展开更多
关键词 连续属性离散 CHI2算法 数据挖掘
下载PDF
一种基于改进粒子群的连续属性离散化算法 被引量:8
15
作者 汪凌 《计算机工程与应用》 CSCD 2013年第21期29-32,共4页
提出一种基于改进粒子群的连续属性离散化算法。该算法结合集群智能优化理论和粗糙集理论,将各属性离散化分割点初始化为粒子群体,通过粒子间的相互作用寻求最优离散化分割点。将提出的离散化算法应用于UCI数据集实验中,实验结果表明,... 提出一种基于改进粒子群的连续属性离散化算法。该算法结合集群智能优化理论和粗糙集理论,将各属性离散化分割点初始化为粒子群体,通过粒子间的相互作用寻求最优离散化分割点。将提出的离散化算法应用于UCI数据集实验中,实验结果表明,该算法能使决策系统的信息损失降低到最小,并可获取更为简洁的决策规则。 展开更多
关键词 改进粒子群 智能优化 粗糙集 连续属性离散
下载PDF
基于信息论的连续属性离散化 被引量:1
16
作者 徐如燕 鲁汉榕 郭齐胜 《计算机工程与设计》 CSCD 2002年第2期62-64,共3页
使用信息论的方法进行连续属性的离散化。引入 Hellinger偏差 HD(Hellinger Divergence)作为每个区间对决策的信息量度量,从而定义切分点的信息熵,最终的离散化结果是使各区间的信息量尽可能平均。... 使用信息论的方法进行连续属性的离散化。引入 Hellinger偏差 HD(Hellinger Divergence)作为每个区间对决策的信息量度量,从而定义切分点的信息熵,最终的离散化结果是使各区间的信息量尽可能平均。分析了HD度量在两种离散化方法中的作用,说明它在划分算法中运用比较理想,而在归并算法中则有局限。 展开更多
关键词 连续属性离散 信息论 知识发现 机器学习
下载PDF
作战仿真数据属性离散化研究 被引量:1
17
作者 罗佳 薛青 唐志武 《计算机仿真》 CSCD 北大核心 2013年第9期26-29,65,共5页
数据属性离散化是作战仿真数据预处理的重要组成部分,也是作战仿真数据研究的重点和难点。论述了进行数据属性离散化的必要性,提出一种基于改进属性重要度和信息熵(Discretization by Improved Attribute Significance and Information ... 数据属性离散化是作战仿真数据预处理的重要组成部分,也是作战仿真数据研究的重点和难点。论述了进行数据属性离散化的必要性,提出一种基于改进属性重要度和信息熵(Discretization by Improved Attribute Significance and Information Entropy,DIAFIE)的作战仿真数据属性离散化算法。算法定义了属性重要度并以此为聚类判断依据将数据值域划分为多个离散区间,然后根据信息熵优化合并相邻区间以保证离散化结果的精度。实验证明上述算法能有效处理作战仿真数据属性离散化问题,具有产生断点少、分类精度高的优点。 展开更多
关键词 作战仿真 属性离散 属性重要度 信息熵
下载PDF
基于信息论的连续属性离散化 被引量:2
18
作者 徐如燕 鲁汉榕 郭齐胜 《空军雷达学院学报》 2001年第2期20-23,共4页
使用信息论的方法进行连续属性的离散化。引入Hellinger偏差HD (Hellinger Di-vergence)作为每个区间对决策的信息量度量,从而定义切分点的信息熵,最终的离散化结果是使各区间的信息量尽可能平均... 使用信息论的方法进行连续属性的离散化。引入Hellinger偏差HD (Hellinger Di-vergence)作为每个区间对决策的信息量度量,从而定义切分点的信息熵,最终的离散化结果是使各区间的信息量尽可能平均。分析了HD度量在两种离散化方法中的作用,说明它在划分算法中运用比较理想,而在归并算法中则有局限。 展开更多
关键词 连续属性离散 算法 归并 度量 信息论 信息熵 切分 离散化方法 平均 区间
下载PDF
文本分类中连续属性离散化方法的研究
19
作者 董乐红 耿国华 周明全 《小型微型计算机系统》 CSCD 北大核心 2009年第11期2222-2225,共4页
针对机器学习领域的一些分类算法不能处理连续属性的问题,提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法.该算法定义了一个离散化过程,离散化了采用传统信息检索的加权技术生成的非二值特征词空间,然后判断原特征空间... 针对机器学习领域的一些分类算法不能处理连续属性的问题,提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法.该算法定义了一个离散化过程,离散化了采用传统信息检索的加权技术生成的非二值特征词空间,然后判断原特征空间中每个特征词属于或不属于某给定子区间,将问题转换成二值表示方式,以使得这些分类算法适用于连续属性值.实验结果表明,该算法离散过程简单高效,预测精度高,可理解性强. 展开更多
关键词 机器学习 文本分类 信息增益 连续属性离散 BOOSTING算法
下载PDF
基于形状改变比能和材料属性离散的焊接残余应力估算
20
作者 林鸿志 薛彩军 张俊苗 《航空工程进展》 2013年第1期60-65,共6页
为了提高焊接残余应力测量精度,在2219-T87铝合金TIG焊接接头残余应力测定试验基础上,通过离散接头材料属性并利用形状改变比能对焊接残余应力进行塑性修正,分别研究孔边塑性变形和接头强度不匹配对焊接残余应力估算的影响。结果表明:... 为了提高焊接残余应力测量精度,在2219-T87铝合金TIG焊接接头残余应力测定试验基础上,通过离散接头材料属性并利用形状改变比能对焊接残余应力进行塑性修正,分别研究孔边塑性变形和接头强度不匹配对焊接残余应力估算的影响。结果表明:同时考虑孔边塑性变形和接头强度不匹配因素的焊接残余应力估算方法,比线弹性残余应力计算方法能最大减小39.8%的误差;当测量点距焊缝距离小于8mm时,在考虑孔边塑性变形的情况下,同时考虑接头不匹配的影响相比不考虑其影响可最大减小40.6%的误差;当测量点距焊缝距离大于8mm时,可忽略接头强度不匹配对焊接残余应力估算的影响。 展开更多
关键词 焊接残余应力 孔边塑性变形 接头强度不匹配 形状改变比能 材料属性离散
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部