-
题名基于粗糙集理论的决策树分类方法
被引量:9
- 1
-
-
作者
邹瑞芝
罗可
曾正良
-
机构
长沙理工大学计算机与通信工程学院。湖南长沙
-
出处
《计算机工程与科学》
CSCD
北大核心
2009年第10期112-114,共3页
-
基金
国家自然科学基金资助项目(10471036,60474070)
湖南省科技计划项目基金资助项目(05FJ3074)
湖南省教育厅重点项目(07A001)
-
文摘
决策树是数据挖掘中常用的分类方法。本文提出了基于粗糙集的决策树方法,利用粗糙集近似精确度来选择决策树的根节点,分支由分类产生。该方法计算简单,易于理解。本文还提出用悲观剪枝法简化决策树,提高决策树的预测与分类能力。实例说明了本文方法均简单有效。
-
关键词
粗糙集
决策树
近似精确度
悲观剪枝
-
Keywords
rough set
decision tree
approximation quality
pessimistic pruning
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种基于遗传算法的粗糙集属性约简算法
被引量:2
- 2
-
-
作者
邹瑞芝
-
机构
广州华南商贸职业学院信息工程系
-
出处
《电脑知识与技术》
2011年第4X期2943-2944,2947,共3页
-
文摘
属性约简是粗糙集理论研究的重要内容之一,而求解最小约简是NP难问题。为了有效获取最优或次优约简,该文提出了一种基于遗传算法的粗糙集属性约简算法。该算法将属性核加入遗传算法的初始种群来增加收敛速度,而且在适应度函数中,通过计算决策属性对条件属性的依赖度,使该文算法既保证了全局寻优的特性又具有加强局部搜索的能力,能够获得最佳的搜索效果。该算法通过实例分析,证明是求解属性约简问题的快速有效方法。
-
关键词
粗糙集
属性约简
遗传算法
属性依赖度
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于数据压缩算法的研究
被引量:1
- 3
-
-
作者
邹瑞芝
-
机构
广州华南商贸职业学院信息工程系
-
出处
《沿海企业与科技》
2011年第2期20-21,19,共3页
-
文摘
随着信息技术和计算机技术的飞速发展,人们面对的数据越来越多,在数据储存和传输的过程中,数据压缩的地位越来越重要。文章介绍LZW数据压缩算法,并给出一个编码实例,实验结果证明这是一种有效的数据压缩方法。
-
关键词
数据压缩
无损压缩
LZW算法
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于复合粒子群的数据分类方法
被引量:2
- 4
-
-
作者
曾正良
罗可
邹瑞芝
-
机构
长沙理工大学计算机与通信工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第7期156-158,共3页
-
基金
国家自然科学基金No.10471036
No.60474070
+1 种基金
湖南省科技厅科研项目基金(No.05FJ3074)
湖南省教育厅重点项目(No.07A001)~~
-
文摘
分类是数据挖掘中的一个重要任务。当前许多分类算法一般要求处理离散属性数据,提出了一种新的基于复合粒子群算法,它能对含有连续属性和离散属性值的混合数据进行分类。为提高分类正确率和效率,对基本粒子群采用复合结构编码,通过粒子群算法得到连续属性离散化后的候选分割点并分类,将混合数据分类问题转化为0-1组合优化问题。实验结果证明,该算法有很好的分类效果,而且具有较快的收敛速度。
-
关键词
数据挖掘
数据分类
粒子群算法
离散化
-
Keywords
data mining
data classification
particle swarm optimization
discretization
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于K-均值聚类和凝聚聚类的离群点查找方法
被引量:9
- 5
-
-
作者
曾颖
罗可
邹瑞芝
-
机构
长沙理工大学计算机与通信工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第29期131-133,共3页
-
基金
国家自然科学基金(No.10871031)
湖南省科技计划项目基金(No.2008FJ3015)
湖南省教育厅科研项目基金(No.07A001)~~
-
文摘
离群点发现是数据挖掘研究的一个重要方面。根据数据流的特点,给出了一种基于K-均值聚类和凝聚聚类的离群点发现方法,先用K-均值聚类对数据流进行处理,生成中间聚类结果,然后用凝聚聚类对这些中间结果进行再次选择,最后找出可能存在的离群点。
-
关键词
数据挖掘
离群点
K-均值聚类
凝聚聚类
-
Keywords
data mining
outliers
k-means clustering
agglomerative clustering
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名带常数利率的风险模型在随机时间上的破产概率
- 6
-
-
作者
邹瑞芝
-
机构
暨南大学统计系
-
出处
《江西科学》
2012年第1期24-26,共3页
-
文摘
考查了索赔额在独立同分布的情况下的风险模型下在随机时间的破产概率,在假设随机时间服从指数分布情况下,索赔额分布属于S族得到破产概率的一个渐进表达式。
-
关键词
独立
同分布
随机时间
破产概率
-
Keywords
Independent
Same distribution
Random time
Ruin probability
-
分类号
O211
[理学—概率论与数理统计]
-