-
题名基于Tree-3决策树模型的大数据挖掘算法
被引量:3
- 1
-
-
作者
褚福洋
马文辉
张文晶
闫继伟
-
机构
齐齐哈尔医学院
-
出处
《中国新技术新产品》
2022年第20期30-32,共3页
-
基金
2021年度齐齐哈尔市科技计划联合引导项目“破解移动医疗下卒中康复患者健康管理系统的数字鸿沟”(项目编号:LHYD-2021031)。
-
文摘
Tree-3决策树模型是数据挖掘领域的经典模型,但是其在数据挖掘过程中得到的挖掘结果往往只具有局部最优的性质。因此,该文在Tree-3决策树模型的基础上进行改进,提出了一种新的数据挖掘算法。新算法重新设置了信息熵计算方案,并给出了改进数据挖掘方法的具体流程。针对6个UCI数据子集进行挖掘试验,该文提出的改进方法可以得到更精简的决策树,还可以得到更高的挖掘精度,从而更好地满足数据挖掘任务的需要。
-
关键词
大数据
Tree-3决策树
局部最优
全局最优
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种监护系统大数据挖掘算法分析
被引量:1
- 2
-
-
作者
褚福洋
马文辉
张文晶
闫继伟
-
机构
齐齐哈尔医学院
-
出处
《中国科技信息》
2022年第8期95-97,共3页
-
基金
破解移动医疗下卒中康复患者健康管理系统的数字鸿沟,项目编号:LHYD-2021031,项目来源:2021年度齐齐哈尔市科技计划联合引导项目。
-
文摘
伴随着网络技术的持续发展,新时代的数据多数是非结构化类型的数据信息,其特征向量的维数较高,过多的维数会引发维度灾难,通过引入特征选择的模式对于冗余特征进行检测,数据信息的特征子集能够准确获得,实现降维目标。随后由聚类成员质量以及数据差异入手,总结出适于高维数据信息分层抽样的算法。结果表明,此算法具备良好的聚类优势。此研究对后期数据挖掘领域具有非常重大的实用价值。
-
关键词
数据挖掘
高维数据
维度灾难
特征子集
非结构化
监护系统
分层抽样
聚类
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-