-
题名MD-KNN算法在高校精准资助中的应用
被引量:1
- 1
-
-
作者
李博
李霞
张晓
王艳秋
李恒
张勇
凌玉龙
-
机构
西北工业大学计算机学院
西北工业大学工信部大数据存储与管理重点实验室
西北工业大学学生资助服务中心
-
出处
《计算机技术与发展》
2020年第7期91-95,共5页
-
基金
国家重点研发计划(2018YFB1004401)。
-
文摘
精准资助是当前一个热点问题,国内很多高校也对学生精准问题进行了深入的探索。为提升高校学生精准资助工作的准确性,采用MD-KNN算法(Mahalanobis distance k-nearest neighbor algorithm)对该问题进行分析。对收集到的数据信息利用基于马氏距离的MD-KNN算法进行聚类,再对聚类结果进行迭代分析,以提高经济困难学生筛选工作的精度。学生群体由于其本身的特殊性,其行为也会与贫困情况有联系,文中对学生行为与贫困情况进行分析:发现学生在学校食堂就餐次数、就餐天数与贫困指数具有正相关的联系。以西安某高校2017年11月至2018年4月学生行为数据为样本进行实验;用生成的名单与线下正常认证的贫困学生名单进行对比。实验证明MD-KNN算法在高校学生精准资助中具有很大的应用价值。
-
关键词
MD-KNN算法
马氏距离
高校精准资助
聚类算法
数据挖掘
-
Keywords
Mahalanobis distance k-nearest neighbor algorithm
Mahalanobis distance
precise subsidy of colleges and universities
clustering algorithm
data mining
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名改进kmeans算法在学生消费画像中的应用
被引量:12
- 2
-
-
作者
凌玉龙
张晓
李霞
张勇
-
机构
西北工业大学大数据存储与管理工信部重点实验室
西北工业大学学生资助服务中心
-
出处
《计算机技术与发展》
2021年第10期122-127,共6页
-
基金
国家重点研发计划(2018YFB1004401)
北京市自然科学基金-海淀原始创新联合基金(L192027)。
-
文摘
学生校园消费数据中隐含了大量的高价值信息,论文从学生消费画像和精准资助两个角度对校园消费数据进行挖掘研究。从数据集本身的特点和kmeans算法的缺陷两个角度出发,论文对kmeans算法进行了两点改进:采用马氏距离代替欧氏距离以适用于具体的校园消费数据应用场景;为了解决随机选择初始聚类中心的方法受离群样本点的影响,采用在高密度样本集合中选择相距最远的k个样本作为初始聚类中心的改进方法。在西安某高校3个月的学生消费数据集上的实验结果表明:论文设计的学生群体分类模型不仅能有效区分不同行为特征的学生,而且能很好地刻画学生的消费画像;通过对比分析聚类标记的贫困生名单和线下认定的贫困生名单,证明了改进kmeans算法在精准资助中的应用价值。
-
关键词
改进kmeans算法
马氏距离
初始聚类中心集合
学生消费画像
精准资助
-
Keywords
improved kmeans algorithm
Mahalanobis distance
initial clustering center set
student consumption portrait
precision funding
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-