-
题名面向K-近邻学习模型的高效数据清洗框架
被引量:3
- 1
-
-
作者
王婧怡
陈胤佳
袁野
陈辰
王国仁
-
机构
北京理工大学计算机学院
北京航空航天大学计算机学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2023年第9期2241-2251,共11页
-
基金
国家自然科学基金(61932004,61732003,U2001211)。
-
文摘
现实世界中收集的数据集通常是含有缺失的,为了在不完备数据集上构建有效的机器学习模型,需要对数据集进行清洗。为了确保较好的清洗效果,通常需要人工参与,从而导致大量成本。确定不完备数据的清洗优先级将有助于减小清洗规模,节约人工成本。而计算不完备数据的清洗优先级应确定其对模型性能的贡献。夏普利值是目前流行的用来评估数据在机器学习模型中贡献的方法,因此可以借助夏普利值的概念计算不完备数据的清洗优先级。由于现有工作缺少对不完备数据夏普利值的研究,首先基于不完备数据集的指数级的所有可能世界定义了一种不完备数据夏普利值的表示方法;然后基于K-近邻分类模型的效用函数,提出了一种多项式时间内计算不完备数据在K-近邻分类模型中夏普利值的近似算法;最后提出了一种基于夏普利值的面向K-近邻分类模型的启发式数据清洗算法ShapClean。实验表明,该算法在清洗后模型分类准确率方面往往可以明显超过现有的针对机器学习模型的自动清洗算法,而且相比同样需要人工参与的数据清洗算法,该方法具有更高的清洗效率,可以有效节约人工成本,同时保证理想的模型准确度。
-
关键词
不完备数据集
夏普利值
K-近邻(KNN)
清洗优先级
数据清洗
-
Keywords
incomplete dataset
Shapley value
K-nearest neighbor(KNN)
cleaning priority
data cleaning
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-
-
题名基于霍尔传感器的穿戴式计步器设计
- 2
-
-
作者
陈胤佳
-
机构
北京市第一〇一中学
-
出处
《中学物理》
2018年第12期59-62,共4页
-
文摘
本文提出了一种全新的利用霍尔传感器磁控开关设计的计步器原理,不仅能够实现精确记录步行的步数,而且针对教师行业和骑行者的计步效果也比传统计步器更加精确.
-
关键词
霍尔传感器
穿戴式
计步器
-
分类号
E911
[军事]
-
-
题名人工智能课程线上线下混合式教学模式的研究
被引量:1
- 3
-
-
作者
宋强平
陈胤佳
-
机构
北京市第一零一中学
北京航空航天大学
-
出处
《中小学信息技术教育》
2022年第8期64-66,共3页
-
文摘
2022年版义务教育信息科技课程标准把“人工智能与智慧社会”作为一个教学模块。如何提高人工智能教学实效性和提升学生实践能力有待深入研究。目前,人工智能教学存在实践探究相对不足,且与课程标准配套的网络课程资源尚待完善等问题。传统课堂很难满足这种无边界学习、交互学习和情景感知的需求。本文从线上线下混合式教学模式角度出发,依托线上智慧平台,探讨人工智能教学新途径,弥补现有的人工智能教学模式相对单一化的缺陷,使人工智能的学习方式更灵活,学习内容更广泛。
-
关键词
人工智能
信息科技
线上线下
混合式教学模式
-
分类号
G434
[文化科学—教育技术学]
-