-
题名多保真度数据学习算法的定量噪声评价
- 1
-
-
作者
刘晓彤
王滋明
欧阳嘉华
杨涛
-
机构
北京信息科技大学北京市材料基因工程高精尖创新中心
北京信息科技大学计算机学院
暨南大学信息科学技术学院
-
出处
《硅酸盐学报》
EI
CAS
CSCD
北大核心
2023年第2期405-410,共6页
-
基金
国家自然科学基金项目(22203008,22272009)。
-
文摘
多保真度数据是当前材料领域数据的主要存在形式。在数据生产端,不同量化方法在材料同种属性的计算上存在较大差距。对于数据消费端的机器学习算法,研究人员为最大化提取数据中知识设计了各种方法。采用定量噪声添加的方法,评价不同噪声强度、类型对不同多保真度数据学习方法的影响,通过迭代降噪验证数据修正方法的适用场景。结果表明:多保真度数据的利用方式至关重要,需对各子数据集中数据量及含噪情况进行综合考量。在使用不同噪声类型与强度构造出的多种数据集上,得益于数据间的协同效应,逐步删除低保真度数据的"Onion"训练方式明显优于按数据集所含噪声减小方向逐个进行的训练方式。在多保真度数据训练中,无论何种噪声强度及训练方式,线性噪声对模型的影响更小。对于采样噪声来说,在各环节更好地模拟了真实多保真度数据,建议被后续研究采用。此外,复杂噪声难以让少量真值数据发挥"纠偏"作用,更适合进行迭代降噪处理。
-
关键词
多保真度
属性预测
机器学习
定量噪声
-
Keywords
multi-fidelity
property prediction
machine learning
quantitative noise
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-