期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
8
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
边缘计算中任务卸载研究综述
被引量:
11
1
作者
刘通
方璐
高洪皓
《计算机科学》
CSCD
北大核心
2021年第1期11-15,共5页
近年来,随着移动智能设备的普及以及5G等无线通信技术的发展,边缘计算作为一种新兴的计算模式被提出,作为传统的云计算模式的扩展与补充。边缘计算的基本思想是将移动设备上产生的计算任务从卸载到云端转变为卸载到网络边缘端,从而满足...
近年来,随着移动智能设备的普及以及5G等无线通信技术的发展,边缘计算作为一种新兴的计算模式被提出,作为传统的云计算模式的扩展与补充。边缘计算的基本思想是将移动设备上产生的计算任务从卸载到云端转变为卸载到网络边缘端,从而满足实时在线游戏、增强现实等计算密集型应用对低延迟的要求。边缘计算中的计算任务卸载是一个关键的研究问题,即计算任务应在本地执行还是卸载到边缘节点或云端。不同的任务卸载方案对任务完成时延和移动设备能耗都有着较大的影响。文中首先介绍了边缘计算的基本概念,归纳了边缘计算的几种系统架构。随后,详细阐述了边缘计算中的计算任务卸载问题。基于对任务卸载方案研究的必要性与挑战的分析,对现有的相关研究工作进行了全面的综述和总结,并对未来的研究方向进行了展望。
展开更多
关键词
边缘计算
任务卸载
资源分配
任务延迟
能量消耗
下载PDF
职称材料
数据驱动的机器学习在电化学储能材料研究中的应用
被引量:
14
2
作者
施思齐
涂章伟
+3 位作者
邹欣欣
孙拾雨
杨正伟
刘悦
《储能科学与技术》
CAS
CSCD
北大核心
2022年第3期739-759,共21页
储能电池的关键是材料。继实验观测、理论研究和计算模拟之后,数据驱动的机器学习具有快速捕捉材料成分-结构-工艺-性能间复杂构效关系的优势,有望为电化学储能材料的研发提供新的范式。本文从结构化和非结构化数据驱动两方面,系统评述...
储能电池的关键是材料。继实验观测、理论研究和计算模拟之后,数据驱动的机器学习具有快速捕捉材料成分-结构-工艺-性能间复杂构效关系的优势,有望为电化学储能材料的研发提供新的范式。本文从结构化和非结构化数据驱动两方面,系统评述了机器学习在电化学储能材料研究中的最新进展。全面概括了可用于电化学储能材料机器学习的国内外材料数据库,分析了其数据的收集、共享和质量检测存在的问题;重点阐述了电化学储能材料中机器学习的工作流程和应用,包括结构化数据驱动下数据收集、特征工程和机器学习建模以及图形、表征图像和文献文本这类非结构化数据驱动下的模型构建和应用。进一步,厘清电化学储能材料领域机器学习面临的三大矛盾且给出对策,即高维度与小样本数据的矛盾与协调、模型复杂性与易用性的矛盾与统一、模型学习结果与专家经验的矛盾与融合,并提出构建“领域知识嵌入的机器学习方法”有望调和这些矛盾。本文将为机器学习在电化学储能材料设计和性能优化中的应用提供参考。
展开更多
关键词
电化学储能材料
机器学习
材料数据库
领域知识
下载PDF
职称材料
基于Kubernetes的工业AI项目开发平台
3
作者
沈文枫
邓荣
+2 位作者
刘政森
杜雨航
陆唯佳
《计算机应用与软件》
北大核心
2024年第5期15-20,48,共7页
随着人工智能(AI)成为改变世界的前沿技术,企业也迫切需要系统地开发和实现人工智能来升级新一代工业系统的基础。考虑到将人工智能应用开发集成到工业开发中存在开发流程环节多、AI项目开发人员能力背景不一等问题,以企业实际需求为背...
随着人工智能(AI)成为改变世界的前沿技术,企业也迫切需要系统地开发和实现人工智能来升级新一代工业系统的基础。考虑到将人工智能应用开发集成到工业开发中存在开发流程环节多、AI项目开发人员能力背景不一等问题,以企业实际需求为背景设计实现了一个AI项目开发平台。探讨了人工智能项目开发平台的概念和实现,并且基于企业实际需求对其进行定制化。在传统开发流程基础上完善更多开发工作流环节。在企业内部成功进行部署和测试。结果表明:项目开发平台的功能合理、运行正常、管理便捷对AI项目开发效率、体验、规范化有积极影响,提高了计算加速部件利用率。
展开更多
关键词
Kubernetes
机器学习平台
工作流
下载PDF
职称材料
轻量级卷积神经网络的硬件加速方法
4
作者
吕文浩
支小莉
童维勤
《计算机工程与设计》
北大核心
2024年第3期699-706,共8页
为提升轻量级卷积神经网络在硬件平台的资源利用效率和推理速度,基于软硬件协同优化的思想,提出一种面向FPGA平台的轻量级卷积神经网络加速器,并针对网络结构的特性设计专门的硬件架构。与多级并行策略结合,设计一种统一的卷积层计算单...
为提升轻量级卷积神经网络在硬件平台的资源利用效率和推理速度,基于软硬件协同优化的思想,提出一种面向FPGA平台的轻量级卷积神经网络加速器,并针对网络结构的特性设计专门的硬件架构。与多级并行策略结合,设计一种统一的卷积层计算单元。为降低模型存储成本、提高加速器的吞吐量,提出一种基于可微阈值的选择性移位量化方案,使计算单元能够以硬件友好的形式执行计算。实验结果表明,在Arria 10 FPGA平台上部署的MobileNetV2加速器能够达到311 fps的推理速度,相比CPU版本实现了约9.3倍的加速比、GPU版本约3倍的加速比。在吞吐量方面,加速器能够实现98.62 GOPS。
展开更多
关键词
软硬件协同优化
现场可编程门阵列
轻量级卷积神经网络
移位量化
并行计算
硬件加速
开放式计算语言
下载PDF
职称材料
高质量的材料科学文本挖掘数据集构建方法
被引量:
2
5
作者
刘悦
刘大晖
+4 位作者
葛献远
杨正伟
马舒畅
邹喆乂
施思齐
《物理学报》
SCIE
EI
CAS
CSCD
北大核心
2023年第7期41-54,共14页
科学文献中蕴含的大量历史数据和经验知识,对材料设计与研发具有重要参考价值.文本挖掘尽管能高效地探索并利用被存储在海量科学文献中的信息,但高质量文本数据的获取困难阻碍了其在材料领域更广泛的应用.本文从品质和数量双视角剖析了...
科学文献中蕴含的大量历史数据和经验知识,对材料设计与研发具有重要参考价值.文本挖掘尽管能高效地探索并利用被存储在海量科学文献中的信息,但高质量文本数据的获取困难阻碍了其在材料领域更广泛的应用.本文从品质和数量双视角剖析了材料领域的文本数据质量问题及其相关研究工作,提出高质量的材料科学文本挖掘数据集构建方法.该方法通过可溯源的文献自动获取方案确保文本数据的源头可追溯;以下游任务为驱动对文献进行预处理以提升预标注文本语料的质量;基于材料四面体准则定义适配全体系的标签注释方案以完成对语料的高品质标注;利用融合材料领域知识的有条件文本数据增强模型实现材料文本数据量的扩充.在不同体系数据集上的实验结果表明,该方法可有效地提升下游文本挖掘模型的预测精度,其中在NASICON型固态电解质材料实体识别任务上的F1值达84%.本文为文本挖掘在材料领域的深入应用提供理论指导和解决方案,并有望推进数据与知识双向驱动的材料设计与研发.
展开更多
关键词
材料科学文本挖掘
数据增强
数据质量
下载PDF
职称材料
融合材料领域知识的数据准确性检测方法
被引量:
3
6
作者
施思齐
孙拾雨
+3 位作者
马舒畅
邹欣欣
钱权
刘悦
《无机材料学报》
SCIE
EI
CAS
CSCD
北大核心
2022年第12期1311-1320,I0001-I0005,共15页
材料数据由于小样本、高维度、噪音大等特性,用于机器学习建模时常常会产生与领域专家认知不一致的结果。面向机器学习全流程,开发材料领域知识嵌入的机器学习模型是解决这一问题的有效途径。材料数据的准确性直接影响了数据驱动的材料...
材料数据由于小样本、高维度、噪音大等特性,用于机器学习建模时常常会产生与领域专家认知不一致的结果。面向机器学习全流程,开发材料领域知识嵌入的机器学习模型是解决这一问题的有效途径。材料数据的准确性直接影响了数据驱动的材料性能预测的可靠性。本研究针对机器学习应用过程中的数据预处理阶段,提出了融合材料领域知识的数据准确性检测方法。该方法首先结合材料专家认知构建了材料领域知识库。然后,将其与数据驱动的数据准确性检测方法结合,从数据和领域知识两个角度对材料数据集进行基于描述符取值规则的单维度数据正确性检测、基于描述符相关性规则的多维度数据相关性检测以及基于多维相似样本识别策略的全维度数据可靠性检测。对于每一阶段识别出的异常数据,结合材料领域知识进行修正,并将领域知识融入到数据准确性检测方法的全过程以确保数据集从初始阶段就具有较高准确性。最后该方法在NASICON型固态电解质激活能预测数据集上的实验结果表明:本研究提出的方法可以有效识别异常数据并进行合理修正。与原始数据集相比,基于修正数据集的6种机器学习模型的预测精度都有不同程度的提升。其中,在最优模型上R2提升了33%。
展开更多
关键词
机器学习
材料科学
数据质量
领域知识
下载PDF
职称材料
材料领域知识嵌入的机器学习
被引量:
26
7
作者
刘悦
邹欣欣
+1 位作者
杨正伟
施思齐
《硅酸盐学报》
EI
CAS
CSCD
北大核心
2022年第3期863-876,共14页
数据驱动的机器学习因其能够快速拟合历史数据中的潜在模式并实现材料性能的精准预测,已被广泛应用于材料性能优化和新材料设计。然而,由于缺乏描述符间关联关系、材料性能驱动机制等材料领域知识的指导,数据驱动的机器学习在实际应用...
数据驱动的机器学习因其能够快速拟合历史数据中的潜在模式并实现材料性能的精准预测,已被广泛应用于材料性能优化和新材料设计。然而,由于缺乏描述符间关联关系、材料性能驱动机制等材料领域知识的指导,数据驱动的机器学习在实际应用中常常出现与材料基础理论认知或原理不一致的结果。本工作通过分析材料数据的特点和数据驱动的机器学习建模原理,厘清了数据驱动的机器学习应用于材料领域面临的三大矛盾:高维度与小样本数据的矛盾、模型准确性与易用性的矛盾、模型学习结果与领域专家知识的矛盾。藉此提出材料领域知识嵌入的机器学习作为上述矛盾的调和策略。进一步,面向“目标定义–数据准备–数据预处理–特征工程–模型构建–模型应用”的机器学习全流程,通过剖析相关的基础性和探索性工作,探讨了在机器学习各阶段实现材料领域知识嵌入的关键技术。最后,展望了材料领域知识嵌入机器学习的发展机遇和挑战。
展开更多
关键词
材料设计
机器学习
材料数据
原文传递
面向材料领域机器学习的数据质量治理
被引量:
4
8
作者
刘悦
马舒畅
+2 位作者
杨正伟
邹欣欣
施思齐
《硅酸盐学报》
EI
CAS
CSCD
北大核心
2023年第2期427-437,共11页
数据驱动的机器学习凭借其准确高效的预测能力广泛应用于材料的性能预测和构效关系研究。数据决定了机器学习的上限。然而,目前材料领域的数据存在来源广、噪音大、样本少、维度高等数据质量问题,阻碍了机器学习在材料领域更广泛的应用...
数据驱动的机器学习凭借其准确高效的预测能力广泛应用于材料的性能预测和构效关系研究。数据决定了机器学习的上限。然而,目前材料领域的数据存在来源广、噪音大、样本少、维度高等数据质量问题,阻碍了机器学习在材料领域更广泛的应用。本文从数据品质和数据数量2个视角系统梳理并全面剖析了材料领域数据质量问题及其相关治理工作,发现数据品质与数据数量共同决定数据质量。基于此,提出了面向材料领域机器学习全过程的领域知识嵌入的数据质量治理框架。该框架定义了12种维度用于解析材料数据质量的内涵;构建了数据质量治理的生命周期模型以确保数据质量治理活动有序进行;建立了一系列数据质量治理处理模型,从领域知识与数据驱动2个方面对数据质量进行精准全面治理,为生命周期模型的具体实施提供技术支持。该框架实现了材料数据质量的综合评估与提升,为高质量数据获取提供理论指导与候选方案,加速机器学习在材料研发中的深入应用。
展开更多
关键词
材料科学
机器学习
数据质量
领域知识
原文传递
题名
边缘计算中任务卸载研究综述
被引量:
11
1
作者
刘通
方璐
高洪皓
机构
上海
大学
计算
机
工程
与科学学院
上海智能计算系统工程技术研究中心
出处
《计算机科学》
CSCD
北大核心
2021年第1期11-15,共5页
基金
国家自然科学基金青年项目(61802245)
上海市“科技创新行动计划”青年科技英才扬帆计划(18YF1408200)。
文摘
近年来,随着移动智能设备的普及以及5G等无线通信技术的发展,边缘计算作为一种新兴的计算模式被提出,作为传统的云计算模式的扩展与补充。边缘计算的基本思想是将移动设备上产生的计算任务从卸载到云端转变为卸载到网络边缘端,从而满足实时在线游戏、增强现实等计算密集型应用对低延迟的要求。边缘计算中的计算任务卸载是一个关键的研究问题,即计算任务应在本地执行还是卸载到边缘节点或云端。不同的任务卸载方案对任务完成时延和移动设备能耗都有着较大的影响。文中首先介绍了边缘计算的基本概念,归纳了边缘计算的几种系统架构。随后,详细阐述了边缘计算中的计算任务卸载问题。基于对任务卸载方案研究的必要性与挑战的分析,对现有的相关研究工作进行了全面的综述和总结,并对未来的研究方向进行了展望。
关键词
边缘计算
任务卸载
资源分配
任务延迟
能量消耗
Keywords
Edge computing
Task offloading
Resource allocation
Task delay
Energy consumption
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
数据驱动的机器学习在电化学储能材料研究中的应用
被引量:
14
2
作者
施思齐
涂章伟
邹欣欣
孙拾雨
杨正伟
刘悦
机构
上海
大学材料科学与
工程
学院
上海
大学材料基因组
工程
研究
院
上海
大学
计算
机
工程
与科学学院
上海
市
智能
计算
系统工程
技术
研究
中心
之江实验室
出处
《储能科学与技术》
CAS
CSCD
北大核心
2022年第3期739-759,共21页
基金
国家重点研发计划项目(2021YFB3802100)
国家自然科学基金面上项目(52073169)
之江实验室科研攻关项目(2021PE0AC02)。
文摘
储能电池的关键是材料。继实验观测、理论研究和计算模拟之后,数据驱动的机器学习具有快速捕捉材料成分-结构-工艺-性能间复杂构效关系的优势,有望为电化学储能材料的研发提供新的范式。本文从结构化和非结构化数据驱动两方面,系统评述了机器学习在电化学储能材料研究中的最新进展。全面概括了可用于电化学储能材料机器学习的国内外材料数据库,分析了其数据的收集、共享和质量检测存在的问题;重点阐述了电化学储能材料中机器学习的工作流程和应用,包括结构化数据驱动下数据收集、特征工程和机器学习建模以及图形、表征图像和文献文本这类非结构化数据驱动下的模型构建和应用。进一步,厘清电化学储能材料领域机器学习面临的三大矛盾且给出对策,即高维度与小样本数据的矛盾与协调、模型复杂性与易用性的矛盾与统一、模型学习结果与专家经验的矛盾与融合,并提出构建“领域知识嵌入的机器学习方法”有望调和这些矛盾。本文将为机器学习在电化学储能材料设计和性能优化中的应用提供参考。
关键词
电化学储能材料
机器学习
材料数据库
领域知识
Keywords
electrochemical energy storage materials
machine learning
materials database
domain knowledge
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于Kubernetes的工业AI项目开发平台
3
作者
沈文枫
邓荣
刘政森
杜雨航
陆唯佳
机构
上海
大学
计算
机
工程
与科学学院
联合汽车电子有限公司AI实验室
上海
大学
上海智能计算系统工程技术研究中心
出处
《计算机应用与软件》
北大核心
2024年第5期15-20,48,共7页
文摘
随着人工智能(AI)成为改变世界的前沿技术,企业也迫切需要系统地开发和实现人工智能来升级新一代工业系统的基础。考虑到将人工智能应用开发集成到工业开发中存在开发流程环节多、AI项目开发人员能力背景不一等问题,以企业实际需求为背景设计实现了一个AI项目开发平台。探讨了人工智能项目开发平台的概念和实现,并且基于企业实际需求对其进行定制化。在传统开发流程基础上完善更多开发工作流环节。在企业内部成功进行部署和测试。结果表明:项目开发平台的功能合理、运行正常、管理便捷对AI项目开发效率、体验、规范化有积极影响,提高了计算加速部件利用率。
关键词
Kubernetes
机器学习平台
工作流
Keywords
Kubernetes
Machine learning platform
Workflow
分类号
TP311.5 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
轻量级卷积神经网络的硬件加速方法
4
作者
吕文浩
支小莉
童维勤
机构
上海
大学
计算
机
工程
与科学学院
上海智能计算系统工程技术研究中心
研发部
出处
《计算机工程与设计》
北大核心
2024年第3期699-706,共8页
基金
山东省自然科学基金项目(ZR2019LZH002)
中国高校产学研创新基金项目(2020HYA02011)
上海市科委人工智能支撑专项基金项目(22511106005)。
文摘
为提升轻量级卷积神经网络在硬件平台的资源利用效率和推理速度,基于软硬件协同优化的思想,提出一种面向FPGA平台的轻量级卷积神经网络加速器,并针对网络结构的特性设计专门的硬件架构。与多级并行策略结合,设计一种统一的卷积层计算单元。为降低模型存储成本、提高加速器的吞吐量,提出一种基于可微阈值的选择性移位量化方案,使计算单元能够以硬件友好的形式执行计算。实验结果表明,在Arria 10 FPGA平台上部署的MobileNetV2加速器能够达到311 fps的推理速度,相比CPU版本实现了约9.3倍的加速比、GPU版本约3倍的加速比。在吞吐量方面,加速器能够实现98.62 GOPS。
关键词
软硬件协同优化
现场可编程门阵列
轻量级卷积神经网络
移位量化
并行计算
硬件加速
开放式计算语言
Keywords
software-hardware co-optimization
field programmable gate array
lightweight convolutional neural networks
shift quantization
parallel computation
hardware acceleration
open computing language
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
高质量的材料科学文本挖掘数据集构建方法
被引量:
2
5
作者
刘悦
刘大晖
葛献远
杨正伟
马舒畅
邹喆乂
施思齐
机构
上海
大学
计算
机
工程
与科学学院
上海
大学材料科学与
工程
学院
上海
大学材料基因组
工程
研究
院
上海
市
智能
计算
系统工程
技术
研究
中心
湘潭大学材料科学与
工程
学院
出处
《物理学报》
SCIE
EI
CAS
CSCD
北大核心
2023年第7期41-54,共14页
基金
国家重点研发计划(批准号:2021YFB3802101)
国家自然科学基金(批准号:92270124,52073169,52102313)资助的课题.
文摘
科学文献中蕴含的大量历史数据和经验知识,对材料设计与研发具有重要参考价值.文本挖掘尽管能高效地探索并利用被存储在海量科学文献中的信息,但高质量文本数据的获取困难阻碍了其在材料领域更广泛的应用.本文从品质和数量双视角剖析了材料领域的文本数据质量问题及其相关研究工作,提出高质量的材料科学文本挖掘数据集构建方法.该方法通过可溯源的文献自动获取方案确保文本数据的源头可追溯;以下游任务为驱动对文献进行预处理以提升预标注文本语料的质量;基于材料四面体准则定义适配全体系的标签注释方案以完成对语料的高品质标注;利用融合材料领域知识的有条件文本数据增强模型实现材料文本数据量的扩充.在不同体系数据集上的实验结果表明,该方法可有效地提升下游文本挖掘模型的预测精度,其中在NASICON型固态电解质材料实体识别任务上的F1值达84%.本文为文本挖掘在材料领域的深入应用提供理论指导和解决方案,并有望推进数据与知识双向驱动的材料设计与研发.
关键词
材料科学文本挖掘
数据增强
数据质量
Keywords
text mining in materials science
data augmentation
data quality
分类号
TB30 [一般工业技术—材料科学与工程]
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合材料领域知识的数据准确性检测方法
被引量:
3
6
作者
施思齐
孙拾雨
马舒畅
邹欣欣
钱权
刘悦
机构
上海
大学材料基因组
工程
研究
院
上海
大学材料科学与
工程
学院
上海
大学
计算
机
工程
与科学学院
上海
大学
上海
市
智能
计算
系统工程
技术
研究
中心
之江实验室
出处
《无机材料学报》
SCIE
EI
CAS
CSCD
北大核心
2022年第12期1311-1320,I0001-I0005,共15页
基金
国家重点研发计划(2021YFB3802101)
国家自然科学基金(52073169)
之江实验室科研攻关项目(2021PE0AC02)。
文摘
材料数据由于小样本、高维度、噪音大等特性,用于机器学习建模时常常会产生与领域专家认知不一致的结果。面向机器学习全流程,开发材料领域知识嵌入的机器学习模型是解决这一问题的有效途径。材料数据的准确性直接影响了数据驱动的材料性能预测的可靠性。本研究针对机器学习应用过程中的数据预处理阶段,提出了融合材料领域知识的数据准确性检测方法。该方法首先结合材料专家认知构建了材料领域知识库。然后,将其与数据驱动的数据准确性检测方法结合,从数据和领域知识两个角度对材料数据集进行基于描述符取值规则的单维度数据正确性检测、基于描述符相关性规则的多维度数据相关性检测以及基于多维相似样本识别策略的全维度数据可靠性检测。对于每一阶段识别出的异常数据,结合材料领域知识进行修正,并将领域知识融入到数据准确性检测方法的全过程以确保数据集从初始阶段就具有较高准确性。最后该方法在NASICON型固态电解质激活能预测数据集上的实验结果表明:本研究提出的方法可以有效识别异常数据并进行合理修正。与原始数据集相比,基于修正数据集的6种机器学习模型的预测精度都有不同程度的提升。其中,在最优模型上R2提升了33%。
关键词
机器学习
材料科学
数据质量
领域知识
Keywords
machine learning
materials science
data quality
domain knowledge
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
O646 [理学—物理化学]
TB30 [一般工业技术—材料科学与工程]
下载PDF
职称材料
题名
材料领域知识嵌入的机器学习
被引量:
26
7
作者
刘悦
邹欣欣
杨正伟
施思齐
机构
上海
大学
计算
机
工程
与科学学院
上海
大学材料科学与
工程
学院
上海
大学材料基因组
工程
研究
院
上海
市
智能
计算
系统工程
技术
研究
中心
之江实验室
出处
《硅酸盐学报》
EI
CAS
CSCD
北大核心
2022年第3期863-876,共14页
基金
国家自然科学基金面上项目(52073169)
国家重点研发计划(2021YFB3802100)
之江实验室科研攻关项目(2021PE0AC02)。
文摘
数据驱动的机器学习因其能够快速拟合历史数据中的潜在模式并实现材料性能的精准预测,已被广泛应用于材料性能优化和新材料设计。然而,由于缺乏描述符间关联关系、材料性能驱动机制等材料领域知识的指导,数据驱动的机器学习在实际应用中常常出现与材料基础理论认知或原理不一致的结果。本工作通过分析材料数据的特点和数据驱动的机器学习建模原理,厘清了数据驱动的机器学习应用于材料领域面临的三大矛盾:高维度与小样本数据的矛盾、模型准确性与易用性的矛盾、模型学习结果与领域专家知识的矛盾。藉此提出材料领域知识嵌入的机器学习作为上述矛盾的调和策略。进一步,面向“目标定义–数据准备–数据预处理–特征工程–模型构建–模型应用”的机器学习全流程,通过剖析相关的基础性和探索性工作,探讨了在机器学习各阶段实现材料领域知识嵌入的关键技术。最后,展望了材料领域知识嵌入机器学习的发展机遇和挑战。
关键词
材料设计
机器学习
材料数据
Keywords
materials design
machine learning
materials data
分类号
TB3 [一般工业技术—材料科学与工程]
TP3 [自动化与计算机技术—计算机科学与技术]
原文传递
题名
面向材料领域机器学习的数据质量治理
被引量:
4
8
作者
刘悦
马舒畅
杨正伟
邹欣欣
施思齐
机构
上海
大学
计算
机
工程
与科学学院
上海
市
智能
计算
系统工程
技术
研究
中心
上海
大学材料科学与
工程
学院
上海
大学材料基因组
工程
研究
院
出处
《硅酸盐学报》
EI
CAS
CSCD
北大核心
2023年第2期427-437,共11页
基金
国家重点研发计划项目(2021YFB3802101)
国家自然科学基金面上项目(52073169)
国家自然科学基金重大研究计划培育项目(92270124)。
文摘
数据驱动的机器学习凭借其准确高效的预测能力广泛应用于材料的性能预测和构效关系研究。数据决定了机器学习的上限。然而,目前材料领域的数据存在来源广、噪音大、样本少、维度高等数据质量问题,阻碍了机器学习在材料领域更广泛的应用。本文从数据品质和数据数量2个视角系统梳理并全面剖析了材料领域数据质量问题及其相关治理工作,发现数据品质与数据数量共同决定数据质量。基于此,提出了面向材料领域机器学习全过程的领域知识嵌入的数据质量治理框架。该框架定义了12种维度用于解析材料数据质量的内涵;构建了数据质量治理的生命周期模型以确保数据质量治理活动有序进行;建立了一系列数据质量治理处理模型,从领域知识与数据驱动2个方面对数据质量进行精准全面治理,为生命周期模型的具体实施提供技术支持。该框架实现了材料数据质量的综合评估与提升,为高质量数据获取提供理论指导与候选方案,加速机器学习在材料研发中的深入应用。
关键词
材料科学
机器学习
数据质量
领域知识
Keywords
materials science
machine learning
data quality and quantity
domain knowledge
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
TB3 [一般工业技术—材料科学与工程]
原文传递
题名
作者
出处
发文年
被引量
操作
1
边缘计算中任务卸载研究综述
刘通
方璐
高洪皓
《计算机科学》
CSCD
北大核心
2021
11
下载PDF
职称材料
2
数据驱动的机器学习在电化学储能材料研究中的应用
施思齐
涂章伟
邹欣欣
孙拾雨
杨正伟
刘悦
《储能科学与技术》
CAS
CSCD
北大核心
2022
14
下载PDF
职称材料
3
基于Kubernetes的工业AI项目开发平台
沈文枫
邓荣
刘政森
杜雨航
陆唯佳
《计算机应用与软件》
北大核心
2024
0
下载PDF
职称材料
4
轻量级卷积神经网络的硬件加速方法
吕文浩
支小莉
童维勤
《计算机工程与设计》
北大核心
2024
0
下载PDF
职称材料
5
高质量的材料科学文本挖掘数据集构建方法
刘悦
刘大晖
葛献远
杨正伟
马舒畅
邹喆乂
施思齐
《物理学报》
SCIE
EI
CAS
CSCD
北大核心
2023
2
下载PDF
职称材料
6
融合材料领域知识的数据准确性检测方法
施思齐
孙拾雨
马舒畅
邹欣欣
钱权
刘悦
《无机材料学报》
SCIE
EI
CAS
CSCD
北大核心
2022
3
下载PDF
职称材料
7
材料领域知识嵌入的机器学习
刘悦
邹欣欣
杨正伟
施思齐
《硅酸盐学报》
EI
CAS
CSCD
北大核心
2022
26
原文传递
8
面向材料领域机器学习的数据质量治理
刘悦
马舒畅
杨正伟
邹欣欣
施思齐
《硅酸盐学报》
EI
CAS
CSCD
北大核心
2023
4
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部