期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
材料基因组工程专用数据库 被引量:5
1
作者 岳溪朝 冯燕 +3 位作者 刘健 于烨泳 席慷杰 钱权 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期399-412,共14页
材料数据具有多源、异构、高维等特点,收集纷繁复杂的材料数据,建立材料基因工程专用数据库,是实现数据驱动的新材料研发的基础.以材料数据的规范化表示、机器学习建模及模型跨域部署、材料数据隐私保护下的机器学习、利用知识图谱从材... 材料数据具有多源、异构、高维等特点,收集纷繁复杂的材料数据,建立材料基因工程专用数据库,是实现数据驱动的新材料研发的基础.以材料数据的规范化表示、机器学习建模及模型跨域部署、材料数据隐私保护下的机器学习、利用知识图谱从材料数据库到知识库等材料基因专用数据库的若干核心技术为基础,介绍了材料基因数据库平台的系统架构及实现、平台超算部署及运行.最后以反钙钛矿负膨胀材料为例,介绍了材料基因工程数据库平台从数据归档到机器学习建模,再到逆向设计,以及最终实验验证的整个流程. 展开更多
关键词 材料基因组工程 数据库 机器学习 知识图谱
下载PDF
陶瓷涂层材料多模态数据表征学习
2
作者 武星 胡明涛 丁鹏 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期492-503,共12页
陶瓷涂层具有耐高温、耐腐蚀、耐磨损等特性,其热膨胀系数和热导率等参数与其性能息息相关.为解决陶瓷涂层性能实验成本高、测试困难等问题,提出了陶瓷涂层材料多模态数据表征学习的性能预测方法.首先利用高斯混合模型虚拟样本生成(G au... 陶瓷涂层具有耐高温、耐腐蚀、耐磨损等特性,其热膨胀系数和热导率等参数与其性能息息相关.为解决陶瓷涂层性能实验成本高、测试困难等问题,提出了陶瓷涂层材料多模态数据表征学习的性能预测方法.首先利用高斯混合模型虚拟样本生成(G aussian mixture model virtual sample generation,GMMVSG)算法生成符合真实陶瓷涂层数据分布的样本来扩充数据集;其次利用卷积神经网络VGG16对陶瓷涂层的显微结构图像数据进行特征提取,利用TabNet对结构化数据进行特征提取,将提取到的图像数据特征与结构化数据特征融合;最终根据多模态数据表征建立基于K-最近邻(K-nearest neighbor,KNN)、支持向量机回归(support vector regression,SVR)和多层感知机(multi-layer perceptron,MLP)3种机器学习算法的预测模型,对陶瓷涂层的性能指标,即热膨胀系数和热导率进行了预测.实验结果表明:提出的多模态数据表征学习模型的预测结果要优于单模态数据表征学习模型,其中基于MLP算法训练的多模态数据表征学习模型对陶瓷涂层性能的预测效果最好;在测试集中,对陶瓷涂层热膨胀系数预测的平均绝对误差(mean absolute error,MAE)和均方误差(mean square error,MSE)分别为0.0266和0.0017,对热导率预测的MAE和MSE分别为0.0179和0.0007.所提出的陶瓷涂层材料多模态数据表征学习方法有效融合了结构化数据与非结构化数据,联合学习了各模态数据的潜在共享信息,成功提升了对陶瓷涂料层材料性能预测的准确度. 展开更多
关键词 陶瓷涂层 高斯混合模型 多模态数据表征 机器学习算法
下载PDF
聚丙烯复合材料老化数据集成学习
3
作者 武星 高进 丁鹏 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期440-450,共11页
聚丙烯复合材料老化实验周期长,且单次实验采集的数据样本少,使用传统机器学习方法进行预测的准确度较低.为了解决聚丙烯复合材料老化数据样本少与预测准确性低的问题,提出了一种虚拟样本生成(virtual sample generation,VSG)的集成学... 聚丙烯复合材料老化实验周期长,且单次实验采集的数据样本少,使用传统机器学习方法进行预测的准确度较低.为了解决聚丙烯复合材料老化数据样本少与预测准确性低的问题,提出了一种虚拟样本生成(virtual sample generation,VSG)的集成学习预测方法.首先,对聚丙烯复合材料老化数据使用高斯混合模型(Gaussian mixed model,GMM)虚拟样本生成方法平滑生成验证有效的虚拟样本;然后,使用生成后的数据集建立集成学习预测模型,该模型包含随机森林(random forest,RF)、极端梯度提升(extreme gradient boosting,XGBoost)算法、轻量级梯度提升机(light gradient boosting machine,LightGBM)算法以及分类梯度提升(categorical boosting,CatBoost)算法.实验表明:集成学习模型的LightGBM算法与CatBoost算法性能最优,在测试数据上均方误差为0.0013与0.0001,比RF算法与XGBoost算法分别高出0.4与0.2.聚丙烯复合材料老化虚拟样本生成与集成学习方法可以有效解决实验周期长、单次实验采集的数据样本少的问题,并可取得比单一机器学习算法更优的性能. 展开更多
关键词 聚丙烯复合材料 材料老化 集成学习 高斯混合模型
下载PDF
数据驱动的铝基复合材料性能预测和逆向设计
4
作者 陈水洲 王晓书 +1 位作者 欧阳求保 张瑞 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期512-522,共11页
采用数据驱动的方法对SiCp(0.5CNT)/7075Al铝基复合材料的化学成分以及制备工艺进行了分析,针对抗拉强度和延伸率两个力学性能进行了特征重要性分析,构建了包含8种机器学习算法的集成框架,自动进行模型的参数调优和最优模型选择,并在此... 采用数据驱动的方法对SiCp(0.5CNT)/7075Al铝基复合材料的化学成分以及制备工艺进行了分析,针对抗拉强度和延伸率两个力学性能进行了特征重要性分析,构建了包含8种机器学习算法的集成框架,自动进行模型的参数调优和最优模型选择,并在此基础上进行了材料逆向设计.实验结果表明,在470℃固溶40 min,120℃时效15 h的热处理工艺下,SiCp(0.5CNT)/7075Al-1.0Mg复合材料抗拉强度和延伸率的预测值为617.48 MPa和2.98%,实验值为647.0 MPa和3.31%,两项物理性能的平均绝对百分比误差(mean absolute percentage errors,MAPE)较小,依次为4.56%和9.97%.这说明本数据驱动方法对铝基复合材料的工艺优化和性能提升有一定指导意义. 展开更多
关键词 机器学习 特征分析 铝基复合材料 逆向设计
下载PDF
结合上下文词汇匹配和图卷积的材料数据命名实体识别
5
作者 陈茜 武星 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期372-385,共14页
材料领域的文献中蕴含着丰富的知识,利用机器学习和自然语言处理等手段对文献进行数据挖掘是研究热点.命名实体识别(named entity recognition,NER)是高效利用挖掘和抽取数据中信息的首要步骤.为了解决现有实体识别方法中存在的向量表... 材料领域的文献中蕴含着丰富的知识,利用机器学习和自然语言处理等手段对文献进行数据挖掘是研究热点.命名实体识别(named entity recognition,NER)是高效利用挖掘和抽取数据中信息的首要步骤.为了解决现有实体识别方法中存在的向量表示无法解决一词多义、模型常提取上下文特征而忽略全局特征等问题,提出了一种基于上下文词汇匹配和图卷积命名实体识别方法.该方法首先利用XLNet获取文本的上下文动态特征,其次利用长短期记忆网络并结合文本上下文匹配词汇的图卷积神经网络(graph convolutional network,GCN)模型分别获取上下文特征与全局特征,最终经过条件随机场输出标签序列.2种不同语料对模型进行验证的结果表明,该方法在材料数据集上的精确率、召回率和F1值分别达到90.05%、88.67%和89.36%,可有效提升命名实体识别的准确率. 展开更多
关键词 命名实体识别 XLNet 图卷积神经网络
下载PDF
基于自然语言处理的材料领域知识图谱构建方法 被引量:2
6
作者 魏晓 王晓鑫 +1 位作者 陈永琪 张惠然 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期386-398,共13页
如何将材料领域知识与机器学习技术相结合是材料智能研究迫切需要解决的问题.知识图谱(knowledge graphs,KGs)作为一种高效的知识组织模型,可以有效地对材料领域知识进行表示、组织和推理,从而提升材料机器学习算法的智能水平.研究了基... 如何将材料领域知识与机器学习技术相结合是材料智能研究迫切需要解决的问题.知识图谱(knowledge graphs,KGs)作为一种高效的知识组织模型,可以有效地对材料领域知识进行表示、组织和推理,从而提升材料机器学习算法的智能水平.研究了基于自然语言处理技术的材料领域知识自动获取方法,提出了基于双向门控循环单元-图神经网络-条件随机场(bidirectional-gated recurrent unit-graph neural network-conditional random field,Bi-GRU-GNN-CRF)的材料实体关系联合抽取方法,以及基于改进TextRank算法的材料工艺知识抽取方法,实现了从专利、论文等材料文献中自动获取材料实体、关系、工艺流程等材料领域知识.实验结果表明,所提出的材料知识获取方法具有较好的精度和召回率,能够有效提升材料知识图谱的知识覆盖度.基于该方法构建的材料领域知识图谱的知识覆盖率达到了80%,能够为材料智能研发提供更加全面的知识支撑.同时,构建了非调制特殊钢、铝基复合材料、热障陶瓷涂层材料3个材料领域知识图谱,并进行了应用探索,进一步验证了知识图谱为材料研发提供知识支撑的可能性. 展开更多
关键词 材料智能 自然语言处理 知识图谱
下载PDF
基于强化学习的特征选择方法及材料学应用 被引量:1
7
作者 张鹏 张瑞 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期463-475,共13页
随着大数据、人工智能以及高性能计算的快速发展,数据驱动的新材料研发成为研究热点.在对材料数据进行数据挖掘的过程中,需要对特征集合进行预处理,通过减少无关冗余特征,不仅可以避免模型过拟合,还能提高模型的可解释性.基于此,提出了... 随着大数据、人工智能以及高性能计算的快速发展,数据驱动的新材料研发成为研究热点.在对材料数据进行数据挖掘的过程中,需要对特征集合进行预处理,通过减少无关冗余特征,不仅可以避免模型过拟合,还能提高模型的可解释性.基于此,提出了一种基于强化学习的特征选择(feature selection based on reinforcement learning,FSRL)算法,将封装式特征选择抽象成机器学习模型和“环境”互动的过程,并根据利益最大化准则将对应特征加入特征子集中.同时,为了提高模型的预测精度,还提出一种基于符号变换的特征构造方法来生成新的特征.最后,将所提出方法应用到非晶合金材料的分类预测任务和铝基复合材料的回归任务中.实验结果表明,FSRL算法的分类准确率最高提升了2.8%,而在回归任务中,基于特征构造的FSRL算法使得预测精度最高提升了22.9%. 展开更多
关键词 特征选择 强化学习 特征构造方法
下载PDF
面向复合材料带隙预测的两段式集成学习模型构建
8
作者 徐燕 胡红青 +3 位作者 刘茜 张玉凤 丁广太 张惠然 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期504-511,共8页
带隙是钙钛矿型复合氧化物材料重要的特征参数,对材料的物理化学性质起决定性作用,如导电性能和光电性能等.为了寻找适合不同应用领域的钙钛矿型材料,利用机器学习进行带隙预测是一种重要的研究手段.构建了一个两阶段异质集成学习模型,... 带隙是钙钛矿型复合氧化物材料重要的特征参数,对材料的物理化学性质起决定性作用,如导电性能和光电性能等.为了寻找适合不同应用领域的钙钛矿型材料,利用机器学习进行带隙预测是一种重要的研究手段.构建了一个两阶段异质集成学习模型,在第一阶段使用多种不同的基础机器学习器(回归模型)进行预测;在第二阶段把对预测结果影响较大的描述子和基础机器学习器进行集成学习.利用该模型对210种钙钛矿型复合氧化物材料的带隙进行预测,并与多种独立的机器学习算法以及不同集成策略模型的预测性能相对比,评估了本模型的预测性能.结果表明,这种两段式的集成学习模型能够更好地学习到材料数据的内在关系,并具有较好的预测效果和较强的泛化能力. 展开更多
关键词 集成学习模型 组合策略 带隙预测 钙钛矿型复合氧化物材料 泛化能力
下载PDF
基于Jaya优化标定的高精度数据采集方法 被引量:7
9
作者 张合生 焦鹏 +4 位作者 胡琪睿 蔡江乾 胡顺波 曹贺 欧阳求保 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期361-371,共11页
材料基因组工程融合高通量实验、高通量计算和数据库及人工智能技术,能加速实现新材料的研发.然而,如何快速且可靠地从实验设备中采集数据是材料基因组工程的重要问题.针对高精度数据采集系统标定数据时间不同步的问题,以线性模型作为... 材料基因组工程融合高通量实验、高通量计算和数据库及人工智能技术,能加速实现新材料的研发.然而,如何快速且可靠地从实验设备中采集数据是材料基因组工程的重要问题.针对高精度数据采集系统标定数据时间不同步的问题,以线性模型作为采集数据处理参数的模型,以设备显示值作为数据采集真实值,构建数据处理参数寻优的目标函数;基于Jaya优化算法实现了模型参数优化搜索;最后以设备温度数据采集为例,构建了高精度数据采集系统并进行实验验证.实验结果表明,采用优化后的模型参数,数据采集平均误差仅为0.13℃,精度可达99.89%,相比于非优化模型参数,平均误差降低了63.20%,显著提高了数据采集精度. 展开更多
关键词 时间不同步 数据采集 Jaya算法 数据标定
下载PDF
基于卡尔曼滤波的含噪声小样本数据处理方法 被引量:8
10
作者 刘芬 范洪强 +2 位作者 吕涛 李谦 钱权 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期427-439,共13页
提出一种基于卡尔曼滤波和扩展卡尔曼滤波的小样本噪声数据处理方法.首先,通过物理模型或经验公式建立系统模型.然后,利用系统模型预测模型数据.最后,采用观测数据修正模型数据,达到平滑数据噪声的效果.实验结果表明,对于BC500耐候钢腐... 提出一种基于卡尔曼滤波和扩展卡尔曼滤波的小样本噪声数据处理方法.首先,通过物理模型或经验公式建立系统模型.然后,利用系统模型预测模型数据.最后,采用观测数据修正模型数据,达到平滑数据噪声的效果.实验结果表明,对于BC500耐候钢腐蚀增重数据,用差分整合移动平均自回归(autoregressive integrated moving average,ARIMA)模型和随机森林(random forest,RF)模型进行腐蚀增重预测时,经卡尔曼滤波降噪后,决定系数R^(2)平均提升6.4%,而经扩展卡尔曼滤波降噪后,R^(2)平均提升4.9%,验证了本方法的有效性. 展开更多
关键词 卡尔曼滤波 扩展卡尔曼滤波 数据降噪 小样本 腐蚀数据
下载PDF
基于特征工程和机器学习的铝基高熵合金稳定性预测 被引量:2
11
作者 胡瑞 刘庆 +4 位作者 张光捷 李俊杰 陈晓玉 魏晓 戴东波 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期476-484,共9页
铝基复合材料具有众多优异的性能,应用前景较好.以简单稳定相的高熵合金可以作为增强颗粒来制备铝基复合材料,其各方面力学性能都显著提升.提出了一种基于结合了特征工程和机器学习的新方法来研究高熵合金相稳定性.该方法利用特征工程... 铝基复合材料具有众多优异的性能,应用前景较好.以简单稳定相的高熵合金可以作为增强颗粒来制备铝基复合材料,其各方面力学性能都显著提升.提出了一种基于结合了特征工程和机器学习的新方法来研究高熵合金相稳定性.该方法利用特征工程筛选出影响目标属性的重要因素,然后选择相应的回归方法预测相稳定性.使用50%的数据集进行训练,并在其余数据集上进行测试验证.研究结果表明,该方法在预测高熵合金的相稳定性方面具有较高的准确性(R^(2)=0.994),且能辅助找到影响相稳定性的关键因素. 展开更多
关键词 铝基复合材料 高熵合金 特征工程 机器学习 相稳定性预测
下载PDF
基于区块链的数据版权保护与组合竞拍 被引量:1
12
作者 徐宇钦 钱权 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期413-426,共14页
基于区块链、数字水印以及密封递价拍卖的组合竞拍算法,设计并实现了一套数据版权保护与组合竞拍系统.首先,采用去中心化的区块链技术,结合智能合约来存储数据版权的上链记录、版权交易记录等,通过共识机制使得网络中的各个节点在互不... 基于区块链、数字水印以及密封递价拍卖的组合竞拍算法,设计并实现了一套数据版权保护与组合竞拍系统.首先,采用去中心化的区块链技术,结合智能合约来存储数据版权的上链记录、版权交易记录等,通过共识机制使得网络中的各个节点在互不信任的情况下达成共识,提升了版权管理系统的公信力.其次,数字水印作为一种特殊的编码,能够将水印信息隐藏在数据中,通过验证水印信息就可甄别版权归属.结果表明,所设计的数字水印模块对原始数据大小增加很少,且可高效地实现数字水印的嵌入和提取.最后,设计了一种组合竞拍算法来自动化地为版权拥有者挑选出最优的出价组合,实现数据版权的价值交换. 展开更多
关键词 数字版权 数字水印 区块链 智能合约 组合竞拍
下载PDF
小样本分散数据的回归建模和多目标优化 被引量:3
13
作者 姚煜 胡涛 +1 位作者 付建勋 胡顺波 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期451-462,共12页
小样本分散数据上的回归对建模有一定挑战,利用高斯过程对其回归进行建模,即采用极大似然估计进行核函数的超参数学习,通过后验来计算回归结果并预测出目标函数的均值和方差.在此基础上结合方差的多目标优化,在进行材料逆向设计的同时... 小样本分散数据上的回归对建模有一定挑战,利用高斯过程对其回归进行建模,即采用极大似然估计进行核函数的超参数学习,通过后验来计算回归结果并预测出目标函数的均值和方差.在此基础上结合方差的多目标优化,在进行材料逆向设计的同时能对设计结果的不确定性进行估计.对1215MS非调质钢和三点弯混凝土数据集进行了实验验证.实验结果表明,对于三点弯混凝土平均有50%实验数据落在预测的95%置信区间内,高斯过程回归(Gaussian process regression,GPR)模型可以较好地度量分散小样本数据的不确定性,进行合理预测.对于1215MS非调质钢数据集,在高斯过程回归模型的基础上,运用带精英策略的非支配遗传算法(elitist non-dominated sorting genetic algorithm,NSGA-Ⅱ)进行多目标优化,将材料的力学性能以及所对应的方差作为优化目标,在考虑最优力学性能的同时兼顾不确定因素对实验结果的影响,得到最优帕累托解集,以此作为下次实验的候选点,辅助材料设计和制备优化. 展开更多
关键词 小样本分散数据 高斯过程回归 多目标优化 NSGA-Ⅱ
下载PDF
支持向量回归预测不锈钢的点蚀电位 被引量:1
14
作者 麦嘉琪 徐鹏程 +2 位作者 丁松 孙阳庭 陆文聪 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期485-491,共7页
点蚀是不锈钢的主要腐蚀类型之一,常用点蚀电位来评价不锈钢腐蚀的难易程度.点蚀电位会受到多方面因素的影响.基于不锈钢的元素成分和工艺参数,采用支持向量回归(support vector regression,SVR)算法建立了预测点蚀电位的模型.结果表明... 点蚀是不锈钢的主要腐蚀类型之一,常用点蚀电位来评价不锈钢腐蚀的难易程度.点蚀电位会受到多方面因素的影响.基于不锈钢的元素成分和工艺参数,采用支持向量回归(support vector regression,SVR)算法建立了预测点蚀电位的模型.结果表明:独立测试集的相关系数达到0.97,均方根误差(root mean square error,RMSE)仅为0.07;通过Pearson相关分析和敏感性分析,元素Cr、Mo的含量和温度对点蚀电位的影响较大;当存在少量稀土元素时可以提高不锈钢的抗腐蚀能力. 展开更多
关键词 不锈钢 点蚀电位 机器学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部