深度学习是当前机器学习、模式识别和人工智能领域中的一项热点研究技术,非常适用于处理复杂的大规模数据.基于深度学习理论构建了一个5层的栈式自编码深度神经网络,对恒星大气物理参数进行自动估计,网络各层的节点数分别为3821-500-100...深度学习是当前机器学习、模式识别和人工智能领域中的一项热点研究技术,非常适用于处理复杂的大规模数据.基于深度学习理论构建了一个5层的栈式自编码深度神经网络,对恒星大气物理参数进行自动估计,网络各层的节点数分别为3821-500-100-50-1.使用美国大型巡天项目Sloan发布的Sloan Digital Sky Survey(SDSS)实测光谱以及由Kurucz的New Opacity Distribution Function(NEWODF)模型得到的理论光谱进行了实验验证,对有效温度(Teff)、表面重力加速度(lg g)和金属丰度([Fe/H])3个物理参数进行了自动估计.结果表明,栈式自编码深度神经网络的估计精度较好,其中在SDSS数据上的平均绝对误差分别为:79.95(Teff/K),0.0058(lg(Teff/K)),0.1706(lg(g/(cm·s^(-2)))),0.1294 dex([Fe/H]);在理论数据上的平均绝对误差分别是:15.34(Teff/K),0.0011(lg(Teff/K)),0.0214(lg(g/(cm·s^(-2)))),0.0121 dex([Fe/H]).展开更多
近年来,深度学习算法以其适应性强、准确率高、结构复杂等特性在数据挖掘算法中异军突起,但是在天文信息学中深度学习算法还鲜有问津.针对斯隆数字巡天(Sloan Digital Sky Survey,SDSS)恒星/星系分类中普遍存在的亮源集分类正确率高但...近年来,深度学习算法以其适应性强、准确率高、结构复杂等特性在数据挖掘算法中异军突起,但是在天文信息学中深度学习算法还鲜有问津.针对斯隆数字巡天(Sloan Digital Sky Survey,SDSS)恒星/星系分类中普遍存在的亮源集分类正确率高但暗源集分类正确率低等问题,引入了深度学习中较新的研究成果—堆叠降噪自编码(stacked denoising autoencoders,SDA)神经网络和dropout微调技术.从SDSS释放出的带有光谱证认(spectroscopic measurements)的测光数据中分别随机抽取DR7(Data Release7)和DR12(Data Release 12)的亮源集和暗源集并对其进行预处理,再分别对它们的亮源集和暗源集做不放回随机抽样,得到它们亮源和暗源的训练集和测试集.最后用这些训练集分别训练得到了DR7和DR12亮源和暗源的SDA模型,并将SDA在DR12测试集上的测试结果与支持向量机软件包(Library for Support Vector Machines,LibSVM)、J48决策树(J48)、逻辑模型树(Logistic Model Trees,LMT)、支持向量机(Support Vector Machine,SVM)、逻辑回归(Logistic Regression)、单层决策树算法(Decision Stump)上的测试结果进行比较,同时将SDA在DR7测试集上的测试结果与6种决策树的测试结果进行比较.仿真表明SDA在SDSS-DR7和最新SDSS-DR12的暗源集上的分类性能明显优于其他算法,尤其是在使用完备函数(completeness function,CP)作为衡量指标时,SDA相比决策树算法在SDSS-DR7暗源集正确率提高了15%左右.展开更多
天体光谱分类是天文学研究的重要内容之一,其关键是从光谱数据中选择和提取对分类识别最有效的特征构建特征空间.提出一种新的基于2维傅里叶谱图像的特征提取方法,并应用于LAMOST (the Large Sky Area Multi-Object Fiber Spectroscopic...天体光谱分类是天文学研究的重要内容之一,其关键是从光谱数据中选择和提取对分类识别最有效的特征构建特征空间.提出一种新的基于2维傅里叶谱图像的特征提取方法,并应用于LAMOST (the Large Sky Area Multi-Object Fiber Spectroscopic Telescope)恒星光谱数据的分类研究中.光谱数据来源于LAMOST Data Release 5(DR5),选取30000条F、 G和K型星光谱数据,利用短时傅里叶变换(Short-Time Fourier Transform, STFT)将1维光谱数据变换成2维傅里叶谱图像,对得到的2维傅里叶谱图像采用深度卷积网络模型进行分类,得到的分类准确率是92.90%.实验结果表明通过对LAMOST恒星光谱数据进行STFT可得到光谱的2维傅里叶谱图像,谱图像构成了新的光谱数据特征和特征空间,新的特征对于光谱数据分类是有效的.此方法是对光谱分类的一种全新尝试,对海量天体光谱的分类和挖掘处理有一定的开创意义.展开更多
文摘深度学习是当前机器学习、模式识别和人工智能领域中的一项热点研究技术,非常适用于处理复杂的大规模数据.基于深度学习理论构建了一个5层的栈式自编码深度神经网络,对恒星大气物理参数进行自动估计,网络各层的节点数分别为3821-500-100-50-1.使用美国大型巡天项目Sloan发布的Sloan Digital Sky Survey(SDSS)实测光谱以及由Kurucz的New Opacity Distribution Function(NEWODF)模型得到的理论光谱进行了实验验证,对有效温度(Teff)、表面重力加速度(lg g)和金属丰度([Fe/H])3个物理参数进行了自动估计.结果表明,栈式自编码深度神经网络的估计精度较好,其中在SDSS数据上的平均绝对误差分别为:79.95(Teff/K),0.0058(lg(Teff/K)),0.1706(lg(g/(cm·s^(-2)))),0.1294 dex([Fe/H]);在理论数据上的平均绝对误差分别是:15.34(Teff/K),0.0011(lg(Teff/K)),0.0214(lg(g/(cm·s^(-2)))),0.0121 dex([Fe/H]).
文摘多任务学习(Multi-task Learning,MTL)就是把多个问题一起进行分析、计算,以发掘不同问题之间的相关性,提高分析结果的精度,该类方法已被广泛地应用于机器学习、模式识别、计算机视觉等领域.使用多任务学习方案研究了恒星大气物理参数中表面温度(Teff)、表面重力加速度(lg g)、化学丰度([Fe/H])的估计问题.首先使用多任务Sparse Group Lasso算法提取对3个大气物理参数均有预测能力的光谱特征;然后使用支持向量机估计恒星大气物理参数.该方案在Sloan实测恒星光谱和理论光谱上均做了测试.在实测光谱上的平均绝对误差分别为:0.0064(lg(Teff/K)),0.1622(lg(g/(cm·s^(-2)))),0.1221 dex([Fe/H]).在由Kurucz的New Opacity Distribution Function(NEWODF)模型得到的理论光谱上也做了同样的特征提取和恒星大气物理参数估计测试,相应的平均绝对误差分别为:0.0006(lg(Teff/K))),0.0098(lg(g/(cm·s^(-2)))),0.0082 dex([Fe/H]).通过与文献中的同类研究比较表明,多任务Sparse Group Lasso特征提取与支持向量机回归(support vector machine regression,SVR)两者结合的方案有较高的恒星大气物理参量估计精度.
文摘天体光谱分类是天文学研究的重要内容之一,其关键是从光谱数据中选择和提取对分类识别最有效的特征构建特征空间.提出一种新的基于2维傅里叶谱图像的特征提取方法,并应用于LAMOST (the Large Sky Area Multi-Object Fiber Spectroscopic Telescope)恒星光谱数据的分类研究中.光谱数据来源于LAMOST Data Release 5(DR5),选取30000条F、 G和K型星光谱数据,利用短时傅里叶变换(Short-Time Fourier Transform, STFT)将1维光谱数据变换成2维傅里叶谱图像,对得到的2维傅里叶谱图像采用深度卷积网络模型进行分类,得到的分类准确率是92.90%.实验结果表明通过对LAMOST恒星光谱数据进行STFT可得到光谱的2维傅里叶谱图像,谱图像构成了新的光谱数据特征和特征空间,新的特征对于光谱数据分类是有效的.此方法是对光谱分类的一种全新尝试,对海量天体光谱的分类和挖掘处理有一定的开创意义.