期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于t-SNE的恒星光谱降维与分类研究 被引量:4
1
作者 姜斌 赵梓良 +2 位作者 王淑婷 韦纪宇 曲美霞 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2020年第9期2913-2917,共5页
随着天文学的发展以及天文望远镜观测能力的提升,国内外许多大型巡天望远镜将产生PB级的恒星光谱数据。恒星光谱是来自恒星的电磁辐射,通常由连续谱与吸收线叠加而成,其差异源于恒星的有效温度、表面重力加速度以及元素的化学丰度等。... 随着天文学的发展以及天文望远镜观测能力的提升,国内外许多大型巡天望远镜将产生PB级的恒星光谱数据。恒星光谱是来自恒星的电磁辐射,通常由连续谱与吸收线叠加而成,其差异源于恒星的有效温度、表面重力加速度以及元素的化学丰度等。恒星光谱自动分类是天文数据处理的一项重要研究内容,是研究恒星演化和参数测量的基础。海量的恒星光谱对分类方法提出了高效、准确的要求。传统的人工分类方法存在速度慢、精度低等缺点,已经无法满足海量恒星光谱特别是低信噪比恒星光谱自动分类的实际需要,机器学习算法目前已经被广泛地应用于恒星光谱分类。恒星光谱的一个显著特征是数据维度较高,降维不但可以实现特征提取,而且可以降低计算量,是光谱分类的首要任务。传统的线性降维方法如主成分分析仅依据方差对光谱进行降维,不同类型的光谱在投影到低维特征空间后会出现交叉现象,而流形学习能够产生优良的分类边界,很好地避开重叠,有利于后续的分类。针对光谱数据维度较高的特点,研究了光谱数据在高维空间内的分布以及流形学习对高维线性数据降维的原理,比较了t-SNE和主成分分析两种降维方法对光谱数据降维的效果,并使用基于属性值相关距离的改进的K近邻算法进行光谱分类,最终对实验结果进行了分析并使用多种机器学习分类器进行比较和验证。采用Python语言及Scikit-learn第三方库实现了算法,对SDSS的12 000条低信噪比的恒星光谱进行实验,最终实现了光谱数据的高精度自动处理和分类。实验结果表明,对于光谱数据的降维处理,基于流形学习的t-SNE方法能够在高维光谱数据中恢复低维流形结构,即找出高维空间中的低维流形,并解出与之对应的嵌入映射,在降维过程中最大程度地保留不同类别光谱样本之间的差异从而产生明显的分类边界。特征提取后,使用机器学习分类器能够在测试数据集上达到满意的分类准确率。所使用的方法也可以应用于其他的巡天望远镜产生的海量光谱的自动分类以及稀少天体的数据挖掘。 展开更多
关键词 流形学习 恒星光谱分类 数据降维 K近邻算法
下载PDF
一种基于卷积神经网络的恒星光谱快速分类法 被引量:2
2
作者 王楠楠 邱波 +3 位作者 马杰 石超君 宋涛 郭平 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2019年第10期3297-3301,共5页
恒星光谱数据的分类是天体光谱自动识别的最基本任务之一,光谱分类的研究能够为恒星的演化提供线索。随着科技的发展,天文数据也向大数据时代迈进,需要处理的恒星光谱数量越来越多,如何对其进行自动而精准地分类成为了天文学家要解决的... 恒星光谱数据的分类是天体光谱自动识别的最基本任务之一,光谱分类的研究能够为恒星的演化提供线索。随着科技的发展,天文数据也向大数据时代迈进,需要处理的恒星光谱数量越来越多,如何对其进行自动而精准地分类成为了天文学家要解决的难题之一。当前恒星光谱自动分类问题的解决方法相对较少,为此本文使用了一种基于卷积神经网络的方法对恒星光谱MK系统进行分类。该网络由数据输入层、四个卷积层、四个池化层、全连接层、输出层构成,与传统网络相比具有局部感知、参数共享等优点实验。在Python3.5的环境下编程,利用Tensorflow构建了一个简单高效的具有四个卷积层的卷积神经网络,并将Dropout作用于全连接层之后以防止过度拟合。Dropout的基本思想:当网络模型进行训练时,把一些神经网络节点按一定的比例丢弃,使其暂时不发挥作用。Dropout可以理解成是一种十分高效的神经网络模型平均方法,由于它不依赖于某些局部特征所以能够让网络模型更加鲁棒。实验中使用的一维恒星光谱图是取自LAMOSTDR3数据库,首先进行预处理截取光谱3600~7300的部分,均匀采样后使用min-max标准化法对其进行初始化。实验包括两部分:第一部分为依据恒星光谱MK系统对光谱进行分类,每一类的训练样本包含1000条光谱数据,测试样本为400条光谱数据,首先通过训练样本对CNN网络进行训练,进行3000次的迭代,用训练后的网络将测试样本进行分类以验证网络的准确性;第二部分为相邻两类的恒星光谱的分类,其中O型星数据集样本为250条光谱,其余类别恒星样本数据集均为4000条光谱,将数据5等分,每次选取当中的一份当作测试集,其余部分当作训练集,采用5折交叉验证法求得模型准确率,用BP神经网络进行对比实验。选择对网络模型进行评估的指标包括精确率P、召回率R、F-score、准确率A。实验结果显示CNN在对六类恒星光谱进行分类时其准确率都在95%以上,在对相邻类别的恒星进行分类时,由于O型星样本量较少,所以得到的分类结果不太理想,对其余类别的恒星分类准确率都高于98%,以上结果都证明了CNN算法能够很好地解决恒星光谱的分类问题。 展开更多
关键词 恒星光谱数据 自动分类 CNN 5折交叉验证
下载PDF
交叉验证的BP神经网络恒星光谱分类 被引量:2
3
作者 刘曼云 赵正旭 +2 位作者 郭阳 赵士伟 曹子腾 《计算机系统应用》 2020年第5期11-18,共8页
LAMOST作为国家重大科学工程项目,目前在世界上对光谱的观测、获取率最高,为天文学的研究与发展提供大量的数据和信息资源.根据LAMOST发布的恒星光谱数据文件,从中提取出关于恒星光谱波长的数据信息,对数据进行噪声剔除、数据降维、数... LAMOST作为国家重大科学工程项目,目前在世界上对光谱的观测、获取率最高,为天文学的研究与发展提供大量的数据和信息资源.根据LAMOST发布的恒星光谱数据文件,从中提取出关于恒星光谱波长的数据信息,对数据进行噪声剔除、数据降维、数据规范化、数据降维处理.利用BP神经网络算法对数据进行分类处理,根据分类结果正确率来判断BP神经网络模型的优劣.但是BP神经网络对测试集数据的测试效果并不代表对其他数据具有同样的测试效果而且易产生过拟合,所以采用交叉验证与BP神经网络相结合的方法,BP神经网络算法可对多组不同的数据进行测试,得到多组测试结果并求得平均值,可得到BP神经网络模型相对稳定的测试结果并降低结果的随机性. 展开更多
关键词 LAMOST 光谱数据 恒星光谱分类 交叉验证 BP神经网络
下载PDF
LAMOST恒星光谱数据分析 被引量:4
4
作者 刘曼云 赵正旭 +2 位作者 王威 曹子腾 赵士伟 《信息技术与信息化》 2019年第11期193-197,共5页
天文学界对天文学的研究是无止境的,天文学问题的亟待解决需要更多的信息资源,而对观测天体仪器的精度要求也越来越高。我国LAMOST的综合观测水平处于国际领先水平,其每夜的光谱观测量高达数万条,为天文学的发展提供了信息资源。恒星光... 天文学界对天文学的研究是无止境的,天文学问题的亟待解决需要更多的信息资源,而对观测天体仪器的精度要求也越来越高。我国LAMOST的综合观测水平处于国际领先水平,其每夜的光谱观测量高达数万条,为天文学的发展提供了信息资源。恒星光谱中包含着关于恒星的诸多属性信息,通过对恒星光谱数据的研究与分析,找出数据信息中的联系,发掘出与恒星种类相关的恒星光谱数据以及不同恒星光谱具有的光谱数据特点。 展开更多
关键词 LAMOST 恒星光谱 FITS文件 光谱数据 光谱类型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部