联系我们

数据科学

神经网络用于帮助构建宇宙的3D地图

mm

已发表

 on

夏威夷大学天文系的天文学家 made use of AI 地图绘制算法可构建超过30亿个天体的大规模3D地图。天文学团队利用光谱数据和神经网络分类算法来完成任务。

早在2016年,来自夏威夷大学马诺阿分校(UHM)天文研究所的天文学家就向公众发布了一个庞大的数据集,其中包含超过30亿颗恒星,星系和其他天体的观测数据,这些数据是在4年的观测中收集的,其中大约三夜空的四分之一。该项目称为Pan-STARRS项目,其产生的数据集大小约为2 PB(两百万GB)。

就像马克斯·普朗克天文学研究所的星系和宇宙学系主任汉斯·沃尔特·里克斯解释的那样 根据Phys.org:

“Pan-STARRS1将我们的家乡银河系映射到前所未有的细节水平。这项调查首次提供了银河系平面和磁盘很大一部分的深度和全局视图……其独特的成像深度,面积和颜色组合使它能够发现大多数最遥远的类星体:这些是我们宇宙中最早出现在星系中心的黑洞的例子”.

释放数据集的目的之一是将其用于构建可观察天空的地图,对数据集中观测到的许多光点进行分类。参与Pan-STARRS项目的研究人员使用数据集进行训练 机器学习 他们可以用来生成地图的算法。

夏威夷大学的研究人员使用位于夏威夷大岛的PS1望远镜工作。 PS1可以扫描大约75%的可观察天空。望远镜是世界上最大的深彩色光学调查,研究人员希望利用这种力量来构建复杂的星空图。这涉及到训练PS1的计算机对物体进行分类,从而将一种天体与另一种天体区分开。他们用来训练计算机的数据集包含数以百万计的测量结果,其特征包括大小和颜色。

所使用的AI算法是常规前馈神经网络,结合了使网络学习数百万个数据点之间复杂关系的优化方法。 UHM天文研究所的前宇宙学博士后Robert Beck解释说,最先进的优化算法用于在计算机上训练由数据集描述的大约400万个天体。 正如TechExplorist报道的那样, 研究小组还必须纠正银河系中的尘埃干扰。研究团队使用蒙特卡洛采样方法来估算由于 光度红移 (估计物体的速度),然后在光谱数据上训练机器学习模型。

训练模型后,在验证数据集上检查其性能。该网络成功识别出约96.6%的类星体,97.8%的恒星和98.1%的星系。此外,该模型还预测了到星系的距离,当检查时,预测仅偏离了大约3%。

人工智能培训和利用的最终结果是 世界上最大的恒星,类星体和星系3D目录。该研究的合著者肯尼斯·钱伯斯(Kenneth Chambers)解释说, 如Gizmodo所引用,随着收集到越来越多的数据,应该能够再次使用用于生成地图的模型,从而进一步改善地图并增强我们对太阳系和宇宙的了解。科学家将能够使用该地图获得有关宇宙形状的见解,并确定我们的宇宙学模型在哪些方面与新的预测不一致。