想象一下,星团(tuán)、星云和其他星际现象都是由计(jì)算机在无人监督的(de)情况下凭空生成的(de)。这听起来可(kě)能像(xiàng)是对未来(lái)全息(xī)技术(shù)的描述,但是爱(ài)丁堡(bǎo)大学感知研究所和天文学研(yán)究所的研究人员,就在(zài)人工智能的帮助下设计了这样一个系统。
研(yán)究人员(yuán)描(miáo)述(shù)了一种人工智能(néng)模型,该模型能够生成合成星(xīng)系的高分辨率图(tú)像,这些图像遵循了真实的星系分布。
“21世纪(jì)的天文学(xué)发现自(zì)己拥有大量数据,大部分数据在捕(bǔ)获时会被过(guò)滤掉,以(yǐ)节省(shěng)内存(cún)存储,”他们写道。“对于深度学习等现(xiàn)代技术来说,进入这一领(lǐng)域(yù)的时机已经成熟。星系在这类应用中起了关键作用,我们探(tàn)索了利(lì)用人工智能来生成(chéng)星系图像(xiàng)的(de)可能(néng)性。”
该团队机器学习架构的核心是生成(chéng)对抗性网络(GAN)——由生成样本的生成器和试图区分生成(chéng)样本(běn)和真实样本的鉴别器(qì)组成的(de)两部分神经网络。将GAN描(miáo)述为AI算法中的“神(shén)童(tóng)”并不夸张;它们被用来发现新药,制作令人信服的汉堡和蝴蝶照片(piàn),甚至生成(chéng)脑癌的(de)人(rén)工扫描图。
这一星(xīng)系(xì)生成系统由两个(gè)五层GANs组成:阶段一GAN和阶段二GAN。第(dì)一个生成(chéng)低分辨率图像(64x64像素),而第二个(gè)使用(yòng)一种叫做超分辨率的技术(shù)将(jiāng)它们转换成高分辨(biàn)率图像(128x128像素)。研究人员指出,在(zài)实(shí)际过程中,阶(jiē)段二GAN会自我填充缺失的像素(sù),更加注(zhù)重现实性而(ér)非准确性。
为了“鼓励”阶段二GAN中的生(shēng)成(chéng)器生成类(lèi)似于(yú)放大实像对应物的合成星系图(tú)像,该论文作(zuò)者引入了(le)一个“双目标函数”,该函数计算了分辨率增强图(tú)像和实像之间的误差标准。其结果是(shì)生成了(le)大量(liàng)保留星(xīng)系“更稀有”特征(zhēng)的样本,如旋臂。
研究人员使用英伟达GTX 1060 GPU在PC上训练人工智能系(xì)统,并为其提供来自(zì)Galaxy Zoo 2数据集的(de)恒(héng)星和(hé)行星体的全色图像,Galaxy Zoo 2是一(yī)个众包天文学项目。他们在评估结果(guǒ)时考虑(lǜ)了四(sì)个(gè)属性(xìng):椭(tuǒ)圆(yuán)度,或(huò)偏离圆形度的(de)程度;与(yǔ)水平面的仰角;总流量;以及(jí)半长轴(椭圆最长直(zhí)径(jìng)的(de)一半)的尺寸测量。
在论文的(de)最后(hòu),研究人员写道,该模型生成了非常类似(sì)真实星系“物理真实”的图(tú)像。他们认为,这一系(xì)统可以被(bèi)用(yòng)来扩充真(zhēn)实样本的数据库,实际(jì)上这也是(shì)深度学习模型的数据源。
“能够创建物(wù)理真(zhēn)实(shí)的(de)星系图像生成模型有许多(duō)实际用途,”他们写道。“我们的工作(zuò)展示了(le)GAN架(jià)构作为现代天文学宝贵工具的潜(qián)力。”