近幾年,人工智能越來越多應用於天文學研究。深度學習需要海量數據,而天文學正是AI大顯身手的領域。機器可以替人類從茫茫大海裏撈針,捕捉到新的恒星、新的地外行星甚至暗物質。 尋找暗物質,機器比人的眼神好。近期《計算天體物理學和宇宙學》發表的一篇論文顯示,美國勞倫茲伯克利國家實驗室(以下簡稱“伯克利實驗室”)等機構共同研制的深度學習AI框架,能夠探尋宇宙裏暗物質的跡象。
辨認“引力透鏡”,AI立功了
尋找“引力透鏡”是研究暗物質分布的基本方法。巨大質量的物體會像透鏡一樣扭曲路過的光線,找出這種扭曲就能捕捉到不發光的質量物。
論文顯示,伯克利實驗室建立的深度學習AI框架CosmoGAN,可以分析引力透鏡與暗物質的關聯。它可以創建高保真、弱引力透鏡收斂圖。
曾幾何時,尋找“引力透鏡”所需的模擬和數據處理很麻煩。20名科學家花費了好幾個月的時間只能查看一小塊空間圖像。物理模擬需要數十億個計算小時,占用數兆字節的磁盤空間。
神經網絡的進步提供了機會。伯克利實驗室領導的團隊引入一種“生成性對抗網絡(GANs)”。研究者穆斯塔法說:“也有別的深度學習方法可以從許多圖像中得到收斂圖,但與競爭方法相比,GANs生成非常高分辨率的圖像,同時仍有神經網絡的高效率。”
現在,天文學家可以用CosmoGAN分析大得多的天區,速度也更快。
CosmoGAN不是唯一取得進展的天文學深度學習神經網絡。比如多倫多大學利用深度學習技術解析月球隕石坑的衛星圖像,P8超級計算機的神經網絡在僅僅幾個小時內發現6000個新的隕石坑,是過去幾十年中人類發現隕石坑數量的2倍。伊利諾伊大學厄巴納-香檳分校利用深度學習來探測和分析黑洞碰撞的引力波。AI在天文學遍地開花。
數據太多,沒機器玩不轉
過去幾年裏,天文領域的大多數方向都在嘗試使用人工智能。考慮到天文學要處理的數據之多,這是一個很自然的思路。讓機器練習去分析蛛絲馬跡,不如此,未來的天文學將無法運轉。
不久前舉辦的2019年GPU技術大會吸引了全世界的人工智能學者。大會請來加州大學聖克魯茲分校的天文學家布蘭特·羅伯特森演講,他指出:“天文學正在一場新的數據革命的風口”。羅伯特森認為,新一代天文儀器必須配合由深度學習驅動的新一代軟件。
比如預計在3年後運行的大口徑全天巡視望遠鏡(LSST)。它巡視南天那一半宇宙中的370億個星系,生成一部時長十年的不間斷視頻。LSST配備的是32億像素的相機,每晚產生25TB的數據,相當於現在先進天文望遠鏡一生貢獻的所有數據。
再比如平方公裏陣列射電望遠鏡(SKA)。它遍布全球,一部分天線在非洲南部8國部署,還有100多萬天線位於澳大利亞和新西蘭。它的原始數據每天達到5千個PB,處理後也有50個PB左右。
“暗能量巡天”編制幾億個星系的星圖;“蓋亞”衛星測繪銀河系數十億恒星;“茲威基”項目每小時能夠掃描3750平方度的天區。在中國,FAST每天的數據量將達150TB;郭守敬望遠鏡觀測了901萬條光譜,是世界上最大的天體光譜庫……
捕捉人類看不出的模式
數據越來越多,科學家試圖聚合它們。但在GPU大會上,羅伯特森說,未來幾個大型天文望遠鏡一起產生大量數據,聚合之後複雜到人類無法直接利用。而加州大學聖克魯斯分校的科學家試圖解決這個問題。計算機科學系一名博士生創建的Morpheus深度學習框架,可以基於望遠鏡的原始數據,逐像素地分類天體。
加州大學聖克魯茲分校的科學家們還用AI更好地研究星系的形成。在他們2019年初發表的一項研究中,科學家用計算機模擬的星系訓練計算機,讓它學習星系演化的三個關鍵階段。後來計算機分析來自哈勃太空望遠鏡的星系圖像,表現出奇好。
人工智能應用於人臉識別,在海量數據訓練後,可以根據一張照片,認出這個人化妝和年老時候的樣子。而宇宙中很多圖像也可用同樣的方法來歸類。
“深度學習可以尋找模式,機器能看到非常複雜的模式,而人類看不到。”參與研究的科學家大衛·庫說,“我們希望進一步測試這種方法。在概念驗證研究中,機器似乎成功地在數據中找到了模擬中確定的星系演化的不同階段。”
幫天文學家找到另一個太陽系
2018年底的一篇報道顯示,穀歌人工智能發力,從開普勒系外行星觀測數據庫裏找到了新的行星。行星是很難尋找的。位於太空的開普勒衛星觀察145000顆類似太陽的恒星,從恒星亮度微弱變化來發現行星。記錄4年的數據中,包括大約35000個疑似的行星記錄。天文學家用機器結合人眼來識別,但最暗最弱的信號常被忽略。
在穀歌AI的幫助下,我們發現了開普勒90i和開普勒80g兩顆新行星。也讓開普勒90被確認為第一個至少擁有8顆行星的外星系。
神經網絡和機器學習處理了140億個數據點,之後成功篩選出了候選者。
NASA和穀歌說,未來新技術將找到更多系外行星。NASA還表示不用擔心天文學家失業。NASA的科學家傑西·道特森解釋表示,數據提供給神經網絡之前,需要天文學家進行分類,以便人工智能可以從中學習分析出新的信息。
道特森說:“AI以後絕對會和天文學家一起工作,成為必不可少的工具。”
當然,機器學習也帶來“黑盒子”風險:我們得到了答案,但我們不知道機器為何如此判斷,或許答案是錯的。機器也會犯錯。天文學家將繼續訓練和適應它。
延伸閱讀
專家點評
深度學習還不具備“物理直覺”
確實,現在人工智能已經深入到了天文天體物理學的各個分支領域。目前,美國勞倫茲伯克利國家實驗室利用深度學習,能夠快速根據宇宙三維密度分布,判斷暗物質、暗能量等宇宙學基本常數,他們發現應用人工智能之後,統計量誤差比先前應用傳統統計學辦法小不少。此外,我們也利用深度學習在極低信噪比的光譜中尋找宇宙早期的氫、碳元素,發現比傳統方法也要好用。
同時,天文學家們也在應用深度學習,幫助我們判斷天體的三維位置、遠近,進而勾勒出三維空間的大尺度結構。人們發現深度學習在對數據信息的挖掘方面,可能強於我們之前所用的傳統方法。人工智能也被穀歌公司應用到探測系外行星的領域,並成功探測到了幾個系外行星……可以說,人工智能如今在天體物理的前沿領域被廣泛應用。
但從物理學家的角度看,基於深度學習的人工智能也許也有其局限性。這種局限性在於它只能基於數據、在已經被定義得非常明確的特定領域內發揮作用。只能在物理學家的指導下,把統計量的誤差棒做得更小,估計某個量更精准,而目前尚無法指導我們發現數據背後的新物理規律。也不具備人類才有的,基於美、對稱和簡潔的“物理直覺”。
舉一個最簡單的例子,比如說開普勒基於第穀的觀測數據,可以發現開普勒第三定律,而目前再好的機器學習、人工智能算法可能也很難基於相同數據,重複這個發現。
所以說我認為深度學習在天文中應用的本質,目前還局限在做更好的統計和擬合這個方面。