科技的突破不斷改變我們的生活面向,人工智慧的潮流已逐漸為各領(lǐng)域技術(shù)開(kāi)發(fā)創(chuàng)造許多新的可能性。Google持續(xù)探索機(jī)器學(xué)習(xí)如何運(yùn)用至發(fā)掘天文探索的相關(guān)研究,并且有新進(jìn)展。
 |
Google Brain研究團(tuán)隊(duì)資深軟體工程師 Chris Shallue分享機(jī)器學(xué)習(xí)在天文領(lǐng)域的探索應(yīng)用。 |
天文領(lǐng)域神秘浩瀚,天文學(xué)家利用克卜勒太空??遠(yuǎn)鏡(Kepler space telescope)來(lái)進(jìn)行研究,4 年期間搜集超過(guò) 20 萬(wàn)顆恒星的亮度,而平均 30 分鐘記錄一次每顆恒星的亮度,每顆恒星至今已記錄大約 7 萬(wàn)次亮度,透過(guò)克卜勒太空??遠(yuǎn)鏡所偵測(cè)到恒星各個(gè)訊號(hào)點(diǎn)形成的亮度曲線(light curve)來(lái)判斷,然而有許多現(xiàn)象會(huì)造成偵測(cè)的恒星亮度變?nèi)酰e例來(lái)說(shuō),恒星上的斑點(diǎn)(稱為黑斑或星斑)或是人造的太空載具運(yùn)行(太空船)時(shí)會(huì)轉(zhuǎn)動(dòng)讓太陽(yáng)能板保持面向太陽(yáng)。
克卜勒任務(wù)(Kepler mission)為 2009 年 5 月開(kāi)始的計(jì)畫,天文學(xué)家以人工的方式進(jìn)行檢查,超過(guò) 3 萬(wàn)個(gè)透過(guò)克卜勒太空??遠(yuǎn)鏡所偵測(cè)到的訊號(hào),而且約有 2500 個(gè)訊號(hào)被認(rèn)定為行星,但由於耗時(shí)且許多較弱的訊號(hào)同時(shí)也有較多雜訊,太多雜訊會(huì)導(dǎo)致無(wú)法人工檢查判別是否為行星或是造成誤判。
Google Brain研究團(tuán)隊(duì)資深軟體工程師Chris Shallue表示,天文學(xué)家傳統(tǒng)在尋找行星的作法分為兩階段:1.透過(guò)電腦演算法找出潛在行星訊號(hào);2.由天文學(xué)家判斷哪些訊號(hào)是來(lái)自真實(shí)的行星。然而在許多情況下,當(dāng)人類無(wú)法人工檢查或處理龐大資料時(shí),運(yùn)用機(jī)器學(xué)習(xí)技術(shù)能夠提供更好的解決方案協(xié)助。
神經(jīng)網(wǎng)路為機(jī)器學(xué)習(xí)的一種運(yùn)算模型,能夠有效的辨識(shí)圖像,因此Google將此運(yùn)算模型套用至探索行星當(dāng)中,建立一個(gè)神經(jīng)網(wǎng)路來(lái)分類克卜勒的訊號(hào)。卷積神經(jīng)網(wǎng)路(convolutional neural network)為一種特定的神經(jīng)網(wǎng)路,通常 用於圖像分類,例如 Google 相簿。Chris Shallue表示,目前Google利用 15,000 個(gè)天文學(xué)家已人工標(biāo)記的克卜勒訊號(hào)來(lái)訓(xùn)練模型,亦即透過(guò)訓(xùn)練卷積神經(jīng)網(wǎng)路來(lái)預(yù)測(cè)偵測(cè)到的訊號(hào)為行星的機(jī)率有多少。
在訓(xùn)練模型後,透過(guò)模型搜尋克卜勒資料庫(kù)中的 670 個(gè)恒星并藉此辨別新行星,發(fā)現(xiàn)了克卜勒-90 i 和克卜勒-80 g兩大行星。其中,克卜勒-90 i 是在克卜勒 90 星系中第八個(gè)被發(fā)現(xiàn)的行星,而克卜勒 90 星系更是目前已知第一個(gè)與我們所處的太陽(yáng)系同樣擁有 8 顆行星數(shù)的星系,至於克卜勒-90 i 是克卜勒 90 星系中最小的一顆星球,而克卜勒-90 i是距離其恒星第三靠近的行星。
目前尚未能夠解決的問(wèn)題之一是假陽(yáng)性預(yù)測(cè)(background false positives)。舉例來(lái)說(shuō),有可能偵測(cè)到一顆恒星的亮度其實(shí)是來(lái)自附近恒星的亮度(受到光影的影響),以現(xiàn)階段來(lái)說(shuō),模型還無(wú)法辨別行星的訊號(hào)是來(lái)自哪一顆恒星。現(xiàn)今仍仰賴以人工方式來(lái)確認(rèn)模型偵測(cè)到的行星位置訊號(hào),未來(lái)希??可以將位置資訊結(jié)合制模型當(dāng)中,讓模型可以辨別這類的訊號(hào)。
下一個(gè)目標(biāo)是運(yùn)用模型運(yùn)算整個(gè)克卜勒資料庫(kù)中超過(guò) 20 萬(wàn)顆的恒星,而現(xiàn)在已在 20 萬(wàn)顆恒星中探索 670 個(gè),此外更發(fā)現(xiàn)了兩顆新行星。Chris Shallue表示,人類和模型判讀資料的方式不同,天文科學(xué)家看訊號(hào)的強(qiáng)弱來(lái)判定結(jié)果,但若是不易分辨就需要好幾個(gè)小時(shí),而藉由機(jī)器學(xué)習(xí)判斷則不須1秒鐘,雖然現(xiàn)今是建立機(jī)器學(xué)習(xí)模型辨識(shí)篩選數(shù)據(jù),找到架構(gòu)和最適合的模型讓天文科學(xué)家判斷結(jié)果。
Google臺(tái)灣董事總經(jīng)理簡(jiǎn)立峰表示,AI對(duì)於人類的影響可見(jiàn),跨領(lǐng)域研究值得發(fā)展與重視,資料與工具的方便,對(duì)於跨領(lǐng)域研究會(huì)有更大的貢獻(xiàn),他強(qiáng)調(diào)開(kāi)放原始碼的重要性,他表示Google研究機(jī)器學(xué)習(xí)工具與實(shí)驗(yàn)數(shù)據(jù)并且開(kāi)放原始碼,在於開(kāi)放環(huán)境回??給社群持續(xù)研究,未來(lái)當(dāng)使用工具更加簡(jiǎn)便,讓科學(xué)家得以自行操作,而無(wú)須軟體工程師從旁協(xié)助後再驗(yàn)證,相信研究成果會(huì)更加突破。