當(dāng)AI能夠自主完成科學(xué)研究和論文撰寫(xiě),科學(xué)開(kāi)源是家還否將顛覆人類的科學(xué)研究活動(dòng)?
8月13日,全球首個(gè)全自動(dòng)科學(xué)發(fā)現(xiàn)AI系統(tǒng)——“AI科學(xué)家”(AI Scientist)發(fā)布,科學(xué)開(kāi)源該系統(tǒng)由日本初創(chuàng)公司Sakana AI與牛津大學(xué)、家還哥倫比亞大學(xué)學(xué)者合作研發(fā),科學(xué)開(kāi)源能夠獨(dú)立完成科學(xué)研究的家還全過(guò)程,包括創(chuàng)意生成、科學(xué)開(kāi)源代碼編寫(xiě)、家還實(shí)驗(yàn)執(zhí)行、科學(xué)開(kāi)源結(jié)果總結(jié)和論文撰寫(xiě)。家還
“AI科學(xué)家”展示了一個(gè)人工智能自主進(jìn)行研究、科學(xué)開(kāi)源總結(jié)、家還審閱、科學(xué)開(kāi)源反饋、家還迭代的科學(xué)開(kāi)源全新科研模式。其研究過(guò)程包括創(chuàng)意生成、實(shí)驗(yàn)迭代、論文撰寫(xiě)和自動(dòng)化審稿四個(gè)階段。
創(chuàng)意生成階段,系統(tǒng)基于現(xiàn)有主題的起始代碼模板進(jìn)行頭腦風(fēng)暴,并在語(yǔ)義學(xué)者數(shù)據(jù)庫(kù)(Semantic Scholar)中搜索以確保原創(chuàng)性。
實(shí)驗(yàn)迭代過(guò)程中,系統(tǒng)自主編寫(xiě)代碼、執(zhí)行實(shí)驗(yàn),并制作可視化圖表,對(duì)結(jié)果進(jìn)行分析。
論文撰寫(xiě)階段,系統(tǒng)按照標(biāo)準(zhǔn)機(jī)器學(xué)習(xí)會(huì)議論文的風(fēng)格,以LaTeX格式(一種排版方式,適合于生成包含復(fù)雜數(shù)學(xué)公式、圖表、參考文獻(xiàn)和具有嚴(yán)格的格式要求的學(xué)術(shù)和技術(shù)文檔)撰寫(xiě)進(jìn)展報(bào)告,還會(huì)自主使用語(yǔ)義學(xué)者數(shù)據(jù)庫(kù)(Semantic Scholar)搜索并引用相關(guān)文獻(xiàn)。
更為關(guān)鍵的是自動(dòng)化論文評(píng)審環(huán)節(jié),Sakana AI 開(kāi)發(fā)了自動(dòng)審稿人系統(tǒng),能夠以接近人類的準(zhǔn)確度評(píng)估生成的論文。生成的評(píng)審意見(jiàn)既可用于改進(jìn)項(xiàng)目,也可作為對(duì)后續(xù)構(gòu)思的反饋。這意味著,可形成持續(xù)的反饋循環(huán),實(shí)現(xiàn)了一個(gè)閉環(huán)的科研生態(tài)系統(tǒng)。
在這樣一套全自動(dòng)科研體系下,“AI科學(xué)家”可以在一周內(nèi)產(chǎn)生數(shù)百篇中等質(zhì)量的論文。根據(jù)自動(dòng)審稿系統(tǒng)的評(píng)估,個(gè)別論文質(zhì)量甚至可達(dá)頂級(jí)機(jī)器學(xué)習(xí)會(huì)議的接受門(mén)檻。
“AI科學(xué)家”主要應(yīng)用于機(jī)器學(xué)習(xí)研究,已在擴(kuò)散建模、Transformer建模和神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)動(dòng)態(tài)等領(lǐng)域有所貢獻(xiàn)。目前,它每篇論文的生成成本可控制在15美元以下,而且能以7×24小時(shí)開(kāi)展科研活動(dòng),未來(lái)也有可能應(yīng)用到機(jī)器學(xué)習(xí)研究之外的領(lǐng)域。
盡管仍存在無(wú)法處理視覺(jué)信息、與基線不公平比較、產(chǎn)生幻覺(jué)等局限性,“AI科學(xué)家”生成的論文可以提供廣泛的信息和創(chuàng)新性,或至少包含未來(lái)研究的潛在價(jià)值。
更重要的是,這套完全由 AI 驅(qū)動(dòng)的科學(xué)生態(tài)系統(tǒng),已全部開(kāi)源。(開(kāi)源地址:https://github.com/SakanaAI/AI-Sci