當AI能夠自主完成科學研究和論文撰寫,科學開源是家還否將顛覆人類的科學研究活動?
8月13日,全球首個全自動科學發現AI系統——“AI科學家”(AI Scientist)發布,科學開源該系統由日本初創公司Sakana AI與牛津大學、家還哥倫比亞大學學者合作研發,科學開源能夠獨立完成科學研究的家還全過程,包括創意生成、科學開源代碼編寫、家還實驗執行、科學開源結果總結和論文撰寫。家還
“AI科學家”展示了一個人工智能自主進行研究、科學開源總結、家還審閱、科學開源反饋、家還迭代的科學開源全新科研模式。其研究過程包括創意生成、實驗迭代、論文撰寫和自動化審稿四個階段。
創意生成階段,系統基于現有主題的起始代碼模板進行頭腦風暴,并在語義學者數據庫(Semantic Scholar)中搜索以確保原創性。
實驗迭代過程中,系統自主編寫代碼、執行實驗,并制作可視化圖表,對結果進行分析。
論文撰寫階段,系統按照標準機器學習會議論文的風格,以LaTeX格式(一種排版方式,適合于生成包含復雜數學公式、圖表、參考文獻和具有嚴格的格式要求的學術和技術文檔)撰寫進展報告,還會自主使用語義學者數據庫(Semantic Scholar)搜索并引用相關文獻。
更為關鍵的是自動化論文評審環節,Sakana AI 開發了自動審稿人系統,能夠以接近人類的準確度評估生成的論文。生成的評審意見既可用于改進項目,也可作為對后續構思的反饋。這意味著,可形成持續的反饋循環,實現了一個閉環的科研生態系統。
在這樣一套全自動科研體系下,“AI科學家”可以在一周內產生數百篇中等質量的論文。根據自動審稿系統的評估,個別論文質量甚至可達頂級機器學習會議的接受門檻。
“AI科學家”主要應用于機器學習研究,已在擴散建模、Transformer建模和神經網絡學習動態等領域有所貢獻。目前,它每篇論文的生成成本可控制在15美元以下,而且能以7×24小時開展科研活動,未來也有可能應用到機器學習研究之外的領域。
盡管仍存在無法處理視覺信息、與基線不公平比較、產生幻覺等局限性,“AI科學家”生成的論文可以提供廣泛的信息和創新性,或至少包含未來研究的潛在價值。
更重要的是,這套完全由 AI 驅動的科學生態系統,已全部開源。(開源地址:https://github.com/SakanaAI/AI-Sci