AlphaEvolve:谷歌 DeepMind 的 AI 突破,科學發展的「神之一手」?
大家好,本篇文章將探討谷歌 DeepMind 最新發布的 AlphaEvolve,這個 AI 系統不僅能解決人類設定的問題,還能主動發現數學領域的突破,甚至優化數據中心的計算效率。本文將結合知名播客《Machine Learning Street Talk》對其背後兩位核心研究員亞歷山大·諾維科夫 (Alexander Novikov) 和馬特·巴洛格 (Matej Balog) 的採訪,以及 AlphaEvolve 的論文,深入介紹這項可能影響未來科學發展的技術。
AlphaEvolve 的驚人能力
-
矩陣乘法優化: 自 1969 年以來,4x4 矩陣乘法的最佳運算次數一直停留在 49 次乘法。AlphaEvolve 基於 Alpha Tensor 框架,通過自我對弈生成的算法,將乘法次數減少到 48 次。這被核心成員形容為「就像有人告訴你,他們在歐幾里得幾何中發現了一個全新的公理」。
-
幾何難題突破: AlphaEvolve 在幾何領域也取得了顯著成果。它不僅找到了六邊形填充問題的更優解,還改進了一個困擾數學家們 300 多年的經典幾何問題:「接吻數問題」,將 11 維空間中接吻數的已知最佳下限從 592 推進到 593。
-
數據中心優化: 谷歌工程師將 AlphaEvolve 應用於公司內部的計算基礎設施優化,將伺服器的資源利用率提升了 0.7%。對擁有數百萬台伺服器的谷歌而言,每年可節省數億美元的成本。
-
Gemini 大模型訓練加速: AlphaEvolve 甚至優化了其「母體」Gemini 大模型的訓練過程,將 Gemini 的大型矩陣乘法運算加速了 23%,從而將 Gemini 的訓練時間縮短了 1%,並將 FlashAttention 的運算速度提高了 32.5%,真正形成了用 AI 來訓練 AI 的閉環。
AlphaEvolve 背後的技術架構
AlphaEvolve 的技術架構主要包含三個關鍵要素:
- 進化算法的多樣性探索: AlphaEvolve 採用靈感來自生物進化的進化算法,通過「變異-選擇-繁殖」的循環,在龐大的解空間中尋找最優解。
- 大語言模型的知識生成: AlphaEvolve 結合了大語言模型,大模型在這裡扮演兩個角色:代碼生成器和數學推理助手。它可以根據問題描述生成初始代碼框架,並在迭代過程中對候選解進行語義分析,識別潛在的數學規律。
- 人類參與的閉環反饋: 儘管 AlphaEvolve 展現出了強大的自主性,但人類的參與仍然不可或缺。人類的核心作用在於定義有趣的問題和建立評估標準。
AlphaEvolve 的意義與挑戰
AlphaEvolve 代表著 AI 從工具向合作者的演進。然而,任何顛覆性技術都伴隨著爭議,AlphaEvolve 也不例外。
-
黑箱化問題: AlphaEvolve 背後的思維過程難以被人類完全理解,可能導致科研成果難以被驗證和復現。
-
科研領域的重組: 當 AI 能夠自主發現新的定理、優化實驗方案的時候,人類研究者的角色也即將從生產者轉向問題的定義者和結果的篩選者。
-
技術集中化風險: 目前 AlphaEvolve 的能力還僅限於谷歌內部,可能導致 AI 科研寡頭化,加劇科技領域的馬太效應。
人類與 AI 的共存
面對 AlphaEvolve 帶來的衝擊,我們更需要思考的是人類究竟該如何與 AI 共存。或許,這次 AlphaEvolve 不會取代科學家,而是讓人類更專注在定義問題和探索未知領域。人機協作可能會開啟增強型科研的新時代。
就像 AlphaGo 的第 37 步可以說是圍棋的轉折點,AlphaEvolve 的出現可能是人類科學史的第 37 步。它標誌著 AI 從模仿人類走向創造知識,從解決問題走向定義問題。