Google第七代TPU Ironwood登場!2025谷歌雲大會重點:AI效能爆發式升級!

Summary

Language:

Quick Abstract

Google 雲端大會震撼登場,誓言重奪 AI 王座!本次大會聚焦 谷歌AI 最新進展,包括第七代 TPU Ironwood 直指 NVIDIA Blackwell B200,以及 Vertex AI 平台模型全方位升級。本文將快速帶您掌握大會重點內容,一覽 Google 在 AI 領域的雄心壯志。

Quick Takeaways:

  • 第七代 TPU Ironwood: 推理性能較初代提升 3600 倍,功耗效率提升 29 倍,目標鎖定生成式 AI 的巨大運算需求。
  • Vertex AI 平台: 文本轉音樂模型 Lyria、影片生成模型 Veo 2、語音生成模型 Chirp 3 及圖片生成模型 Imagen 3 全面升級,涵蓋所有模態。
  • Agent2Agent (A2A) 協議: 開放協議讓 Agent 跨平台協作,實現動態多 Agent 生態系統。
  • Gemini Code Assist: AI 編碼助手可執行複雜編程任務,大幅提高開發效率,並於 Android Studio 中使用。
  • Gemini 2.5 Pro: 現已向所有人開放使用,AI Studio 和 Gemini API 活躍用戶快速增長。

Google 雲端大會:谷歌力圖重奪 AI 王座

大家好,我是大飛。谷歌正積極嘗試重奪 AI 領域的領導地位。在 4 月 10 日於拉斯維加斯舉行的年度 Google 雲端大會上,谷歌推出了一系列重大更新,涵蓋首款推理 TPU、多款模型升級、全新的 A2A 協定以及程式碼助手等。這不僅展現了谷歌在 AI 領域的深厚技術積累,也可能重塑 AI 產業的格局。今天,我將為大家盤點本次谷歌雲端大會的重點內容。

第七代 TPU Ironwood:直指英偉達 Blackwell B200

性能與規格

在本次谷歌雲端大會上,最引人注目的無疑是谷歌第七代 TPU Ironwood 的首次亮相。這款晶片直接將目標鎖定在英偉達的 Blackwell B200,也是谷歌迄今為止性能最強、可擴展性最高的客製化 AI 加速器,專為推理設計。相較於 2018 年的第一代 TPU,推理性能飆漲了 3600 倍,效率也提升了 29 倍。

Ironwood 晶片搭載了高達 192GB 的 HBM 顯存,是第六代 TPU Trillium 的 6 倍,相較於更早的 TPU v4 更是提升了六倍。大顯存意味著可以處理更大的模型和數據集,同時減少了頻繁數據傳輸的需求,進而提高了性能。

HBM 的頻寬對於 AI 計算也至關重要。Ironwood 晶片的 HBM 頻寬提升到了驚人的 7.2 Tbps,是 Trillium 的 4.5 倍。晶片間互連 ICI 雙向頻寬這次也增加到了 1.2 Tbps,是 Trillium 的 1.5 倍。

算力與應用

對於谷歌 Cloud 客戶,Ironwood 提供了兩種規格,分別是 256 個晶片和 9216 個晶片。每個單獨的晶片峰值 FP8 算力達到 4614 TFLOPs。當擴展到每個 pod 9216 個晶片時,可以在 FP8 精度下達到 42.5 Exaflops。

谷歌號稱這個算力是世界上最大的超級電腦 El Capitan 的 24 倍以上,但實際上是跟 El Capitan 在 FP64 精度下的 1.74 exaFLOPS 相比而言的。如果同樣換算成 FP8 精度,El Capitan 的理論峰值性能接近 87 exaFLOPS,仍然遠超 Ironwood。

不過即便如此,42.5 Exaflops 的 FP8 算力對於大規模的推理任務而言,仍然是一個相當可觀的數字。Ironwood 還配備了增強版的 SparseCore,這是專門用於處理高級排序和推薦任務的加速器,也使得 Ironwood 的應用場景更加廣泛,不僅局限於傳統的 AI 領域,還能用於金融和科學領域。

軟體整合與功耗效率

由谷歌 DeepMind 開發的 ML 運行時 Pathways 可以與 Ironwood 很好的配合,從而多個 TPU 晶片上實現高效的分布式計算,將數十萬個 Ironwood 晶片組合在一起進行計算。同時,谷歌這次還增添了新一代的 GKE 推理功能,以及將 vLLM 引入了 TPU。這就讓那些已經用 vLLM 針對 GPU 優化過的 PyTorch 程式碼,能夠輕鬆地轉到 TPU 上運行。

在性能提升的同時,Ironwood 也非常注重功耗效率。與第六代 TPU Trillium 相比,它在功耗效率上實現了 2 倍的提升。對比 2018 年推出的首款 TPU 更是高出了 29 倍。谷歌通過先進的液冷解決方案和優化的晶片設計,保證了即使在持續、繁重的 AI 工作負載下,也能可靠地維持標準風冷兩倍的性能。這對於大規模的 AI 計算來說至關重要。

在社交平台上,有 OpenAI 的研究員將 Ironwood 與英偉達的 GB 200 做了性能對比。總體來說,Ironwood 與 GB200 的性能相當,甚至在功耗方面 Ironwood 還稍低一些。谷歌副總裁兼 Cloud AI 總經理阿明·瓦赫達特(Amin Vahdat)在會上表示,Ironwood 的目標在支持生成式 AI 的下一階段,以及巨大的計算和通信需求。因為在推理時代,AI Agent 將主動檢索和生成數據,通過協作的方式來提供洞察和答案,而不僅僅是依靠數據了。

Vertex AI 平台:全模態模型更新

除了 Ironwood 晶片以外,谷歌的 Vertex AI 平台現在成為了唯一一個擁有涵蓋所有模態,包括視頻、圖像、語音和音樂的模型平台。這次更是包括了四項重大更新:

  1. Lyria (文本轉音樂模型): 可以讓客戶從文本提示詞開始,生成完整的、可用於生產環境的音樂素材。企業可以根據自身品牌獨特的調性,為行銷活動、產品發布或者沉浸式的店內體驗快速定制配樂。對於創作者來說,Lyria 更是簡化了內容創作流程,可以在幾分鐘內生成定制音樂曲目,直接契合內容的情緒、節奏和敘事,從而加速製作工作流程並且降低授權成本。
  2. Veo 2 (影片生成模型): 為影片的創建、編輯和視覺效果添加了一套強大的功能集,使得它從一個單純的生成工具轉變為一個全面的影片創作和編輯平台。在影片修復方面,Veo 2 無需手動修飾即可獲得乾淨、專業的編輯效果。用戶可以輕鬆移除影片中不需要的背景圖像、徽標或干擾物。在畫面擴展功能上,Veo 2 能夠擴展現有影片素材的畫面,將傳統影片轉換為針對網頁和移動平台優化的格式。此外,Veo 2 還新增了應用複雜電影拍攝技術的功能,無需複雜的提示詞或者專業知識,團隊就能運用指導鏡頭構圖、攝影機角度和節奏等技術,通過連接兩個現有素材來創建一個連貫的影片。借助插值功能,用戶可以定義影片序列的開始和結束,Veo 2 會無縫生成連接幀,從而確保平滑過渡並且保持視覺的連續性。
  3. Chirp 3 (語音生成模型): 它的高清語音功能提供了超過 35 種語言的自然逼真語音,以及 8 種說話人選項。除此之外,谷歌還新增了兩個強大的功能,分別是即時定制語音(Instant Custom Voice)功能和帶說話人日誌功能的轉錄(Transcription with Diarization)功能。其中即時定制語音只需要 10 秒的音頻輸入,就可生成逼真的定制語音。企業能夠借助這個功能來個性化呼叫中心、開發無障礙內容,以及建立獨特的品牌聲音。而帶說話人日誌功能的轉錄功能,它可以精確地分離和識別多人錄音中的單個說話人,顯著提高轉錄內容的清晰度和可用性,非常適用於會議紀要、播客分析和多方通話錄音等應用場景。
  4. Imagen 3 (文本轉圖像模型): 能夠生成具有比之前更好細節、更豐富光照和更少干擾性偽影的圖像。谷歌還顯著改進了 Imagen 3 的圖像修復(inpainting)能力,用於重建圖像中缺失或損壞的部分,尤其是在物體移除(object removal)方面,不僅質量更高,而且效果也更加自然。

A2A 協定:促進 Agent 之間的協作

如今隨著人工智能的發展,Agent 在各個領域的應用也越來越廣泛。但是 Agent 如果想要發揮更大的作用,就必須能夠跨越孤立的數據系統和應用程式,在一個動態的多 Agent 生態系統中相互協作。

為了實現這一目標,谷歌推出了全新的開放協定 Agent2Agent,簡稱 A2A,並且已經獲得了超過 50 家合作夥伴的支持和貢獻。簡單來說,A2A 是一種開放協定,為 Agent 提供了一種標準的交互方式,讓它們之間能夠進行相互協作,而無需考慮底層框架或者供應商。

A2A 的工作原理

A2A 協議通過促進客戶端 Agent 和遠程 Agent 之間的通信來實現的。客戶端 Agent 負責制定和傳達任務,而遠程 Agent 則根據這些任務採取行動,提供正確的信息或執行相應的操作。

在這個過程中,A2A 協議有以下幾個關鍵能力:

  • Agent Card: Agent 可以通過“Agent Card”來宣傳它們的能力。這些“Agent Card”是以 JSON 格式存在的,它們能夠讓客戶端 Agent 識別出哪個遠程 Agent 最適合執行特定的任務。
  • 任務管理: 客户端和远程 Agent 之间的通信都是围绕完成任务展开的。协议定义了一个“任务”对象,这个对象具有自己的生命周期。
  • Agent 之間的協作: Agent 們可以相互發送消息。這些消息可以包含上下文信息、回復、工件或者用戶指令。
  • 用戶體驗協商: 每條消息都包含部分 parts,這些 parts 是完整的内容片段,比如生成的圖像。每個 parts 都有指定的内容類型,這使得客户端和遠程 Agent 能夠協商所需的正確格式,並且明確包括用戶界面能力的協商,比如 iframe、視頻、網路表單等。

Gemini Code Assist:新的 AI 編碼助手

在這次谷歌雲端大會上,還有一個值得關注的更新,那就是谷歌的 AI 編碼助手 Gemini Code Assist。它現在也可以部署新的 AI Agent,通過執行多個步驟來完成複雜的編程任務。比如,它可以根據 Google Docs 中的產品 Spec 來創建應用程式,或者將程式碼從一種語言轉換為另一種語言,大大提高開發效率。而且 Code Assist 現在除了在其他編碼環境中使用外,還可在 Android Studio 中使用,進一步擴大了它的應用範圍。

總結

從性能超強的 Ironwood TPU 到全模態升級的 Vertex AI 平台,再到全新的 A2A 協定和 Gemini Code Assist,谷歌的這場大會似乎迫不及待的想要展現自己的實力。

另外根據 CEO Pichai 介紹,Gemini 2.5 Pro 現在已經在 AI Studio、Vertex AI 和 Gemini 應用程式中向所有人開放了。根據谷歌在今年 1 月發布的財報顯示,其 2024 年第四季度的雲業務收入達到 120 億美元,同比增長了 30%,AI Studio 和 Gemini API 的活躍用戶更是在過去一個月就增長了 80%。隨著 OpenAI 打算開啟新一輪的發布周,相信谷歌後續也還會有相關的動作跟進,讓我們拭目以待。感謝大家觀看本期視頻,我們下期再見。

Was this summary helpful?

Quick Actions

Watch on YouTube

Stay Updated

Get the latest summaries delivered to your inbox weekly.