Rewritten (zh-hant): 【人工智能】推理需求将增长百倍 | Cerebras CEO Andrew Feldman 20VC专访 | 设计理念 | 晶圆级集成 | 分化策略 | 基础设施 | AI投资 | 上市 | 英伟达

Summary

Language:

Quick Abstract

AI晶片 (AI Chips) 的未來是什麼?Cerebras CEO安德魯·費爾德曼 (Andrew Feldman) 在一次訪談中分享了他對 AI 晶片領域的前沿資訊與深刻見解。大飛將帶你快速了解 Cerebras 如何透過獨特的晶圓級整合技術,挑戰輝達 (NVIDIA) 在 AI 推理市場的主導地位。

Quick Takeaways:

  • Cerebras 專注於解決 AI 運算中數據頻繁轉移的核心難題,透過晶圓級整合實現海量 SRAM,兼顧高速與大容量。
  • Cerebras 獨創工藝技術,成功解決了晶圓級方案的良率問題,成為 70 年來首個實現完整晶圓交付的企業。
  • 費爾德曼認為,輝達的 GPU 架構在推理場景中存在局限性,Cerebras 的方案在推理效率上更具優勢。
  • 雖然美國試圖通過技術封鎖限制中國獲取先進晶片技術,但中國在軟體研發和數據資源方面具有優勢。
  • 未來五年,AI 推理的需求將會爆發式成長,將有更多 AI 應用出現,算法仍有巨大的改進空間。

AI 晶片領域的前沿洞見:Cerebras CEO 安德魯·費爾德曼訪談精華

大家好,這裡是最佳拍檔,我是大飛。這次要跟大家分享知名播客 20VC 對 Cerebras 公司聯合創始人兼 CEO 安德魯·費爾德曼的訪談精華,他分享了對於 AI 晶片領域的許多前沿資訊和深刻見解。

Cerebras 的創立與願景

Cerebras 的創立可以追溯到 2015 年,當時 AI 的發展還處於早期階段。但幾位創始人敏銳地察覺到 AI 蘊含的巨大機遇,並意識到 AI 軟體對底層晶片處理器的需求與傳統計算場景截然不同。因此,他們決定為 AI 打造更為匹配的硬體系統。

他們的判斷極具前瞻性,儘管一開始低估了 AI 市場的規模,但他們深刻認識到記憶體頻寬通信架構將成為制約 AI 發展的關鍵因素。基於這些判斷,Cerebras 投身於 AI 晶片的研發。

AI 運算的挑戰與 Cerebras 的解決方案

晶片的核心功能是執行運算和傳輸數據。AI 運算的基礎運算並不複雜,主要是矩陣乘法,但真正的挑戰在於 AI 運算需要進行海量級的簡單計算,這意味著龐大的數據量,以及運算結果和中間結果需要在記憶體間頻繁轉移。

為了解決這個問題,Cerebras 在晶片設計理念上充分考慮了 AI 運算的這些特點。他們明白,要想打造出更快更節能的 AI 計算系統,就必須攻克數據頻繁轉移這個核心難題。

Cerebras 並未局限於模型微調、訓練或推理中的某個環節,而是選擇三者兼顧。訓練和微調的需求基本上是一致的,而推理與訓練存在明顯的差異,尤其是生成式推理,對記憶體頻寬提出了極高的要求。

晶圓級集成技術的優勢

以一個 700 億參數的常規模型為例,生成一個單詞就需要移動 140GB 的數據。GPU 採用 HBM 記憶體,雖然在圖形計算時表現出色,但在 AI 推理場景中卻存在速度局限,因為 AI 推理需要頻繁地讀取和寫入數據。

SRAM 速度極快,但傳統晶片尺寸的 SRAM 容量有限,無法承載完整的模型參數。Cerebras 通過晶圓級集成技術實現了海量 SRAM 的佈局,成功地兼顧了高速與大容量的優勢。

費爾德曼認為,Cerebras 的晶圓級集成方案在推理效率上具有更加顯著的優勢。根據多個第三方測試數據顯示,Cerebras 的方案在多個模型上都保持著最快的推理速度記錄。

成本優勢與良率挑戰

在成本方面,Cerebras 也有著獨特的優勢。雖然採用晶圓級方案面臨許多挑戰,例如良率的問題,但通過獨創的工藝技術,Cerebras 成功地解決了這個難題。

Cerebras 將處理器設計成了由數十萬個相同功能單元組成的陣列,並配合了冗餘行列的設計。當某個單元出現缺陷時,只需要關閉這個單元並調用備用單元即可。Cerebras 凭借这一创新,成为了70年来首个实现完整晶圆交付的企业。

不同場景下的策略差異

客戶在選擇晶片時,最看重的因素往往因場景而異。在癌症診斷等對準確率要求極高的場景中,準確率的微小差異可能至關重要。而在像搜索引擎或聊天機器人這樣的即時交互場景中,速度則是至關重要的。

因此,Cerebras 採用了一種分化的策略。例如,對批處理任務優先考慮成本控制,對交互場景則必須追求極致速度。

AI 產業的未來趨勢

費爾德曼認為,未來五年,AI 訓練和推理這兩個階段之間的資源分配將發生顯著的變化。當 AI 逐漸更多地融入到人們的日常工作中,完成從“有趣的工具”到“日常工作必備”的轉變,推理將在 AI 產業中佔有更重要的地位。到那時,推理的需求可能會超過如今的 100 倍。

此外,數據中心的建設也存在一些問題,例如大量新建的數據中心存在“遊客式建設”問題,資源配置嚴重不足。費爾德曼認為,數據中心的本質是電力接入 + 建築工程 + 設計優化的綜合體。

算法優化與合成數據

GPU 執行推理時的利用率僅為 5% 到 7%,這意味著 93% 到 95% 的算力被浪費了。算法的優化至關重要,增加算力仍然能夠持續提升效果。可以預見的是,在未來的 3 到 5 年,大家對 Transformer 的依賴程度將顯著降低,新的架構可能會應運而生。

合成數據在 AI 訓練中的作用也備受關注。合成數據能夠填補那些難以獲取但至關重要的訓練空白。當算力、算法和數據這三個維度都取得了突破時,AI 的體驗將發生質的變化。

投資角度與市場佔有率

在投資角度來看,費爾德曼認為 AI 公司要想證明自己的長期價值,不僅需要立竿見影的成效,更需要持續進化的軌跡。

談到 AI 晶片領域,費爾德曼指出,雖然英偉達目前佔據著近乎壟斷的地位,但是未來五年,英偉達的市場佔有率可能會降至 50% 到 60%。他認為,英偉達真正的護城河其實還是市場主導地位預設解決方案

對中國 AI 發展的看法

在談到對中國 AI 發展的看法時,費爾德曼認為需要從多個角度進行分析。美國政府試圖通過技術封鎖政策限制中國獲取先進的晶片技術,這在一定程度上會對中國的 AI 硬體發展造成短期的阻礙。但中國在軟體研發方面也有著龐大的人才儲備和創新能力,而且擁有豐富的數據資源,為 AI 的訓練提供了充足的“燃料”。

費爾德曼認為,美國對中國 AI 發展能力的低估,可能會在未來付出代價。

Was this summary helpful?