中國人工智慧的突破:深度求索(Deepseek)引發矽谷震驚
中國最新的AI突破已超越世界領先地位,我們應該非常認真地看待中國的發展。這項突破性的發展並非來自OpenAI、Google或Meta,而是一家名為Deepseek的中國實驗室所研發的新模型,在業界引起了廣泛關注。
深度求索的崛起
-
成本效益驚人: Deepseek宣稱,他們僅用兩個月和不到600萬美元的成本就完成了Google和OpenAI耗費數年和數億美元才完成的成果。
-
最佳開源模型: Deepseek擁有最佳的開源模型,吸引了眾多美國開發者在其基礎上進行開發。
技術細節
-
超越美國巨頭: Deepseek的新模型在廣泛的測試中,包括數學問題、AI數學評估、編碼競賽以及程式碼錯誤修復等方面,超越了Meta的Llama、OpenAI的GPT-4O和Anthropic的Claude Sonnet 3.5。
-
高效能推論: Deepseek的模型在推論時間運算方面表現出色,並且具有極高的運算效率。
-
R1推理模型: Deepseek隨後發布了一款名為R1的新推理模型,在某些第三方測試中輕鬆超越了OpenAI的尖端模型o1。
美國的反應
-
昔日差距已縮小: 前Google CEO Eric Schmidt在2024年初曾預測中國在AI領域落後美國2到3年,但現在他認為中國在過去六個月裡以驚人的速度趕上來了。
-
對美國的警示: 深度求索的崛起引發了關於AI護城河寬度的質疑,以及OpenAI等封閉原始碼領先者是否能保持其優勢的討論。
美國的限制與中國的應對
儘管美國政府對中國實施了嚴格的半導體限制,限制其獲得Nvidia H-100 GPU等高性能晶片,但Deepseek透過使用效能較低的H-800s晶片,成功繞過了這些限制,並證明晶片出口管制並未完全達到美國政府的預期效果。
- 高效利用硬體: Deepseek能夠更有效率地利用現有硬體進行訓練。
深度求索的背景
-
神秘的面紗: 儘管取得了突破,但關於Deepseek實驗室及其創始人梁文峰的資訊仍然很少。
-
起源: 據中國媒體報導,Deepseek源自一家名為High Flyer Quant的中國對沖基金,該基金管理著約80億美元的資產。
-
使命: Deepseek的開發者網站上寫著:「以好奇心解開AGI的奧秘,以長期主義回答本質問題。」
中國AI生態系統
-
獨角獸的崛起: 李開復的創業公司「零一萬物」在成立僅八個月後就成為獨角獸,並在2024年帶來近1400萬美元的收入。
-
降低成本的策略: 阿里巴巴的Qwen試圖將其大型語言模型的成本降低多達85%,以吸引更多開發者。
開源模式的影響
-
加速創新: 強大的開源模型的廣泛可用性使開發者能夠跳過構建和訓練模型所需的繁瑣且資本密集型步驟,從而更容易以較小的預算和團隊躍升至前沿。
-
降低開發成本: Deepseek的開源模型將推論成本降至每百萬tokens 10美分,僅為典型可比模型的1/30。
-
顛覆潛力: 一個更便宜、更高效、被廣泛採用的中國開源模型可能會導致全球AI動態的重大轉變。
風險與挑戰
-
價值觀的控制: 在中國構建的AI模型必須遵守國家制定的規則,體現「社會主義核心價值觀」。
-
內容審查: 研究表明,騰訊和阿里巴巴創建的模型會審查歷史事件,否認人權侵犯,並過濾對中國政治領導人的批評。
-
美國主導地位的威脅: 中國開源模型的大規模採用可能會削弱美國的領導地位,同時將中國更深入地嵌入全球技術基礎設施中。
-
開源的潛在風險: 開源許可證可能會隨時間而改變,因此美國本土的AI開發至關重要。
Perplexity CEO的觀點
Perplexity聯合創始人兼CEO Arvind Srinivas認為,美國不應將精力集中在禁止或阻止中國,而應專注於透過競爭取勝。 他強調了深度求索在資源受限的情況下取得的驚人進展,以及其開源模型對美國開發者的潛在影響。
-
美國的優勢不再: 美國過去在硬體方面的優勢已不再是絕對的優勢,中國正在透過創新和效率來彌補差距。
-
開源的影響: 中國擁有最佳的開源模型,美國開發者正在此基礎上進行構建,這可能會導致中國在AI生態系統中佔據主導地位。
-
Meta的重要性: Meta在開源領域的努力對於確保美國在AI領域的競爭力至關重要。
Arvind Srinivas還指出,深度求索在技術報告中分享了大量細節,Meta的Llama 3.3技術報告也非常詳細,這對科學發展非常有利。