單靠擴展大型語言模型(LLMs)無法達到人類等級的人工智慧
我們無法僅通過擴展大型語言模型就達到人類等級的人工智慧,這是絕對不可能的。無論一些更具冒險精神的同事怎麼說,未來兩年內都不可能實現。
目前可能擁有的系統,是在大量數據上進行訓練,能為任何合理的問題提供答案,讓人感覺像是有個博士在旁邊,但實際上只是一個具有龐大記憶和檢索能力的系統,並不能為新問題發明解決方案,而這才是博士真正能做到的。
現階段的投資方向
現階段的投資並非為了明天,而是為了未來幾年。至少從Meta的角度來看,大部分投資都用於推理的基礎設施。
假設到今年年底,有10億用戶通過智能眼鏡、獨立應用程序等使用MAI,就需要大量的計算能力來服務這些用戶。因此,需要在基礎設施上進行大量投資,以便在數月或數年內擴展和建立這個系統。像MAI、微軟、谷歌和可能的亞馬遜等公司,大部分資金都流向了這裡,這基本上只是運營方面。
即使在未來3年內沒有新的範式革命,也很可能存在10億人經常使用這些東西的市場。這個基礎設施遲早會被使用,所以這是一項不錯的投資。而且建立數據中心等需要很長時間,現在就需要開始規劃,以確保投資最終是合理的。
現有人工智慧的缺陷
現有的人工智慧仍然存在深層次的缺陷。Meta正在進行消費者賭注,認為消費者想要使用人工智慧,OpenAI有4億Chat GPT用戶,Meta有30多億用戶,但用戶的使用強度不如Chat GPT。
許多投資是基於人工智慧對企業有用的想法,而不僅僅是消費者應用程序。但問題是,它還不夠好。例如,深度研究可能只能達到95%的準確度,還有5%可能是錯誤的。在企業中,只有10%或20%的概念驗證能投入生產,因為它們要么太貴,要么不可靠。
人工智慧部署的困難
人工智慧系統的部署一直是個問題。就像10年前有令人印象深刻的自動駕駛演示,但至今仍沒有五級自動駕駛汽車。最後的幾個百分點的可靠性,以及如何將其與現有系統集成,如何提高用戶的效率和可靠性等,都是非常困難的。
IBM Watson就是一個例子。它本來要在醫學領域推廣,在每個醫院部署,但最終以失敗告終。實際上,在可靠的情況下部署這些系統,並且不影響勞動力的自然保守性,是非常複雜的。
人工智慧的歷史浪潮
在20世紀80年代早期,圍繞專家系統掀起了一股人工智慧熱潮,當時最熱門的工作是知識工程師。日本政府還啟動了一個名為第五代計算機的大型項目,但最終大部分都失敗了。只有在一些狹窄的應用領域,能夠將人類知識轉化為規則,並且在經濟上可行的情況下,才取得了一些成功。
對人工智慧未來的展望
大型語言模型在信息檢索方面仍然扮演著重要角色。但如果認為僅通過在更多數據上訓練和擴展大型語言模型就能達到人類等級的人工智慧,那就是個錯誤。
要讓系統具備理解物理世界、擁有持久記憶、能夠推理和規劃的能力,需要能夠獲得常識、從視頻等自然傳感器學習的系統。這是一個巨大的挑戰,許多研究人員正在這方面努力,並取得了一些早期成果。
人工智慧的發展不是一個事件,不會有某一天突然就有了通用人工智慧(AGI)。它是一個持續的過程,需要整個研究界的共同努力。分享研究成果的人會比不分享的人進展得更快。如果認為有一個只有5人的初創公司發現了AGI的秘密,並投資50億美元,那就是個巨大的錯誤。