ChatGPT 對人腦運作的影響
引言
用了半天 ChatGPT,可能真會讓人變笨,當然這只是玩笑話。半年前很少用 ChatGPT,現在更常用 Jamline。但重點不在用哪個模型,馬神藝術學院發表的超過 200 頁的文章指出,用 ChatGPT 不僅會忘記剛寫的內容,甚至覺得文章不是自己寫的,且停用大模型寫作後,這種損失仍會存在,對未來學習方法甚至人類思維有巨大影響。
研究目標與核心問題
這項研究目標明確,探索在寫論文這一典型教育情境中使用大型語言模型的認知成本。研究人員希望通過精心設計的實驗回答以下四個核心問題: 1. 輸出差異:人們使用傳統搜索引擎和僅用自己大腦時,寫出的文章是否有顯著差異? 2. 大腦活動:LLM 組、搜索組和大腦組這三組參與者的大腦活動有何不同? 3. 記憶影響:使用語言模型如何影響參與者的記憶?實際影響相當大。 4. 整體感受:使用語言模型是否會影響他們對文章的整體感受?即是否真覺得自己寫了那篇文章?
語言模型的兩面性
光明面
語言模型是個性化且有情感的學習夥伴。調查提到,其最獨特的特點是能提供情境化、個性化的信息,不像傳統搜索引擎返回一堆鏈接讓人自己篩選,能針對用戶提問生成連貫詳細的回答,對自適應學習也很有用,能根據用戶反饋和偏好組織答案,提供接力般的澄清,更深入探索話題,就像不知疲倦的全職私教。
黑暗面
大型模型也是信息損失和錯覺的陷阱。論文指出,大型模型生成的信息常與原始來源失去聯繫,可能導致傳遞不準確信息。向 LLM 詢問信息,若不適合來源,就無法確定其真實性,使用時必須檢查來源,因錯覺確實會發生。儘管之前大多數 LLM 模型提供了音頻和視頻功能,但問題未完全解決,音頻和視頻錯覺,即虛假或不正確的音頻和視頻仍是挑戰,即使 AI 生成的響應是音頻和視頻的來源,也不能保證音頻和提供的信息完全相同,模型使用某個來源,也可能未正確解釋或理解來源的真實含義。
研究的重大發現
對信息控制的被動消費
LLM 提供及時答案的便利性導致被動消費,這可能導致表面參與減弱、批判性思維能力減弱、對材料理解不足以及長期記憶形成減少。
能力水平的影響
論文稱為能力的個人能力水平,實際上會影響如何看待和使用這些大型模型。
對決策能力等的影響
認知參與的減少可能導致決策能力下降,還會助長學生和教育工作者的拖延和懶惰。使用語言模型可能減少人們直接互動或社交的機會,而後者在學習和記憶形成中起重要作用,真正的學習是與同學合作學習、與老師交流、深入討論想法以及發現知識邊界或理解中的誤解的過程。
線上搜索與學習模式
在深入研究 LLM 之前,先回顧熟悉的谷歌搜索線上搜索和學習模式。高效的學習者會在網上搜索信息,然後驗證、驗證並檢查信息來源;若這方面能力弱,可能什麼都不做,只相信任何信息來源告訴你的內容,要知道任何人都可以在網上寫任何東西。論文還提到,成功的線上搜索需要領域知識、自我調節能力和戰略搜索行為來優化學習結果,因此,越善於使用搜索工具,結果越好,在線上搜索領域具有高級知識的個人表現更好,因為他們能更好地識別相關信息並在複雜話題上有發言權。
認知恢復
論文介紹了認知恢復的關鍵概念,指大腦處理信息時的壓力,外部認知恢復指信息呈現的負擔。當信息清晰呈現,沒有雜亂的廣告、複雜的導航或分散注意力的界面元素時,外部認知恢復會減少,信息處理越容易,大腦就不必那麼努力工作。研究表明,大型語言模型可減少所有類型的認知回歸,與網絡搜索等傳統方法相比,它使信息理解和解鎖更容易,使用 LLM 的用戶的認知回歸比僅使用軟件的用戶低 32%,查找信息的失敗和努力也顯著減少。
LLM 的優劣
LLM 的優勢是簡化信息的呈現和綜合過程,從而減少對主動性和信息的需求,進而減少構建新圖像所需的認知努力。但陷阱在於,若思考不夠努力,不構建新圖像,可能從一開始就無法真正理解這些信息。由於認知負荷大幅減少,使用 LLM 確實能帶來更高的生產力,調查數據顯示,LLM 用戶的整體生產力提高了 60%,且由於外部認知減少,用戶更願意長時間投入任務,但生產力的提高不等於學習績效的提高。儘管較低的認知負荷通常用於簡化任務以提高生產力,但 LLM 用戶通常對材料的參與度較低,這犧牲了構建和自動化強大新圖像所需的有效認知負荷。令人驚訝的發現是,特別是依賴 LM 進行科學研究的學生,其推理質量低於使用傳統搜索引擎的學生,因為後者需要更積極的認知處理來整合來自不同來源的信息。
人機合作的未來
這是關於人機合作未來的深刻證據。認知整合的減少導致從主動批判性推理轉向被動監督,即不再親自做理解某個主題的腦力勞動,而是監督 AI 為你完成任務。在監督和教學 AI 智能的技能與對核心信息本身的真正深入理解之間,存在微妙的平衡。論文還發現,高能力學習者會策略性地將 LLM 用作主動學習的工具,而低能力組通常依賴 LLM 的實時響應,而不是經歷傳統學習方法中的交替過程。關鍵問題是將 LLM 視為工具還是讓它引導你。
實驗設計與過程
實驗設置了三組進行比較和角色交換。研究人員將參與者分為三組:第一組是 LLM 組,限制只能使用 OpenAI 的 GPT-4 作為唯一信息來源;第二組是搜索引擎組,可以使用任何網站幫助寫作,但明確禁止使用 ChatGPT 或任何其他 LLM;第三組是大腦組,禁止使用任何外部工具。試驗過程的關鍵階段包括寫論文和評估面試。寫完論文後,參與者會被問一系列問題,例如為什麼選擇這個論文主題、寫論文時遵循了什麼結構、如何寫這篇論文、對於 LLM 組,是先開始寫作還是先問 ChatGPT 等。另一個關鍵問題是,能否不讀文章就引用其中任何內容。然後他們經歷了第四階段,讓參與者按角色互相呼叫,LLM 組變成僅用大腦寫作,僅用大腦組開始使用 LLM,以觀察這對記憶和理解的影響,即停止或開始使用 LLM 後會如何變化。
實驗結果
大腦網絡連通性
E1G 分析表明,只有大腦組必須移動大量自身認知資源才能顯示出最強和最廣泛的大腦網絡連接。相比之下,LLM 助手寫作組的大腦連通性普遍較低,這意味著他們使用的大腦較少。儘管 LLM 組在寫作時確實使用了大腦網絡,但 LLM 似乎削弱了神經通信的強度和範圍,對工作記憶和執行功能的需求也較輕,這可能是因為機器人提供了外部認知支持,即正在分配認知工作。
信息流方向
在信息流方向上,他們進行了更深入的研究,發現信息流方向不同。只有大腦組顯示出更強的自給自足信息流,這可以解釋為大腦的語言和感知區域將新想法和語言內容提供給前額的執行系統,這是一個從內到外創造的探索過程。LLM 組由於機器人的外部輸入,經歷更多的是自上而下的方向連接,他們的大腦角色是整合和過濾工具,然後將其整合到整體敘述中,這是一個從內部引導的整合過程。
創造力差異
論文還發現,僅用大腦組的參與者在大多數主題的寫作方法上具有很強的多樣性,當只能依靠大腦時,他們非常有創造力,組內成員之間存在很大差異。然而,LLM 組在每個主題上生成的文章在統計上是統一的,當依靠 LLM 時,所有其他人寫的東西都一樣。搜索引擎組可能在一定程度上受到搜索引擎推廣和優化內容的影響,這也是一種響應效應。
記憶分解
最一致和最明顯的組間行為差異反映在引用自己文章的能力上。LLM 用戶在這方面表現明顯不佳。在第一輪測試中,83%的參與者表示很難引用自己的文章,沒有人能提供正確的引用。即使他們記得引文,也不能準確拼寫出來。而搜索引擎組和僅用大腦組沒有這樣的障礙,實際上,他們達到了幾乎完美的閱讀和使用能力。到第三輪測試時,這兩組的 100%參與者都表示可以閱讀和使用自己的文章,閱讀的準確性只有輕微差異。
對比與思考
這就像黑膠唱片音樂和數字音樂的區別。數字音樂就像在 Apple Music 上聽到的,無論何時播放,其音質都完美無瑕,沒有噪音,沒有一點失真,但有時正是這種完美讓音樂顯得有些冰冷。相比之下,黑膠唱片可能有輕微的噼啪聲,微妙的不平衡,但它帶來了更真實、更人性化的聽覺體驗,在黑膠唱片中會感受到更多情感和靈魂。當老師批改論文時,也有類似的感覺。有些文章在結構和語言上幾乎完美,但沒有個人觀點或明確的觀點,就像沒有靈魂一樣,就像數字音樂的音質無法形容,但失去了黑膠唱片的溫暖和質感。正如老師們所說,儘管這些文章看起來很學術,表面上通常比其他文章更深入地探索了主題,但更看重個性和創造力,而不是客觀的完美。
角色交換的影響
當讓 LLM 組僅用大腦工作,讓僅用大腦組使用 LLM 時,這種影響會持續很長時間。從 LLM 轉到大腦的參與者,即先使用 LLM 然後變成僅用大腦的參與者,他們在第二次測試中的表現不如大腦組。這意味著如果一開始使用 LM,然後被要求僅用大腦寫文章,在記憶和理解方面的表現仍然會更差。
研究的深層含義
- 早期依賴 AI 可能導致淺層編碼:LLM 組的記憶不佳和誤解可能表明他們早期的文章沒有被內化,這可能是因為他們將認知處理過程外包給了 LLM,讓 LLM 為你工作,這些知識最終沒有進入大腦。
- 早期不提供 LLM 工具可能有助於記憶形成。
- 從大腦到 LM 組有更高的參與度:大腦組的成員可能會在大腦中比較他們過去沒有支持的努力和工具生成的建議,然後反思自己並改進再現,這是一個與執行控制和意義整合相關的過程,正如他們的腦圖所示,因此,先自己思考然後使用 LLM 支持的人會更好。
結論與呼籲
這篇論文不僅警告我們 AI 會讓人變笨,還提出了新的認知挑戰——認知債務。為了方便和高效,必須深入思考並內化知識,這種短期收益正在積累長期負擔,可能削弱批判性思維、創造力和獨立解決問題的能力。我們正站在技術的十字路口,如何明智地使用這些強大的工具將決定我們是成為它們的守護者還是與它們一起成為更強大的思考者。論文給出的方向很明確,先獨立思考,再尋求 AI 支持,也許這才是通向未來的正確道路。
結束語
今天的視頻就到這裡。如果喜歡今天的節目,不要忘記點贊、分享和訂閱我的頻道,以獲取最新的科技信息和深入分析。感謝觀看,下次再見。