人工智慧是否已可操縱群體行為?最新研究揭露AI潛在威脅
作者:大飛
大家好,這裡是最佳拍檔,我是大飛。在我們頻道曾經做過的一期節目中,知名學者尤瓦爾·赫拉利在新書《智人之上》中表示,AI技術可能會被少數人掌控,進而操控個人行為。然而,最新的一份研究顯示,AI的程度似乎已經遠超赫拉利當時的預判。
4月14日,一篇發表在arXiv預印本平台上的研究論文“SocioVerse”,似乎正在揭示一個更為嚴峻的現實,那就是AI技術已經跨越了個體影響的邊界,邁入群體操控的新階段。
社會科學研究的瓶頸
早在二十世紀中葉,社會學理論奠基人亨普爾和歐本海默就曾經預言,真正的因果解釋必須建立在社會現象的可預測性基礎上。在此之後,社會科學家們一直在努力通過問卷調查、訪談、實驗等傳統方法來研究人類行為和社會現象。
不過,這些方法往往成本高昂、耗時漫長,樣本規模有限,有時還會受到倫理和可行性的制約。而SocioVerse希望能夠改變這一局面。
SocioVerse:用AI模擬真實社會
這項研究由復旦大學主導,聯合上創新研究院、羅切斯特大學、印第安納大學以及小紅書共同完成。簡單來說,SocioVerse嘗試利用大語言模型來構建一個“模擬真實社會的虛擬世界”,用AI驅動的Agent來模仿真實的人,並且讓他們在模擬的環境中互動,從而研究和預測複雜的社會動態。
四大挑戰:實現AI與真實社會的“對齊”
但是,要想用AI來模擬一個真實社會,並不是一件容易的事。研究人員首先指出了四個巨大的挑戰,或者說四個必須解決的“對齊(Alignment)”問題。
1. 環境對齊 (Environment Alignment) 我們的現實世界是活的,每天都有新的新聞事件發生,新的政策出台,新的文化潮流湧現。但是,大多數大語言模型訓練好之後,它的知識就相對固定了。如果模擬環境的信息是過時的,那基於這種環境做出的模擬行為,自然也就和現實脫節了。
所以,如何讓模擬環境能實時同步、動態更新,捕捉到真實世界的脈搏?這是第一個坎。
2. 用户對齊 (User Alignment) 真實社會裡的人是形形色色的,我們的年齡、性別、職業、收入、教育背景、成長環境、乃至性格和價值觀都千差萬別。這些差異決定了我們看待問題的方式和行為模式。
如果要讓模擬具有代表性,我們就不能只創造一些“平均”或者“標準”的Agent,而是需要能夠精確地模擬出特定目標群體的特徵和分佈。如何大規模、高精度地創造這些“數字替身”?這是第二個大難題。
3. 交互機制對齊 (Interaction Mechanism Alignment) 人們在社會中的互動方式是多種多樣的,不同的研究問題需要模擬不同的互動場景。如果模擬工具只能處理一種或幾種固定的交互模式,那麼它的通用性和擴展性就會大打折扣。
如何設計一個統一的框架,能夠靈活地模擬各種真實的社會互動結構?這是第三道關卡。
4. 行為模式對齊 (Behavioral Pattern Alignment) 就算我們有了實時的環境、精準的用戶畫像、還有合適的互動場景,最後還有一個關鍵問題,那就是這些AI Agent的行為真的像人嗎?它們做出的決策、表達的觀點,是否符合真實世界裡對應人群的行為模式?
如何確保這些被創造出來的“數字人”,在模擬中表現出的行為,能夠真正反映現實世界中群體的決策邏輯和行為規律,而不是模型自身的“幻覺”或“機械反應”呢?這是最後,也是最核心的挑戰之一。
四大引擎:驅動數字社會模型的運轉
為了解決這些挑戰,SocioVerse精心設計了四個引擎,分別是社會環境引擎、用戶引擎、場景引擎和行為引擎。這四個引擎分別對應著社會結構中最核心的四個邏輯維度,也就是時間性、個體性、情境性和互動性,共同驅動著這個數字社會模型的運轉。
1. 社會環境引擎 (Social Environment) 它的任務就是給整個模擬注入“真實感”,解決環境對齊的問題。它像一個信息聚合器,不斷地從外部世界收集和整理各種信息。
這些信息大致分三類:
-
第一類是社會結構信息,比如一個地區的人口分佈、文化習俗、城市基建、甚至人們普遍的工作生活習慣等等。這些信息為Agent提供了基礎的“世界觀”。
-
第二類是社會動態信息,它實時抓取最新的新聞事件、政策變動、熱點話題,並且給這些信息打上時間戳和相關標籤,讓Agent能夠感知到“現在正在發生什麼”。
-
第三類是個性化內容,就像我們刷手機會看到個性化推薦一樣,這個引擎也能根據Agent的“興趣畫像”,向它們推送相關的模擬帖子或者信息流。這有助於提升Agent行為的多樣性和真實性,避免所有Agent都接收完全一樣的信息。
有了這個引擎,模擬世界就不再是靜止的,而是變得動態和鮮活。
2. 用戶引擎 (User Engine) 它負責解決用戶對齊的難題。這個引擎的核心是一個龐大的用戶池(User Pool)。研究人員從真實的社交媒體平台,主要是X和中國的“小紅書”上,收集了海量的、公開的用戶發帖數據,構建了一個包含1000萬真實用戶的資料庫,相當於希臘或者匈牙利整個國家的人口。
當然,他們也做了嚴格的數據清洗,過濾掉了廣告和疑似機器人的內容。通過這些用戶發過的帖子,系統可以理解到他們的特徵和行為模式。
光有數據還不夠,還需要給用戶打上精準的標籤。於是,用戶引擎還包含了一套複雜的用戶標籤系統 (User Labels)。研究人員定義了多達15個維度的人口統計學和社會學標籤,包括年齡、性別、職業、種族、收入、教育水平、居住地類型、地區、就業狀況、婚姻狀況、宗教信仰、黨派立場、意識形態(自由派/保守派)、大五人格特質(Big Five personality traits)、甚至個人愛好等等。
他們先用多個前沿的大模型,比如GPT-4o,對一部分用戶數據進行初步的標注,然後再請專業的人類標注員進行二次驗證和修正,最後用這些高品質的標注數據訓練出專門的分類器模型,從而經濟高效地為整個千萬級用戶池裡的用戶打上標籤。
有了這個引擎,研究者就可以根據需要,精確地從這1000萬用戶中篩選、採樣,或者合成出符合特定研究要求的、具有高度多樣性和代表性的模擬Agent群體。
3. 場景引擎 (Scenario Engine) 它負責提供不同的“模板”,來模擬現實世界中千變萬化的場景。論文裡列舉了四種典型的模板:
-
第一種是問卷調查 (Questionnaire),模擬的是像民意調查、市場調研這種場景。通常是一個研究者對應N個受訪者,一輪完成。
-
第二種是深度訪談 (Indepth Interview),模擬一對一的訪談。研究者可以和模擬Agent進行多輪互動,深入探究它的想法和動機,有助於定性研究。
-
第三種是行為實驗 (Behavior Experiment),模擬實驗室裡的對照實驗,比如經濟學裡的博弈實驗、心理學裡的決策研究等等。根據實驗設計,可以是研究者對多個參與者,也可以是多個參與者之間互動。
-
第四種是社交媒體互動 (Social Media Interaction),這是為了模擬像微博、X這樣的在線社交平台上的信息傳播和觀點演化。多個Agent可以自由地發佈內容、評論、轉發,從而形成複雜的網絡互動。
4. 行為引擎 (Behavior Engine) 它是驅動整個模擬運行的核心,負責解決行為模式對齊的挑戰。這個引擎就像是Agent的“大腦”,接收來自其他三個引擎的信息,包括用戶的詳細畫像和歷史數據、當前的社會環境和背景信息、以及模擬正在進行的場景和互動規則。
然後,它利用這些信息來預測和生成每個Agent的行為,可能是回答一個問題,可能是發表一個觀點,也可能是在模擬的社交網絡裡點贊或轉發。
這個引擎的主要動力來源就是大語言模型,可以是通用的大模型,也可以是針對特定領域訓練的“專家模型”或者“領域模型”。論文也提到,對於一些影響力較小或者行為模式相對簡單的邊緣用戶,為了計算效率,也可以使用傳統的基於規則的Agent模型ABM作為補充。
行為引擎的目標,就是讓這些數字Agent的表現,盡可能地接近真實世界中對應人群的行為邏輯。
實驗驗證:SocioVerse的強大預測能力
通過這四大引擎的協同工作,SocioVerse試圖構建一個既能夠反映宏觀社會結構和動態,又能夠刻畫微觀個體差異和行為,從而與真實世界高度對齊的社會模擬系統。
為了驗證SocioVerse預測真實世界行為的能力,研究團隊進行了三組實驗。
1. 美國總統2020年選舉預測實驗 研究團隊構建了一個包含33萬多個虛擬選民的模型。為了確保模型的真實性,研究團隊結合了美國官方的人口普查數據和權威的ANES選舉研究數據,為每個虛擬選民分配了12個關鍵的人口統計特徵,並且採用迭代比例擬合IPF技術,讓這些虛擬選民的分佈與美國各州的真實人口分佈保持一致。
隨後,系統設計了一份包含49個問題的詳盡調查問卷,涵蓋從社會安全到LGBTQ+權利的各種政治議題。
結果顯示,當使用Qwen2.5-72b模型的時候,系統在所有州的預測準確率達到了92.2%,在關鍵搖擺州的準確率也高達80%。按照美國“贏者通吃”的選舉人票分配規則,這意味著AI幾乎可以完美預測整個美國總統選舉的結果。
而在“消融實驗”中,研究人員嘗試去掉了一些關鍵模塊,比如不給Agent提供在X上真實的發帖歷史,或者乾脆用隨機生成的人口比例來代替真實的各州人口分佈。結果發現,這兩種情況下,預測的準確率都大幅下降,誤差顯著升高。
2. 模擬分析“突發新聞”的公眾反饋 研究者以2022年底ChatGPT的發佈作為目標事件,嘗試預測公眾對技術突破的反應。他們首先界定了潛在的受眾群體,也就是對技術感興趣的小紅書用戶。
然後從用戶池中採樣了2萬個Agent,並且通過“相同分佈採樣”IDS,確保這些Agent的人口統計學特徵與潛在的受眾群體一致。
然後基於ABC態度模型,也就是情感、行為、認知這三個維度,設計了一份18個問題的問卷,涵蓋公眾認知、感知風險、感知收益、信任、公平和公眾接受度這六個維度。
實驗結果顯示,AI Agent的反應與實際用戶的反應高度一致,甚至在細微的觀點分佈上,都表現出了驚人的相似性。尤其是GPT-4o模型模擬的結果,在KL散度指標上的得分僅為0.196。這個數值越接近0,說明預測分佈與真實分佈幾乎重合。
3. 中國的國家經濟調查 研究團隊根據中國國家統計局的方法論,從用戶池中採樣了1.6萬個Agent,涵蓋全國31個地區。然後精心設計了一份經濟問卷,詢問關於食品、服裝、住房、日用品、交通通訊、教育娛樂、醫療保健和其他八大類消費的具體支出情況。
當模擬結果與官方的統計數據比較的時候,所有測試的AI模型都展現出令人難以置信的準確性,尤其是在發達地區的表現更為突出。像Llama3-70b模型在所有消費類別上的均方根誤差只有0.026,這意味著它能幾乎完美地複製中國居民的消費模式。
與其他虛擬社區的比較
如果是頻道的老觀眾,也許還記得我們很早之前做過的一期節目,那就是2023年末的“斯坦福小鎮”虛擬社區。在那個試驗中,25個AI Agent在封閉環境中生活和互動。之後,Project Sid把“斯坦福小鎮”拓展到了1000人的規模,並且把場景換成了minecraft,那裡的Agent逐步形成了社區和選舉。
但是,這些項目和真實世界之間,還是存在一道清晰的界限。它們都是一個完全封閉的虛構環境,所有角色都是人為創建的,沒有任何真實人類數據的直接輸入,更像是一個精心設計的互動小說,而非真實社會的鏡像。
而SocioVerse這次則是直接建立在1000萬真實人類的行為數據之上,每一個Agent都不是憑空想象的角色,而是基於真實用戶的詳細檔案。
潛在風險與監管
雖然研究者聲稱採取了保護用戶隱私的措施,但是不可否認的是,SocioVerse正在從大規模真實人類行為中提取模式,並且用這些模式來預測更廣泛群體的反應。它不再是在一個想象的世界中進行試驗,而是在創建一個與我們共同生活的社會世界的“數字孿生”。
這種直接與真實世界對接的特性,讓SocioVerse成為了一種全新的社會工具。從積極方面來看,它可以幫助我們更好地理解社會現象,為政策制定提供科學依據。通過模擬不同政策的實施效果,政府可以提前評估可能出現的問題,優化政策方案,提高決策的科學性和合理性。
但是不可忽視的是,SocioVerse也存在潛在的風險。如果它被用於惡意目的,就會成為強大的“民意操縱者”。
過去,互聯網平台利用粗糙的用戶數據,塑造了推薦演算法,製造了信息繭房,從而實現平台利益的最大化。而如今當擁有了像SocioVerse這樣能夠準確預測人類行為的系統時,很難保證平台不會將用它來影響群體決策。
這種影響將更加精細、更加個性化,也更加難以察覺。它不是通過明顯的不實信息操作公眾,而是通過微妙地調整真實信息的呈現方式,在放大某些方面的同時淡化其他方面,從而讓用戶產生預期的心理和行為反應。就像是一根無形的指揮棒,在無聲無息中引導著人們的行為和思想。
這種能力遠遠超越了傳統的個性化推薦,已經變成了對集體行為和社會偏好的積極塑造。
也許,對於這樣的發展,我們需要盡快建立健全的監管機制,確保技術朝著有利於人類社會發展的方向前進,而不是讓AI最終成為操控我們的工具。
那麼大家對SociaVerse這樣的研究是怎麼看的呢?歡迎在評論區留言。感謝大家觀看本期視頻,我們下期再見。