Video thumbnail for 【人工智能】AI操纵人类社会雏形出现?| Socioverse | 社会科学模型 | 1000万真实用户行为 | 社会环境 | 用户 | 场景 | 行为 | 完美预测美国总统选举 | 斯坦福小镇

【人工智慧】SocioVerse研究:1000萬真實用戶行為,精準預測美國總統選舉!

Summary

Language:

Quick Abstract

大家好,这里是最佳拍档,我是大飞。本期节目将探讨知名学者尤瓦尔·赫拉利在新书《智人之上》中关于AI技术可能被少数人掌控进而操控个人行为的观点,以及最新研究“SocioVerse”所揭示的AI技术已迈入群体操控新阶段的现实。

  • 研究背景:传统社会科学研究方法存在成本高、耗时长、样本有限等问题,SocioVerse旨在改变这一局面。

  • 研究挑战:需解决环境、用户、交互机制、行为模式四大“对齐”问题。

  • 研究引擎:设计社会环境、用户、场景、行为四大引擎驱动数字社会模型运转。

  • 实验验证:通过美国总统选举预测、突发新闻公众反馈模拟、中国国家经济调查三组实验,证明SocioVerse预测真实世界行为的能力。

  • 影响与风险:SocioVerse成为全新社会工具,既能助力理解社会现象、优化政策制定,也存在被用于恶意目的的风险。 对于SocioVerse这样的研究,你有何看法?欢迎在评论区留言。感谢观看,下期再见。

人工智慧是否已可操縱群體行為?最新研究揭露AI潛在威脅

作者:大飛

大家好,這裡是最佳拍檔,我是大飛。在我們頻道曾經做過的一期節目中,知名學者尤瓦爾·赫拉利在新書《智人之上》中表示,AI技術可能會被少數人掌控,進而操控個人行為。然而,最新的一份研究顯示,AI的程度似乎已經遠超赫拉利當時的預判。

4月14日,一篇發表在arXiv預印本平台上的研究論文“SocioVerse”,似乎正在揭示一個更為嚴峻的現實,那就是AI技術已經跨越了個體影響的邊界,邁入群體操控的新階段。

社會科學研究的瓶頸

早在二十世紀中葉,社會學理論奠基人亨普爾和歐本海默就曾經預言,真正的因果解釋必須建立在社會現象的可預測性基礎上。在此之後,社會科學家們一直在努力通過問卷調查、訪談、實驗等傳統方法來研究人類行為和社會現象。

不過,這些方法往往成本高昂、耗時漫長,樣本規模有限,有時還會受到倫理和可行性的制約。而SocioVerse希望能夠改變這一局面。

SocioVerse:用AI模擬真實社會

這項研究由復旦大學主導,聯合上創新研究院、羅切斯特大學、印第安納大學以及小紅書共同完成。簡單來說,SocioVerse嘗試利用大語言模型來構建一個“模擬真實社會的虛擬世界”,用AI驅動的Agent來模仿真實的人,並且讓他們在模擬的環境中互動,從而研究和預測複雜的社會動態。

四大挑戰:實現AI與真實社會的“對齊”

但是,要想用AI來模擬一個真實社會,並不是一件容易的事。研究人員首先指出了四個巨大的挑戰,或者說四個必須解決的“對齊(Alignment)”問題。

1. 環境對齊 (Environment Alignment) 我們的現實世界是活的,每天都有新的新聞事件發生,新的政策出台,新的文化潮流湧現。但是,大多數大語言模型訓練好之後,它的知識就相對固定了。如果模擬環境的信息是過時的,那基於這種環境做出的模擬行為,自然也就和現實脫節了。

所以,如何讓模擬環境能實時同步、動態更新,捕捉到真實世界的脈搏?這是第一個坎。

2. 用户對齊 (User Alignment) 真實社會裡的人是形形色色的,我們的年齡、性別、職業、收入、教育背景、成長環境、乃至性格和價值觀都千差萬別。這些差異決定了我們看待問題的方式和行為模式。

如果要讓模擬具有代表性,我們就不能只創造一些“平均”或者“標準”的Agent,而是需要能夠精確地模擬出特定目標群體的特徵和分佈。如何大規模、高精度地創造這些“數字替身”?這是第二個大難題。

3. 交互機制對齊 (Interaction Mechanism Alignment) 人們在社會中的互動方式是多種多樣的,不同的研究問題需要模擬不同的互動場景。如果模擬工具只能處理一種或幾種固定的交互模式,那麼它的通用性和擴展性就會大打折扣。

如何設計一個統一的框架,能夠靈活地模擬各種真實的社會互動結構?這是第三道關卡。

4. 行為模式對齊 (Behavioral Pattern Alignment) 就算我們有了實時的環境、精準的用戶畫像、還有合適的互動場景,最後還有一個關鍵問題,那就是這些AI Agent的行為真的像人嗎?它們做出的決策、表達的觀點,是否符合真實世界裡對應人群的行為模式?

如何確保這些被創造出來的“數字人”,在模擬中表現出的行為,能夠真正反映現實世界中群體的決策邏輯和行為規律,而不是模型自身的“幻覺”或“機械反應”呢?這是最後,也是最核心的挑戰之一。

四大引擎:驅動數字社會模型的運轉

為了解決這些挑戰,SocioVerse精心設計了四個引擎,分別是社會環境引擎、用戶引擎、場景引擎和行為引擎。這四個引擎分別對應著社會結構中最核心的四個邏輯維度,也就是時間性、個體性、情境性和互動性,共同驅動著這個數字社會模型的運轉。

1. 社會環境引擎 (Social Environment) 它的任務就是給整個模擬注入“真實感”,解決環境對齊的問題。它像一個信息聚合器,不斷地從外部世界收集和整理各種信息。

這些信息大致分三類:

  • 第一類是社會結構信息,比如一個地區的人口分佈、文化習俗、城市基建、甚至人們普遍的工作生活習慣等等。這些信息為Agent提供了基礎的“世界觀”。

  • 第二類是社會動態信息,它實時抓取最新的新聞事件、政策變動、熱點話題,並且給這些信息打上時間戳和相關標籤,讓Agent能夠感知到“現在正在發生什麼”。

  • 第三類是個性化內容,就像我們刷手機會看到個性化推薦一樣,這個引擎也能根據Agent的“興趣畫像”,向它們推送相關的模擬帖子或者信息流。這有助於提升Agent行為的多樣性和真實性,避免所有Agent都接收完全一樣的信息。

有了這個引擎,模擬世界就不再是靜止的,而是變得動態和鮮活。

2. 用戶引擎 (User Engine) 它負責解決用戶對齊的難題。這個引擎的核心是一個龐大的用戶池(User Pool)。研究人員從真實的社交媒體平台,主要是X和中國的“小紅書”上,收集了海量的、公開的用戶發帖數據,構建了一個包含1000萬真實用戶的資料庫,相當於希臘或者匈牙利整個國家的人口。

當然,他們也做了嚴格的數據清洗,過濾掉了廣告和疑似機器人的內容。通過這些用戶發過的帖子,系統可以理解到他們的特徵和行為模式。

光有數據還不夠,還需要給用戶打上精準的標籤。於是,用戶引擎還包含了一套複雜的用戶標籤系統 (User Labels)。研究人員定義了多達15個維度的人口統計學和社會學標籤,包括年齡、性別、職業、種族、收入、教育水平、居住地類型、地區、就業狀況、婚姻狀況、宗教信仰、黨派立場、意識形態(自由派/保守派)、大五人格特質(Big Five personality traits)、甚至個人愛好等等。

他們先用多個前沿的大模型,比如GPT-4o,對一部分用戶數據進行初步的標注,然後再請專業的人類標注員進行二次驗證和修正,最後用這些高品質的標注數據訓練出專門的分類器模型,從而經濟高效地為整個千萬級用戶池裡的用戶打上標籤。

有了這個引擎,研究者就可以根據需要,精確地從這1000萬用戶中篩選、採樣,或者合成出符合特定研究要求的、具有高度多樣性和代表性的模擬Agent群體。

3. 場景引擎 (Scenario Engine) 它負責提供不同的“模板”,來模擬現實世界中千變萬化的場景。論文裡列舉了四種典型的模板:

  • 第一種是問卷調查 (Questionnaire),模擬的是像民意調查、市場調研這種場景。通常是一個研究者對應N個受訪者,一輪完成。

  • 第二種是深度訪談 (Indepth Interview),模擬一對一的訪談。研究者可以和模擬Agent進行多輪互動,深入探究它的想法和動機,有助於定性研究。

  • 第三種是行為實驗 (Behavior Experiment),模擬實驗室裡的對照實驗,比如經濟學裡的博弈實驗、心理學裡的決策研究等等。根據實驗設計,可以是研究者對多個參與者,也可以是多個參與者之間互動。

  • 第四種是社交媒體互動 (Social Media Interaction),這是為了模擬像微博、X這樣的在線社交平台上的信息傳播和觀點演化。多個Agent可以自由地發佈內容、評論、轉發,從而形成複雜的網絡互動。

4. 行為引擎 (Behavior Engine) 它是驅動整個模擬運行的核心,負責解決行為模式對齊的挑戰。這個引擎就像是Agent的“大腦”,接收來自其他三個引擎的信息,包括用戶的詳細畫像和歷史數據、當前的社會環境和背景信息、以及模擬正在進行的場景和互動規則。

然後,它利用這些信息來預測和生成每個Agent的行為,可能是回答一個問題,可能是發表一個觀點,也可能是在模擬的社交網絡裡點贊或轉發。

這個引擎的主要動力來源就是大語言模型,可以是通用的大模型,也可以是針對特定領域訓練的“專家模型”或者“領域模型”。論文也提到,對於一些影響力較小或者行為模式相對簡單的邊緣用戶,為了計算效率,也可以使用傳統的基於規則的Agent模型ABM作為補充。

行為引擎的目標,就是讓這些數字Agent的表現,盡可能地接近真實世界中對應人群的行為邏輯。

實驗驗證:SocioVerse的強大預測能力

通過這四大引擎的協同工作,SocioVerse試圖構建一個既能夠反映宏觀社會結構和動態,又能夠刻畫微觀個體差異和行為,從而與真實世界高度對齊的社會模擬系統。

為了驗證SocioVerse預測真實世界行為的能力,研究團隊進行了三組實驗。

1. 美國總統2020年選舉預測實驗 研究團隊構建了一個包含33萬多個虛擬選民的模型。為了確保模型的真實性,研究團隊結合了美國官方的人口普查數據和權威的ANES選舉研究數據,為每個虛擬選民分配了12個關鍵的人口統計特徵,並且採用迭代比例擬合IPF技術,讓這些虛擬選民的分佈與美國各州的真實人口分佈保持一致。

隨後,系統設計了一份包含49個問題的詳盡調查問卷,涵蓋從社會安全到LGBTQ+權利的各種政治議題。

結果顯示,當使用Qwen2.5-72b模型的時候,系統在所有州的預測準確率達到了92.2%,在關鍵搖擺州的準確率也高達80%。按照美國“贏者通吃”的選舉人票分配規則,這意味著AI幾乎可以完美預測整個美國總統選舉的結果。

而在“消融實驗”中,研究人員嘗試去掉了一些關鍵模塊,比如不給Agent提供在X上真實的發帖歷史,或者乾脆用隨機生成的人口比例來代替真實的各州人口分佈。結果發現,這兩種情況下,預測的準確率都大幅下降,誤差顯著升高。

2. 模擬分析“突發新聞”的公眾反饋 研究者以2022年底ChatGPT的發佈作為目標事件,嘗試預測公眾對技術突破的反應。他們首先界定了潛在的受眾群體,也就是對技術感興趣的小紅書用戶。

然後從用戶池中採樣了2萬個Agent,並且通過“相同分佈採樣”IDS,確保這些Agent的人口統計學特徵與潛在的受眾群體一致。

然後基於ABC態度模型,也就是情感、行為、認知這三個維度,設計了一份18個問題的問卷,涵蓋公眾認知、感知風險、感知收益、信任、公平和公眾接受度這六個維度。

實驗結果顯示,AI Agent的反應與實際用戶的反應高度一致,甚至在細微的觀點分佈上,都表現出了驚人的相似性。尤其是GPT-4o模型模擬的結果,在KL散度指標上的得分僅為0.196。這個數值越接近0,說明預測分佈與真實分佈幾乎重合。

3. 中國的國家經濟調查 研究團隊根據中國國家統計局的方法論,從用戶池中採樣了1.6萬個Agent,涵蓋全國31個地區。然後精心設計了一份經濟問卷,詢問關於食品、服裝、住房、日用品、交通通訊、教育娛樂、醫療保健和其他八大類消費的具體支出情況。

當模擬結果與官方的統計數據比較的時候,所有測試的AI模型都展現出令人難以置信的準確性,尤其是在發達地區的表現更為突出。像Llama3-70b模型在所有消費類別上的均方根誤差只有0.026,這意味著它能幾乎完美地複製中國居民的消費模式。

與其他虛擬社區的比較

如果是頻道的老觀眾,也許還記得我們很早之前做過的一期節目,那就是2023年末的“斯坦福小鎮”虛擬社區。在那個試驗中,25個AI Agent在封閉環境中生活和互動。之後,Project Sid把“斯坦福小鎮”拓展到了1000人的規模,並且把場景換成了minecraft,那裡的Agent逐步形成了社區和選舉。

但是,這些項目和真實世界之間,還是存在一道清晰的界限。它們都是一個完全封閉的虛構環境,所有角色都是人為創建的,沒有任何真實人類數據的直接輸入,更像是一個精心設計的互動小說,而非真實社會的鏡像。

而SocioVerse這次則是直接建立在1000萬真實人類的行為數據之上,每一個Agent都不是憑空想象的角色,而是基於真實用戶的詳細檔案。

潛在風險與監管

雖然研究者聲稱採取了保護用戶隱私的措施,但是不可否認的是,SocioVerse正在從大規模真實人類行為中提取模式,並且用這些模式來預測更廣泛群體的反應。它不再是在一個想象的世界中進行試驗,而是在創建一個與我們共同生活的社會世界的“數字孿生”。

這種直接與真實世界對接的特性,讓SocioVerse成為了一種全新的社會工具。從積極方面來看,它可以幫助我們更好地理解社會現象,為政策制定提供科學依據。通過模擬不同政策的實施效果,政府可以提前評估可能出現的問題,優化政策方案,提高決策的科學性和合理性。

但是不可忽視的是,SocioVerse也存在潛在的風險。如果它被用於惡意目的,就會成為強大的“民意操縱者”。

過去,互聯網平台利用粗糙的用戶數據,塑造了推薦演算法,製造了信息繭房,從而實現平台利益的最大化。而如今當擁有了像SocioVerse這樣能夠準確預測人類行為的系統時,很難保證平台不會將用它來影響群體決策。

這種影響將更加精細、更加個性化,也更加難以察覺。它不是通過明顯的不實信息操作公眾,而是通過微妙地調整真實信息的呈現方式,在放大某些方面的同時淡化其他方面,從而讓用戶產生預期的心理和行為反應。就像是一根無形的指揮棒,在無聲無息中引導著人們的行為和思想。

這種能力遠遠超越了傳統的個性化推薦,已經變成了對集體行為和社會偏好的積極塑造。

也許,對於這樣的發展,我們需要盡快建立健全的監管機制,確保技術朝著有利於人類社會發展的方向前進,而不是讓AI最終成為操控我們的工具。

那麼大家對SociaVerse這樣的研究是怎麼看的呢?歡迎在評論區留言。感謝大家觀看本期視頻,我們下期再見。

Was this summary helpful?

Quick Actions

Watch on YouTube

Stay Updated

Get the latest summaries delivered to your inbox weekly.