精準的人工智能假新聞檢測器何時能成真?

在雄心勃勃地致力於解決社交媒體和新聞網站上虛假內容帶來的危害時,數據科學家們正在變得富有創造力。

雖然目前尚處於起步階段,但用於創建像 ChatGPT 這樣的聊天機器人的大型語言模型(LLMs)正被招募來識別假新聞。通過更好的檢測,人工智能假新聞檢查系統或許能夠針對深度僞造、宣傳、陰謀論和錯誤信息所造成的嚴重危害發出警告,並最終加以抵制。

下一代人工智能工具將對虛假內容進行個性化檢測,並保護我們免受其侵害。爲了實現向以用戶爲中心的人工智能的這一終極跨越,數據科學需要關注行爲科學和神經科學。

最近的研究表明,我們可能並非總是能有意識地知曉自己正在接觸假新聞。神經科學正在幫助發現潛意識中發生的事情。諸如心率、眼球運動和大腦活動等生物標誌物似乎會因虛假和真實內容而發生細微變化。換句話說,這些生物標誌物可能是表明我們是否上當受騙的“信號”。

例如,當人類觀察面部時,眼動追蹤數據顯示,我們會掃描眨眼頻率和由血流引起的膚色變化。如果這些元素看起來不自然,就能幫助我們判斷我們所看到的是深度僞造。這一知識可以給人工智能帶來優勢——我們可以訓練它模仿人類所尋找的東西,等等。

人工智能假新聞檢查器的個性化是通過運用人類眼球運動數據和腦電活動的發現而形成的,這些發現表明了哪些類型的虛假內容在神經、心理和情感方面對誰產生了最大的影響。

瞭解我們特定的興趣、個性以及情緒反應後,人工智能事實覈查系統就能檢測和預測哪些內容會在我們身上引發最爲強烈的反應。

接下來要做的是定製保障措施。保護我們免受假新聞的危害,還需要建立能夠進行干預的系統——某種針對假新聞的數字對策。有幾種方法可以做到這一點,比如警告標籤、指向專家驗證的可信內容的鏈接,甚至要求人們在閱讀某些內容時嘗試考慮不同的觀點。

我們自己個性化的人工智能假新聞檢查器可以設計成爲我們每個人提供這些對策中的一種,以消除網上虛假內容帶來的危害。

這種技術已經處於試驗階段。美國的研究人員研究了人們如何與社交媒體帖子的個性化人工智能假新聞檢查器互動。它學會了把新聞推送中的帖子數量減少到它認爲是真實的那些帖子。作爲概念證明,另一項研究利用社交媒體帖子爲每個媒體帖子定製了額外的新聞內容,以此來鼓勵用戶查看不同的觀點。

但無論這一切聽起來令人印象深刻還是反烏托邦,在我們忘乎所以之前,可能值得問一些基本問題。

即便不是全部,很多關於假新聞、深度僞造、虛假信息和錯誤信息的研究都突出了任何測謊儀都會面臨的同一個問題。

測謊方式有很多種,並非只有測謊儀測試這一種。有些完全依賴語言分析。另一些則是設計用來讀取人們的面部表情,以檢測他們是否泄露了表明他們在說謊的微表情。同樣,也有一些人工智能系統被設計用來檢測一張臉是真實的還是深度僞造的。

在檢測開始之前,如果我們要發現謊言,我們都需要就謊言的樣子達成一致。事實上,欺騙研究表明這可能更容易,因爲你可以指示人們何時說謊,何時說實話。因此,在培訓一個人或一臺機器來進行區分之前,你有一些瞭解基本事實的方法,因爲他們有可以作爲判斷依據的例子。

要了解一個專業測謊儀的性能好壞,取決於當存在謊言時它指出謊言的頻率(即命中情況)。但同時,他們也不能經常在別人實際上說謊時,錯把對方當作在說實話(即漏報)。這意味着當他們看到真相時,要能夠識別這就是真相(即正確拒絕),並且不能在別人說實話時指責其說謊(即誤報)。這指的是信號檢測,同樣的邏輯適用於假新聞檢測。

對於檢測假新聞的人工智能系統而言,若要達到超級準確的程度,命中的比例需要非常高(例如 90%),所以漏報會非常低(比如 10%),誤報需要保持低水平(比如 10%),這意味着真正的新聞不會被稱爲假新聞。如果根據信號檢測向我們推薦一個人工智能事實覈查系統或人工系統,我們可以更好地瞭解它有多好。

正如最近的一項調查所報道的那樣,可能會有這樣的情形,即新聞內容可能並非完全虛假或完全真實,而是部分準確。我們知道這一點是因爲新聞週期的速度決定了,某個時候被認定準確的內容,之後可能會被發現不準確,反之亦然。因此,假新聞覈查系統有其艱鉅的任務。

要是我們事先就能知道哪些是假新聞,哪些是真新聞,那生物標誌物無意識地區分真假新聞的準確性又怎樣呢?答案是不太準確。當我們看到真實和虛假的新聞文章時,神經活動通常是相同的。

說起眼動追蹤研究,得知道從眼動追蹤技術收集來的有不同類型的數據(例如,我們的眼睛注視一個物體的時間長度,我們的眼睛在視覺場景中移動的頻率)。

因此,根據所分析的內容,一些研究表明,我們查看虛假內容時會更關注,而另一些研究則表明相反的情況。

市場上的人工智能假新聞檢測系統已經在藉助行爲科學的見解,來幫着標記並警告我們防範假新聞內容。因此,同樣的人工智能系統開始出現在我們的新聞推送中,併爲我們獨特的用戶資料提供定製保護,這並非遙不可及。所有這一切的問題在於,我們在瞭解什麼是有效的方面仍有很多基礎工作要做,同時還要檢查我們是否想要這樣。

在最糟糕的情形下,我們僅僅把假新聞當作線上的問題,並拿此當作使用人工智能來解決它的藉口。

但虛假和不準確的內容到處都是,而且在線下也被討論。

不僅如此,我們並非一開始就相信所有的假新聞,有時我們在討論中用它來說明壞點子。

在想象的最佳情形中,數據科學和行爲科學對假新聞可能引發的各種危害的規模信心滿滿。

但是,即便在這兒,人工智能應用與科學魔法相結合,或許依然是極爲糟糕的替代品,比不上不那麼複雜但更有效的解決方案。