人人都是大說謊家! 但大數據能看穿你的真心
圖文/鏡週刊「認識你自己」是刻在德爾斐的阿波羅神廟上的箴言之一。如何認識真實的自我,一直是千百年來人們思考的大問題。
如今,有數據科學家提供了一個新答案。透過大數據,從谷歌的搜尋引擎中人們有可能找到更逼近與真實的自我。
這是紐約時報報專欄作家,前谷歌數據科學家大衛道維茲(Seth Stephens-Davidowitz)五月份推出的新書《每個人都說謊:大數據、新數據、以及網路能告訴我們的真實自我》(Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are )提出的結論之一。
他挖掘過去五年來人們在谷歌搜尋的數據進行分析,展示了人們私底下在搜尋引擎輸入的字詞和問題和他們對外宣稱的主張並不匹配。
按照書中的說法,每個人都會對自己的朋友、情人和醫生說謊,對市場調查人員說謊,甚至,我們也對自己說謊。但是,如今透過大數據,我們或許有更好的方法來解讀真實的內心世界。
大衛道維茲在紐約時報的另一篇專欄裡提醒我們,別讓社羣網站讓我們生活更悲慘。他說:「我們隱隱約約知道,其他人不可能像他們在臉書上呈現的那般風光、有魅力、有餘裕、兼具知性和幽默歡樂,但是人們可能不由自主會把自己的內在世界,拿來和他人在臉書精心佈置的世界相比較。」
不過,數據告訴我們,真實世界和臉書的世界天差地遠:
比如說,獲新聞獎無數、聲譽卓着的《大西洋期刊》,它在臉書上的按贊數,是專報八卦醜聞的《國家詢問報》按贊數的45倍。不過,國家詢問報整年的銷售量,卻是大西洋期刊的三倍。
在賭城拉斯維加斯,廉價旅館Circus Circus和豪華酒店Bellagio一年的住宿人數大約相當。但是在Bellagio的臉書打卡的人數,是Circus Circus的三倍。
又比如,腸躁症和偏頭痛在美國普遍的程度相當,各自苦惱着約10%的美國人。不過受偏頭痛症狀所苦的人在臉書上成立諮詢協助社團,是腸躁症的2.5倍。
這些數據說明,人們確實存在着心理學上所謂的「社會期許偏誤」(social desirability bias)。在社羣網站上,我們會放大、縮小、或扭曲自我形象,已符合自己想像中,別人對我們的期待。
不過,人雖然會說謊。大數據卻比較不可能說謊。我們不願向情人、朋友、大衆說真心話,但從谷歌搜尋、維基百科條目、臉書的廣告點擊、到約會網站、甚至色情網站,它們默默收集了人類被動且是自願貢獻的的數據,記錄着人們真實的行爲和動機。
舉例來說,從網路數據看歷史統計,「搜尋色情影片的次數多於查看天氣的次數」。但是在接受調查訪問時,只有25%的男性和8%的女性承認他們會看。
在《時代雜誌》知名專欄作家史坦(Joel Stein)對大衛道維茲的專訪中,作者提供了自己網路搜尋紀錄,請大衛道維茲幫他用演算法進行分析,得到一些及有趣(對作家本人而言有點可怕)的發現。
比如說,在網路搜尋關於史坦的相關問題,排名第一的是「史坦是不是同志」。根據大衛道維茲的說法,問某某人是不是gay竟然是網路常見的問題。
演算法也發現,史坦最常搜尋的字詞是Joel Stein,也就是自己的名字。這似乎證明了史坦有點自戀,因爲一般人並不常這麼做。
更讓人尷尬的是,史坦每次搜尋某個女性名人之後,有5%的機率接下來會搜尋她們的裸照。據大衛道維茲的解釋,5%是一般男性的正常值。不過史坦較「不正常」的是,在網路上,他最常搜尋的名人裸照是他自己,Joel Stein!
大衛道維茲的書中另一個有趣的論點是,透過演算法,別人可以比你更瞭解你自己。
他透過Netflix的演算法來說明論點。Netflix在早期會讓用戶自己來排定未來想看的影片。不過,過幾天后,當Netflix提醒用戶自己挑選過的電影時,很少人會真正點擊觀看。
問題出在哪裡?
詢問用戶他們以後打算看什麼影片,他們往往會在名單上填上充滿雄心的、有深度的選項,像是二次世界大戰黑白紀錄片、或是嚴肅的外國電影。
但是幾天之後,他們會看的還是他們通常想看的電影:笑鬧片或是浪漫愛情片。
人性如此持續地欺騙自己,所以Netflix後來乾脆不再問用戶未來想要看什麼影片,而是根據相類似用戶的觀賞影片做推薦。結果效果奇佳。演算法比你更清楚知道你自己。前Netflix的數據科學家阿馬崔恩(Xavier Amatriain)
原來,最瞭解自己的未必是自己。
大衛道維茲說,其實靠人們缺乏自知之明來賺錢的並不只有Netflix。許多健身中心大力招收繳交年費或月費的會員,也是充分運用人們這種過度樂觀的心理。
他說,事實上大部分人都是每一次上健身房付一次費用比較划算。但是,絕大多數的人還是會買下月份或年度通行卡,雄心勃勃規劃自己的健身美夢。
許多金融企業如今都已利用大數據來預測經濟走勢,因爲它比政府機關公佈的經濟數據更即時,更有未來性。在搜尋引擎中「聆聽」訊息,有助人們掌握先機。
大衛道維茲在書中舉的是「失業率」的例子。谷歌的科學家發現,當失業率有上升的跡象時,幾個關鍵詞的搜索頻率會明顯增加。搜尋增加比例最高的居然是某個色情網站!而遊戲網站則緊追在後。不過細想之下也有其道理,因爲失業率即將上升,有一些人開始有大把的空閒時間,而且經濟也還沒開始衰退,自然會想「先輕鬆一下,給自己放幾天假。」這對經濟政策的制定者來說,或許他就可以知道,什麼時候該開始推出因應對策。
書中提到如何判斷男女約會時對彼此有好感,研究人員用影音紀錄了參加快速約會的異性戀男女,然後分析這些人對於在往後進行第二次約會的興趣。
從第一次約會中男女所說的話來分析,可以推估他們可能想進一步交往的機會。
對女性而言,談話時提到自己經常使用「我」這個字,可能是傳遞有興趣的訊息。相反地,對話裡常常出現「有點」、「類似」、或「也許」這類含混閃爍的詞,則是對對方沒興趣。而男性對第一次約會對象有好感時,較常用低沈單一的語調講話。而他對女方說的笑話大笑,或是頻頻向對方表達支持鼓勵的話,(「那一定很不容易」、「好辛苦」...),可能得到較有二次約會的機會。
在大西洋期刊對大衛道維茲專訪中,話題專注在《人人都說謊》這本書探討的另一個重大主題:搜尋數據所透露人們對性愛的焦慮和不安。
人們向搜尋引擎傾吐了平時不便向家人朋友啓齒,但渴望知道答案的問題,諸如性行爲的持續時間、頻率,或對性器官尺寸大小的憂慮。(對這些主題有興趣讀者,可參考網路上有簡體字版的翻譯。)https://www.xcnnews.com/kj/66760.html
這些分析有些結論饒富趣味而發人深省。比如說,網路搜尋顯示,已婚女性關心「我的丈夫是不是同志」要比「我的丈夫有沒有在外面偷吃」高出許多。尤其在田納西、密西西比或南卡羅來納這些美國對同志議題較保守的州,這類求助網站如何知道枕邊人是否同志的搜尋,比想知道自己丈夫是否偷腥高出十倍。不過就理論上,這些男人其中多數可能不是同志,或只不過是對婚姻生活抑鬱寡歡。
這個搜尋結果也符合人性,有些男性遭女性拒絕時可能的疑問也是「她會不會是女同志?」, 它反映的人們遭到否定時,基於本能的心理防禦機制。
另一個讓人感到意外的,是關於色情影片中的性暴力情節。照書中的說法,依據谷歌搜尋的數據,這類型影片受女性歡迎的程度遠高於男性,它可以說是女性最歡迎的色情影片類型。
但是這個訊息本身存在很大的誤解危險。得知這個訊息後,人們是否會認爲性侵害並不是那麼可怕的犯罪?
但事實當然絕非如此。大衛道維茲認爲,這是種性幻想,並不代表真實生活的期待。這有點類似於驚悚的恐怖電影。它也很受女性觀衆的歡迎,但是喜歡電影裡被綁架的情節,並不是希望自己在現實生活裡被人綁架。
大衛道維茲提到自己當初寫書的動機,是想要研究關於種族歧視的問題,關於人們內心的真實想法和接受民調訪問時的說法之間的歧異。
他說,九成九的人們接受訪問時,多半說他們不在意歐巴馬總統個是黑人。但是,同樣這些人在搜尋引擎卻出現一大堆關於種族歧視的駭人搜尋。數據很清楚顯示,許多美國人沒有把票投給歐巴馬的原因,正因爲他是黑人。你可能嘴巴說,某人是黑人或女性無關緊要,但心裡實際的想法卻影響你的行動。大衛道維茲,紐時專欄作家
在寫書的過程中,大衛道維茲認爲他得到兩個最大的心得。第一點有點令人沮喪而且震驚:人們可能口中說一套,而做出完全不同的事。在講禮貌、重視文明的社會裡,黑暗的想法在人們心頭真實存在着。這讓作者對世界感到些微不快,這個世界有點令人恐懼害怕。
不過,第二個發現是,社會中存在着普遍的不安全感,這又讓他感到稍微好過一些。大衛道維茲說,人們在「前臺」的演出,不管是對朋友或是在社羣媒體上,努力表現得彼此相依相持、有自信、行止合宜,但是每個人其實都存在着焦慮,每個人都有精神上的困擾。這或許可以讓我們感到自己不孤單,也讓我們對於他人更有同理和同情的心。
底下是作者在big think網站對這本書的討論:
參考資料:
Everybody lies: What the internet can tell us about who we really are(Bloomsbury)
That time an algorithm whisperer took me to the heart of darkness(Time)
Our searches, ourselves: Google reveals the truth about people's romantic insecurity(The Atlantic)
Don't let Facebook make you miserable(The New York Times)
A former Google data scientist explains why Netflix knows you better than you know yourself(Business Insider)
更多鏡週刊報導聽見金融海嘯的聲音... 網路新工具將圖表化爲鋼琴音階你用「川普演算法」買股嗎?川普推文成華爾街投資新明燈臉書交友延年益壽?最新研究有此結論