好讀周報/相關不代表因果 數學老師指分析數據應小心「倖存者偏差」
量子電腦讓許多要花數十年甚至數萬年的艱深問題,得以在極短的時間中運算推斷出結果。(圖/取自網路)
文/林秋華
尋找不同事物之間的關聯性一直是人們有興趣的主題,例如,研究癌症與飲食、生活習慣的關係;研究智商與未來成就、財富的關係;研究自殺與經濟、年齡的關係。這些在在顯示人們渴望尋求答案,想了解世界的運行方式和人類的行爲模式。在大數據提供的客觀事實中,是否隱藏我們看不到的訊息?是否有什麼潛在的規則呢?今天,我們就來看看幾個有趣的分析,探討大數據對人類生活的影響。
●相關不代表因果 小心導致錯誤決策
然而,「相關」等於「因果」嗎?關於這個千古難題,身爲數學老師還是要再一次強調:相關不代表因果。分析數據時,僅依賴相關性可能導致誤解和錯誤結論。因此,進行更深入的分析,如實驗研究、調查或控制變量的方法,對於確定因果關係至關重要。相關性與因果關係是如此微妙的存在,如果兩件事有因果關係,必然存在高度相關;如果兩件事高度相關,可能存在因果關係,也可能存在偏差觀點。
二次大戰期間,美國哥倫比亞大學統計學亞伯拉罕•沃德教授計算如何減少轟炸機因敵方炮火而遭受損失。研究發現,返回的轟炸機上,彈孔大都出現在機翼,顯示機翼是容易遭受攻擊的目標,因此,促使軍方想在機翼位置加強防護。但亞伯拉罕•沃德教授提出「倖存者偏差」理論,他提出的看法是:返回的飛機之所以返回,乃因爲主體沒有受傷;而那些主體受傷,例如引擎被打中的飛機,根本沒有機會返回。若沒有考慮這些無法返回的飛機,會存在某些偏差觀點。最後,軍方採納教授的提議,爲引擎增加更高的防護,後來也證實這個決定是正確的。這個案例告訴我們,假如只憑着手中的資料,而沒有合理的邏輯推理分析或第三方觀點,很容易陷入「倖存者偏差」,導致錯誤決策。
●忽略倖存者偏差 以偏蓋全易失敗
再舉個例子,有些人主張「學歷無用論」,舉出不少知名創業家如微軟創辦人比爾蓋茲、蘋果創辦人賈伯斯、臉書創辦人馬克•祖克柏等,這樣的「倖存者偏差」,導致很多人以此爲藉口輟學或創業,最後往往以失敗收場。
事實上,這些成功者還擁有其他許多資源,背後也付出了巨大的努力;另一方面,他們是輟學者中的極少數例子,也就是說有更多的輟學者並沒有走向成功之路。當仿效者沒有考慮這些資訊而草率決定時,經常導致不理想的結果。
●挑選分析海量資訊 深度學習居功厥偉
在人工智慧的時代,大數據成爲一門顯學,對各行各業產生深遠影響。隨着科技的進步,我們面臨着海量資訊的挑戰,這些數據的規模和複雜性超出了人類的處理能力。愈來愈多的任務和分析被交由電腦執行,其中,深度學習神經網絡的發展是一系列過程中的重要里程碑。這種技術模擬了人類大腦的運作方式,透過多層次的神經元結構,進行資料的處理和分析。神經網絡能夠自動識別模式,從大量數據中提取有用的資訊,進行預測和分類。這個過程涉及複雜的數學計算,包括線性代數、微積分、機率和統計學等。多虧電腦能夠計算繁瑣且多變的數據,找出隱藏訊息,進而讓人們做出準確的決策。
從商業到醫療、從金融到教育,人工智慧技術的廣泛應用使得我們能夠更高效地處理信息,發展各種創新技術與觀點。最後,值得一提的是,今年的諾貝爾物理學獎得主由普林斯頓大學的霍普菲爾德(John Hopfield)和多倫多大學的辛頓(Geoffrey Hinton)共享殊榮,表彰他們在人工神經網絡領域的基礎性發現與創新,讓機器學習得以成爲現實。化學獎得主爲華盛頓大學的生物化學教授貝克(David Baker)、哈薩比斯(Demis Hassabis)及瓊珀(John Jumper),憑藉DeepMind公司在蛋白質設計與蛋白質結構研究領域的卓越貢獻,拿下本屆化學獎殊榮。兩個獎項皆與人工智慧密切相關,顯示人工智慧已被大量運用在你我生活中,大數據分析正是當中的重要基石。
●作者爲臺南市永仁高中數學老師。