「完美奶茶」該先倒紅茶還是牛奶?史上首次隨機對照實驗找出SOP
▲奶茶要好喝,該先倒紅茶,還是牛奶?(示意圖/Unsplash)
文/塗子沛
摘自/時報出版《數商:向阿里巴巴前副總裁學習數據時代的生存商數》
人類很早就認識到,除了可以藉助觀察、提問的方式收集數據,還可以透過實驗來收集數據,以驗證自己的推斷和猜測。觀察和提問在一般情況下都不會改變自然條件,但實驗完全不同,實驗是故意改變自然條件,干預世界的運行以創造條件,收集最適合追蹤因果關係的數據。
接下來要講的是歷史上最著名的一個實驗,故事的主角是繼高爾頓、皮爾森之後,統計學當之無愧的新領袖費雪(R. A. Fisher, 1890–1962),他被後世譽爲「現代統計學之父」。注意,有「現代」兩個字,相較於格蘭特、高爾頓的時代,統計學又產生了革命性的進步。
故事發生在1920年代的一個下午。這一天陽光明媚,一羣英國紳士和穿着禮服的女士正在室外的餐桌旁暢談,當然,餐桌上少不了美味的奶茶。
一位留着鬍子、戴着厚厚眼鏡的紳士,把一杯泡好的奶茶遞給身邊的一位女士,她是一位博士。沒想到這位女博士搖了搖頭,拒絕了這杯茶,她向這位男子解釋說:「我只喝先倒奶的茶。一杯奶茶,是先放茶還是先放奶,味道完全不一樣。」
「這不可能。」這位男子笑着回答。根據他學過的科學知識,紅茶和牛奶只要混合在一起,不管先後順序怎麼樣,都不會有任何本質上的區別。
但這位女士仍然堅持自己的觀點,並且強調,一杯茶是把茶倒進奶裡,還是把奶倒進茶裡,她一下子就能品嚐出來。
這時候其他人也聚了過來。這聽起來像是隨口說笑,大部分人沒有當真,便一笑置之,但有幾個人開始認真爭論起來。
「那爲什麼不做個實驗,當場檢測呢?」有人提議。實驗應該很簡單,就在這位女士看不到的地方準備兩種方法泡出的奶茶,讓她鑑定不就行了嗎?大家都認爲這是個好辦法。
於是一羣熱心人士開始幫忙準備實驗。他們打算多泡幾杯奶茶,有些是先放茶再加奶,有些是先放奶再加茶,然後將這些奶茶端出來,讓這位女士一一品嚐鑑定。
但問題來了!給女士的這一杯茶,不管是怎麼泡的,假設這位女士根本辨別不出來,完全靠猜的,她也有 50%的機率猜對。兩杯的話,就有 25%的機率猜對。杯數愈多機率愈小,那麼到底要給她多少杯茶,才能證明她即使全部判斷對了,也不是靠猜的,而是她真的知道這兩種泡法確實味道不同呢?
這個實驗之所以有名,是因爲這是歷史上第一次「隨機對照實驗」。這位戴着厚厚眼鏡的男子就是費雪。
▲史上第一個隨機對照實驗,測試奶茶先倒紅茶還是牛奶。(圖/時報出版)
1935年,費雪將這個實驗寫入他的著作《實驗設計法》。他的答案是 8 杯,其中 4 杯用一種方式混合,另外 4 杯用另一種方式混合,然後把它們隨意打亂,端給女博士辨別。注意這裡的「隨意」兩個字,費雪在著作裡強調,這不是人爲隨手決定的順序,而是使用骰子、輪盤等工具來決定的順序,這樣才能確保是真正的「隨機」。
還有,泡茶的時候,爲了避免許多不相關的因素影響這位女士的辨別,還要嚴格控制每杯茶的溫度、茶和奶量的多少,以及它們充分混合的時間,要確保這些條件都完全一樣。
而這位女博士要做的,就是在品嚐之後,將8杯茶分成兩組,一組是把奶倒進茶裡的,一組是把茶倒進奶裡的。
這其實又是一個機率的問題。從8杯裡任意選出4杯,就有70種可能性,而這70種可能性當中,只有一種可能是8杯全部都分對的情況。也就是說,如果完全靠猜的,她猜對的機率是1/70 ≈1.43%。
費雪又計算了這位女博士猜對 6 杯的可能性,這種情況是,女士在把奶倒進茶裡的4杯當中選了3杯,又在把茶倒進奶裡的4杯當中選了1杯,這種組合的可能性有:4×4=16種。猜對6杯的機率是16/70 ≈ 22.85%。
但猜對8杯的可能性只有約1.43%,也就是說,如果有8杯茶,女博士仍然可能全部猜對,但可能性非常低。
也許你會問,雖然約1.43%,可能性確實不高,但也的確有可能啊,也許她就有這麼好的運氣呢?哪怕可能性只有10億分之一,也是有可能的,要是恰好就中了這10億分之一呢?如此下去豈不是沒完沒了,永遠無法得出結論。費雪當然不會讓這種情況發生,那到底該怎麼判斷她是不是用猜的呢?費雪的重要貢獻之一,是提出了判斷一個實驗是否有效,必須設定一個機率的上下限,他稱之爲「顯著水準」,他常常把這個水準訂爲5%。小於5%的,他就認爲可能性可以排除、不考慮。
因爲 22.85%大於 5%,所以他認爲 6 杯不行,要增加到 8 杯,靠猜對的可能性才能下降到顯著水準 5%以下。順便說一下,如果是 10 杯,那麼全部猜對的機率只有 1/1024。
▲當場實驗先倒紅茶還是牛奶,找出打造完美奶茶的SOP。(示意圖/Unsplash)
那實驗的結果呢?
根據現場的人回憶,這位女博士居然準確地判別了8杯茶!這確實有點神奇,她究竟是如何做到的呢?英國皇家化學協會曾經給過一個答案,泡奶茶最佳的方法是先倒牛奶,因爲牛奶蛋白會在攝氏 75 度時發生變化。如果後倒牛奶,那麼牛奶就會被高溫的紅茶包圍起來,導致牛奶蛋白髮生變化,味道也可能有變化,而將紅茶倒入涼牛奶之中,則不會出現這種情況。
連泡茶都如此講究,這又令人聯想到馬克思筆下那「道地的英國人」。這個奶茶實驗成爲統計學歷史上的一段經典逸事,被後世衆多課本引用。
★本文摘自《數商:向阿里巴巴前副總裁學習數據時代的生存商數》,作者塗子沛,大數據先鋒思想家,曾在美國學習、工作多年,2014年從矽谷回到中國,出任阿里巴巴集團副總裁。2018年創建數文明科技,同時擔任伊斯佳股份董事、人民網和國地科技獨立董事。