在美國,人們是怎麼給電影評分的?

最近幾天,中文互聯網上最專業影評網站豆瓣電影”成爲了電影界激烈討論的對象。一篇來自廣電總局官辦的《中國電影報》的文章,稱豆瓣電影以及其他社交平臺上“個別大V、公衆號爲博眼球、圈粉絲、流量變現等目的,發佈惡意的、不負責任的言論,嚴重破壞了中國電影的生態環境。”

這件事還真是挺有點活久見的。在美國,如果有這樣的批評來自無論民間還是官方,那簡直是要笑掉大牙了——從來沒聽說過一兩篇影評,一兩家網站就能糟蹋了一國電影生態環境的。如果真有,這國的電影生態環境是有多脆弱呀。

在美國,也有這麼幾個和豆瓣類似,跟電影有關,主流網民經常訪問的網站:專業存儲電影信息兼職打分的IMDb(Internet Movie Database互聯網電影數據庫)、創立快二十年幾經易手的爛番茄 (Rotten Tomatoes)、 專業網絡購票副業打分的“美國版貓眼”Fandango,以及專門聚合書籍和視聽出版產品批評意見的Metacritic。

隨着互聯網和社交網站的快速普及,這幾個網站也形成了獨特的電影打分機制,雖然各不相同,但還都挺受電影市場片方、觀衆和專業批評人士的信任。這也讓它們在國內甚至國際上成爲了具有公信力的電影評分網站。

它們是怎樣工作的呢?

IMDb

現在市面上有一個比較流行的IMDb加權分計算公式,大概長這個樣子:

v = 投票人數,實際上是經常投票的人數,也即IMDb活躍用戶票數

m = 進入IMDb Top 250榜單所需的最小票數

R = 該電影的平均分分數相加除以人數)

C = IMDb數據庫所有電影的平均分

這是一個在統計學上公認比較科學的貝葉斯算法實例。但需要明確的是,這個公式只是IMDb維護Top 250電影榜單所使用的,並不是每一部新電影打分都採用這個方法。

平常,IMDb的用戶可以用1-10顆星來爲一部電影打分,最後IMDb會計算出一個加權平均星數作爲得分。用最近上映的星戰外傳電影《俠盜一號》舉例,在IMDb上的得分是8.2。目前《俠盜一號》在Top 250榜單裡排名205,也就是說我們可以確定它的得分是用上面那個公式計算得到得了。

但是,爲了維護評分的公正,這個日常評分的計算公式仍然是個不能公開的秘密——可知的是,結果依然是加權分,採用了算術平均數(Arithmetic mean)的計算方法,但由於算數平均數容易受到極端數據的影響,IMDb也設計了一些過濾機制。

很明顯,IMDb得分是一個普通觀衆打分的結果。就像美國總統大選全民投票(popular vote)和選舉人票 (electoral vote) 一樣,IMDb在全面和公正的同時,也想要追求專業,體現一下電影人的意見。於是在 上圖的 “Ratings”後面,還有一個百分制的“Metascore”。

這第二個得分又是怎麼來的呢?這就要提到Metascore的來源Metacritic了。

Metacritic

Metacritic是一個出版物專業批評聚合網站,成立於1999年。最早從書評起家,現在的Metacritic的批評對象已經涵蓋了音樂專輯、電影、電視劇、電子遊戲等視聽出版物。注意,重點在於“專業”二字。

要體現專業,首先,Metacritic爲電影打出的Metascore是從主流媒體和專業影評機構影評人那裡聚合而來的,這是它和IMDb評分最主要的不同。這些影評人和他們供職的機構,大多在影評方面具有公信力,比如《衛報》、《紐約時報》、《滾石》、《好萊塢記者》,《時代週刊》和NPR等這樣的大報電臺,都是能參與Metascore計算的專業影評來源。

但不是每個機構和影評人都會自己給出一個準確的分數。實際上Metacritic是這樣做的:來源有分數就用來源分數;來源有星數就大概換算成百分制的分數;如果來源的影評只有文字沒有評分,他們就自己找人去閱讀影評,然後根據讀完的感受自己給一個分,然後再用這個分拿去計算……

雖然這樣計算出的Metascore,看上去不是特別能夠準確和真實地體現批評家的感受,但至少這十幾年過來Metacritic沒怎麼被質疑過。儘管如此,Metacritic在Metascore之外也還是設立了一個Userscore——不會展現在一部電影的頁面上,但用戶投票的工具會直接放在Metascore的下方,給用戶一種投了票就能影響得分的錯覺(詳見下圖)。

Metascore採用百分制,Userscore打分採用十分制。還是用《俠盜一號》舉例,現在的Metascore是65, 整合了51個專業來源;Userscore是7.7,基於1489個用戶打分。

爛番茄

爛番茄創立於1998年,一直致力於提供具有公信力的電影打分。其創始人帕特里克·李曾經在Pingwest品玩的SYNC 2016科技大會上介紹過爛番茄的極盛時的風光和設立的機制。這麼來看,爛番茄也算是影評界的不老鬆。

爛番茄沒有評分!必須明確爛番茄採用的評價系統叫做Tomatometer,一般翻譯成“新鮮度”。一部電影的新鮮度,同樣是由專業的影評意見所決定的。在爛番茄上影評人不打分,也不給星,只能給出Fresh(一個新鮮番茄)和Rotten(一個爛番茄)兩種標記,分別代表推薦和不推薦。

如果超過60%的影評人推薦一部電影,電影的新鮮度就會整體爲Fresh,旁邊有一個百分比顯示新鮮度,也即具體多大比例的影評人推薦;如果超過75%的影評人推薦,像《俠盜一號》一樣,新鮮度就會變成“Certified Fresh”;但如果給Fresh的影評人低於60%,電影就只能得到那一坨綠色的爛番茄了。

和Metacritic一樣,爛番茄也需要確保用戶的意見能夠得到體現,於是又設定了一個Audience Score(觀衆分數)。這個觀衆分數採集來源是觀衆打星,但最後體現出來的所有打出3星半以上的用戶比例。

用打好評的影評人/用戶佔總影評人/用戶人數的比例,而不是一個簡單的數值來評價一部電影,是爛番茄和其他影評網站在本質上的最大區別。它突出的是人羣對一部電影持有的主流觀點,而不是用一個無法讓每個評價者都感同身受的數值。

這個設定讓爛番茄獲得了相當高的信譽,但也不是所有粉絲都能接受的了。比如今年的美國大廠爛片代表作《自殺小隊》的粉絲,就被糊了一臉只有26%新鮮度的爛番茄。結果這些粉絲以爛番茄敵視DC擴展宇宙電影的罪名,在網上發起集體簽名,要求爛番茄關站謝罪……

Fandango

2000年成立的Fandango(原名Tickemaker),可以被理解爲美國版貓眼。它慢慢統一了美國混亂的網絡票務市場,現在最主要的功能就是網上買電影票,查座位情況,以及查看影評等等。

Fandango對粉絲、用戶的地位和意見非常重視,在影評機制上得到了體現。Fandango的電影評價完全採用粉絲打分作爲依據。在該網站上,超過17000名粉絲給《俠盜一號》打出了4星半的評價。

Fandango的評分計算方式看上去並不複雜,應該沒有什麼加權和過濾機制。這也導致了該網站上3星以下電影的數量比爛番茄、Metacritic和IMDb要少得多。幸好Fandango加上了比較專業和嚴苛的爛番茄新鮮度,以及專業的家庭電影評價機構意見(上圖右上角),來中和什麼爛片都能咽得下去的粉絲打分。比如星爵克里斯·普拉特和大表姐珍妮佛·勞倫斯主演的《太空旅客》,粉絲打了4分,卻得到了一顆只有31%新鮮度的爛番茄,也被負責任的專業機構

所以你看,資深人士從電影的藝術和學術的角度進行的專業批判,和普通觀衆以獲得的感官愉悅和心理滿足程度給出的打分,就是這樣在互聯網上和平共處的。

幸運的是,美國商業電影市場經過了一百年的發展已經格外成熟,無論是創作、製作、院線、影評還是周邊開發,都已經走在一條相當專業化的道路上,不太可能像這幾天的中國電影界一樣,發生如此嚴重的爭吵。在美國,佳片會收到它應得的票房和好評作爲獎賞,爛片就算進了電影院也不可能躲得開差評——無論在報紙、電臺還是互聯網上。在美國,對電影的批評,也是言論自由保護的一部分。

若差評不自由,則高分無意義。連中國前總理周恩來都《在文藝工作座談會和故事片創作會議上的講話》裡說過,“人民喜聞樂見,你不喜歡,你算老幾?”