Google是如何做移動搜索的(下)
長久以來Google的旗艦產品已成爲我們生活的一部分。但Google並不認爲搜索理所當然就應該是那樣的。此文編譯自《In The Plex : How Google thinks, Works, and Shapes Our Lives》作者Steven Levy的文章,是有關Google搜索變革研究的第一部分。
Google是如何做移動搜索的(上)
語音搜索
在意識到移動技術即將變得無所不在後,Google決定對搜索進行一個微妙但同時又是巨大的變動。它不再把查詢視爲提交給計算機系統的指令,而是把所有的輸入當作是對話。而在這裡面,交互方式比輸入更自然的語音將起到非常重要的作用。
這種改變並不僅僅是搜索引擎處理查詢方式的改變,也需要用戶在思想上做出改變。就像以前Google教育用戶要以查詢的方式組織搜索一樣,現在Google需要用戶以對話的方式進行思考。不過顯然後面這種方式並不需要太多的教育,因爲這是我們自然的交互方式。
實現這一變動需要兩方面的舉措。首先是搜索引擎必須更仔細地傾聽,甚至要解析含糊不清的語音輸入,這種能力此前只有人類才具備。然後Google還需要確保人對着手機說話或在搜索框輸入口語化文字時系統知道人在說什麼。
Google攻關語音識別技術已有好些年頭。2000年代中期時,Google曾推出過一個名爲Google 411的服務,做的事情跟電話公司一樣,就是給客戶提供電話查詢系統,不同的是後者是付費的。而Google的收穫是通過數百萬的免費電話學習如何正確解析多語種多口音的語音。但是Google無法獲得其所需的2500條短語在一部分地區的樣本,於是Google就直接派人去到哪些地方採樣。
付出終於獲得回報—Google搜索可兼容159種語言,而語音搜索現在已能識別其中的59種。公司宣稱,其“單詞錯誤率”已經降到了8%。
Amit Singhal的副手Ben Gomes以自己爲例演示了Google取得的里程碑式進展。這位印度出生的工程師發音不太標準,在上述行動前,他是沒有機會親自演示Google的語音識別能力的,以往Google都是派一位發音純正深受機器青睞的專家來做演示的。不過現在Gomes跟那位傢伙已經失去了聯繫。“他已經變得可有可無了。我就可以做演示。哪怕你讓我站在記者前進行查詢我也不怕。”
此外,Google還需要考慮讓手機給人回話。它應該用哪一種嗓音呢?像Siri那樣擬人化?還是用一種可辨識的機器人語音來讓用戶意識到對自己正在跟系統(而不是人造人)對話?Google選擇了後者。其首席搜索設計師Wiley說,爲了避免造成與有意識的實體對話的幻覺,你需要自動化一種皮克斯級的敘事能力。“我認爲我們與計算機可以喚起人性到人類感到舒服的地步仍有很長一段距離。”
但是技術的發展很快,足以爲Google提供一種高級的語音交互能力。Gomes認爲,語音識別能力的提高得益於計算機的處理速度變快、硬件變好以及軟件算法的改進,但是最大的變化是Google對語言的理解能力提升了。
頭銜爲搜索部門“著名研究科學家”的Fernando Pereira研究自然語言處理(NLP)已有30個年頭。過去幾年,在如何將搜索查詢與網上的文檔及其他信息集匹配上Google已經解決得相當好,但是像Knowledge Graph這樣得數據庫的引入給搜索引擎帶來機遇的同時也帶來了挑戰。Pereira說:“你使用的語言是否與數據庫的設計方式匹配變得更加難以判斷。”
比方說,Google會收到這樣的查詢:“巨人隊在哪裡打比賽?”雖然是短短的一句話,但引擎需要了解大量信息:這涉及到了體育,某支隊伍打的是主場等等。然後它還得做出選擇,這裡指的是棒球隊還是橄欖球隊?用戶是想知道這支隊伍的主場體育場還是像瞭解它下週去哪裡打比賽?Google通過信號和此前的用戶行爲去構建答案。這些理解、判斷、推理都是幾年前Google沒有做過的。
一旦清除了這些障礙,Google的NLP系統就能從知識圖中獲得更大的推力,開始逐漸理解世界。包括在用戶措辭不佳甚至表達混亂的情況下揣摩用戶想問什麼。比方說用戶在手機上輸入“戴維 卡梅倫”時系統已經知道這兩個詞是配對的,知道這是一個人—然後賦予代詞“他”。哪怕麥克風捕捉不到姓氏,知識圖也能斷定這位英國總理是主題。
Google懂得越多,就能更好地理解你
2004年,我問Larry Page和Sergey Brin對搜索的長期願景是什麼。Larry說,搜索應該被包含進人的大腦裡。“當你思考某件東西時如果不太瞭解的話,你可以自動獲得信息。” Sergey指出,關鍵點在於:“你有對話的設備,或者留意周圍發生的事的計算機,從而可以提供有用的信息。”
2010年,兩位Android工程師Baris Gultekin和Andrew Kirsme倒騰的一個“20%(注:Google的70/20/10時間分配原則)”項目跟這一願景的精神非常一致,於是就誕生了後來的Google Now。
根據Gultekin的說法,目前的Google Now與他們最初的設想也保持着高度的一致。“其核心觀點是你現在的手機並不智能,但是是可以做到智能的,”他說:“如果我們能夠把可感知、可連接的強大設備與Google的威力結合到一起的話會怎樣?”
換言之,Google Now可回答你太懶或沒時間問的查詢。這意味着要通過多領域信息的結合來處理某件重要的事。Gultekin說一開始要建立這樣一套系統去做這樣的事是很恐怖的,但他和夥伴先把目標分解成一個領域,通勤。但即便這樣一件有限的事情也需要系統具備大量的知識:家和辦公室的位置,最佳往返路線,交通模式。當然,Google Maps(以及後來的Waze)知道如何導航是關鍵。Google調用所有的力量去增強這一搜索工具。不久之後,他們有了一款可靠的app來幫助通勤者。“不過我們不希望這只是一款通勤app,” Gultekin說:“我們希望它成爲一位主動的助手,能幫助處理很多事情。”2012年7月,Google Now發佈,當時具備7個領域知識:通勤、飛行、體育、附近地方、旅遊、公交以及天氣。現在Google Now的領域已經增加到70個,且還在快速增長。“我希望Google Now能夠提供你所需的大部分信息,其他的app只有在Google Now沒有你所需的東西時才用,” Gultekin說。
Google Now的效率取決於對世界的深度知識(這個Google搜索和知識圖可以提供)與大量個人信息的整合。這正是爲什麼有人會提出搜索的這個子集實際上是Google本身的借代:每次它都會提供一張即時信息“卡片”。Google Now吸收了一大批的Google服務。一張典型的卡片往往結合了個人郵件、日程表、通信錄、交通安排、交通信息以及天氣等信息。
大家往往不知道Google Now是做什麼的,直到它做了。比方說,你停車時,Google Now會記錄下你停止行駛了,並記住你在什麼地方離開了車子—以防你忘了車子停在哪裡。如果郵件告訴Google Now你在找房子,它可能就會推送一些你希望居住地區的待售房產。
隨着Google Now的不斷演變,現在它已經從20%項目變成了全職服務。不過給Google Now的發展提供最大動力的也許是蘋果。2011年,蘋果發佈了Siri,給Google總部造成了一點點的恐慌,從而加大了這一語音助手項目的投入。隨後它變成了搜索部門的官方組成部分,儘管團隊仍同時分屬搜索和Android。當然這種安排也是合適的,除了推送給用戶的非查詢消息外,所有的個人信息最終都會爲登錄用戶的搜索框所利用(目前可做到“送我上班要多久?”很快將實現“我的車在哪裡?”)。搜索和Google Now非常具有互補性,Gultekin說:“我們希望在你開始搜索前就提供信息,但還是會有很多情況是我們不知道的,比方說你的水管爆了,你需要管道工。” (當然,未來通過Google收購的智能家庭平臺Nest,Google有可能會知道這一點的。)
與舊版搜索相比,Google Now化的搜索只有在使用全系Google產品時才能發揮最大效用。“Larry有個說法— 搜索應該理解你的意思並提供你想要的東西, ” Yehoshua說:“這是一個Google生態體系—如果你登錄手機和桌面,我們可以利用這一點。如果你希望獲得飛行信息,跟蹤包裹以及任何我們可從Gmail獲得的信息,你都可以得到。如果你不用Gmail(當然你不會),你仍然可以獲得我們豐富的語音和回答等等。”
沒有繞行方式—如果你想用Google,但Gmail不是你的首選,那就無法獲得Google Now或甚至Google搜索的全部價值。“生活在一個我們能夠分享所有這些信息的世界裡將是非常美好的,” Yehoshua說:“我不認爲明天就會實現。蘋果做起來會好點,但我們實現會更加困難。”
Google有意識地不把Google Now當作獨立產品。相反,它把Now包含進搜索app裡面。而app本身也不叫“搜索”,很簡單,就叫“Google”。這種取名方式不僅說明了搜索與Google關係之緊密,也說明了Google Now對公司的重要。
儘管如此,Google Now組件還是可選的。使用前Google會提出隱私方面的警告,而該產品的無所不知也可能會成爲令人不安的提醒器,告訴我們這家巨頭對我們的瞭解有多少。Google掌握我們的個人信息越多,它惹上的麻煩也越多—尤其是在歐洲,加強監管、鉅額罰款甚至解體威脅一個沒落,其服務我們的抱負也許會被對隱私的擔憂挫敗。哪怕是那些相信Google的人,在斯諾登披露政府如何輕易獲得我們的信息之後也無法淡定了。如果Google Now知道你在哪裡停的車的話,當地的情報機構是不是也一樣知道?
Amit Singhal認爲,第一代搜索是在人與遠端機器的交互之間隔着一道牆。而我們逐步進入的搜索新時代將會打破這堵牆,這與把移動設備當作電子人化的附體是同步的。我們預期手機會知道我們的意思。我們預計搜索既精通於提供包含我們個人信息的答案,又能從網頁、文檔及公共數據庫中挖掘事實。
“我把搜索視爲一切計算的接口,”Singhal說:“設備消失或最小化或融入環境之後,你又如何跟它們交互呢?因爲大多數時候,你需要採取行動—或者簡單如播放音樂,或者複雜點,寫備忘錄提醒自己來到小賣部附近時記得買牛奶。或者你會有 我老婆的航班是否準時? 或者“奧巴馬有多高?”之類的問題”
大家也許會把過去當作理所當然—抱怨Google搜索已經不像以前那樣。但Singhal指出,Google搜索已經越過了那道橫亙在他面前幾十年的障礙。“作爲一名研究人員我攻關了20年都沒有成功,”Singhal說。他指的就是他的團隊在Google搜索上面所取得的成就。但他也承認,還有比現在多得多的問題有待解決。但在描述某類他不再失敗的查詢背後的科學時,他的聲音充滿了自豪。對了,那個問題就是:
天爲什麼是藍的?
[本文編譯自:medium.com]