重大變革當(dāng)中,哪項最為意義重大的?谷歌搜索團隊對此毫不掩飾。
搜索業(yè)務(wù)負(fù)責(zé)人辛格爾明確表示:“當(dāng)然是知識圖譜(Knowledge Graph),只要你開始進行打造,就能慢慢了解現(xiàn)實世界。第二是語音輸入——因為我不能在這里打字,”他一邊說著,一邊向手腕上的三星智能手表打手勢。
“我們還意識到,除了預(yù)測外還需要一些科學(xué),這樣的話人們就不必總是提出問題,因此我們開發(fā)了Google Now?!?/span>
知識圖譜將全世界的知識打造成一個廣大的數(shù)據(jù)庫。語音搜索將語音帶到搜索。
Google Now在用戶提問之前就告知答案。所有這三項都與谷歌對移動端的關(guān)注密切相關(guān)。
這些組成部分——以及它們運作的方式——已經(jīng)在過去三年幫助對谷歌搜索進行改造:從一個“10個藍(lán)色鏈接”的投遞系統(tǒng)到某些幾乎超自然的東西——這個系統(tǒng)的行為并不像計算機,而是一個智能的知識儲備庫,能夠聰明地解譯和滿足你的信息需求。
在你還沒有開始予以尋找的時候,它已經(jīng)完成一切。
谷歌在2010年收購一家名為MetaWeb的公司,該消息并沒有引起太多關(guān)注。但事實證明這筆并購成為了谷歌搜索史上一項最意義重大的變革的關(guān)鍵。
MetaWeb在2005年由丹尼·希利斯(DannyHillis)創(chuàng)辦,他是一位知名的計算機科學(xué)家和企業(yè)家。
在經(jīng)營他的公司Applied Minds時,希利斯構(gòu)想了大量創(chuàng)造性項目,不過他認(rèn)為MetaWeb項目非常意義重大,因而將其剝離出來成為一家獨立公司。
MetaWeb公司在2007年成立,是所謂的Semantic Web的首批重大利用成果之一。
Semantic Web實際上是一種處理多數(shù)據(jù)庫的辦法,經(jīng)整合后數(shù)據(jù)庫中的信息可被輕松閱讀。
希利斯說:“我們嘗試創(chuàng)造一個全球性的數(shù)據(jù)庫,包含全世界的信息?!?/p>
由于Metaweb可以掃描互聯(lián)網(wǎng)來回答問題,因而被廣泛視為是谷歌的競爭對手。
不過在經(jīng)過幾年的經(jīng)營以及超過5000萬美元融資后,希利斯意識到只有加入一家規(guī)模更大的公司——即谷歌——這個想法才能開花結(jié)果。
當(dāng)時,谷歌已經(jīng)在向用戶提問提供一些直接的回答:如果你輸入“奧巴馬生日”,它會在搜索結(jié)果的頂部顯示“1961年8月14日”。
不過,正如谷歌在2010年7月一篇宣布收購Metaweb的博客文章上解釋說,谷歌的搜索引擎未能回答像“美國西岸學(xué)費低于3萬美元的大學(xué)”或“至少奪得過一個奧斯卡獎項的40歲以上藝人”這樣的問題。該篇博客承諾Metaweb將幫助谷歌提供這些答案。
產(chǎn)品經(jīng)理艾米麗·莫斯利(Emily Moxley)從2011年就開始參與到Metaweb項目,她表示:“谷歌收購Metaweb的時候,知道‘物’的概念將成為搜索一個非常重要的部分。
我們認(rèn)為這是快速呈現(xiàn)一些簡要事實以及人們所關(guān)注事物的有關(guān)信息的良好途徑?!?/p>
在2012年5月,谷歌推出了這些Metaweb材料,將其稱為“知識圖譜”(Knowledge Graph)。
該項目從1200萬實體發(fā)展至5億。該產(chǎn)品可以在自認(rèn)為合適的時候?qū)λ阉鹘Y(jié)果提供補充性的答案:多項有關(guān)所搜索主題的關(guān)鍵事實,其位置位于平常的搜索排名的右側(cè)。
這看起來有點“手氣不錯”(I’m feeling lucky)的感覺。
在介紹谷歌如何考慮哪些詞條應(yīng)該獲得知識圖譜結(jié)果時,莫斯利引用了弗吉尼亞州里奇蒙德(Richmond, Virginia)地區(qū)的洲際高速公路系統(tǒng)。
從西北向佛羅里達(dá)州進發(fā)的游客應(yīng)該非常清楚這種情況——在里奇蒙德背部,95號公路出現(xiàn)分叉,駕駛員可以選擇繼續(xù)沿南北主干道行駛并途徑市中心,或者選擇295號公路,在外圍繞過該城市并在里奇蒙德南部再進入95號公路。
她解釋說,如果用戶提供一個搜索詞條,谷歌將其擴展為替代性的形式以及同義詞等,之后提供一個算法測試,從而了解它是否與“知識圖譜”結(jié)果具有相關(guān)性。
“然后,用戶可能會選擇295號公路的出口,說‘好,有什么可能的知識圖譜內(nèi)容會對這個詞條有用?’——我們搜索所有的文件,給出相關(guān)的內(nèi)容。之后用戶再次回到95號公路,我們說‘好,我們認(rèn)為這些內(nèi)容足夠有用,讓我們更顯著地呈現(xiàn)這些信息吧’。”
谷歌搜索與“知識圖譜”整合的2年多里,該公司繼續(xù)改善這款產(chǎn)品(谷歌并未正式公布設(shè)計“知識圖譜”回答的詞條比例,不過似乎大約為25%)。
最初,“知識圖譜”較為動態(tài)。不過這款產(chǎn)品逐漸掌握谷歌搜索本身所具有的學(xué)習(xí)能力,能夠分析用戶的習(xí)慣。
莫斯利舉了“誰在電影《太空炮彈》(Spaceballs)中扮演Barf?”作為例子,“知識圖譜”已經(jīng)接觸了非常多詞條,因而知道如何提供涉及演員和電影的圖解——并且以非??斓乃俣韧瓿?。
“知識圖譜”也在另一個重要領(lǐng)域——新鮮度——取得較大進步。由于谷歌假定對一個問題提供一個正確答案,因此其信息必須與時俱進。
否則,答案會是錯誤的,對用戶造成的影響會比沒有答案更糟糕。
莫斯利表示,“知識圖譜”在2012年推出的時候,其中一個實體的變化——例如大眾汽車(Volkswagen)決定聘請新的首席執(zhí)行官——該系統(tǒng)可能要花長達(dá)2周來反映這種變化?,F(xiàn)在該系統(tǒng)能夠在幾分鐘內(nèi)處理這些新聞并進行調(diào)整。
但是她承認(rèn),對“知識圖譜”而言,這種特定的“大眾汽車首席執(zhí)行官”詞條既是成功也是失敗。新任首席執(zhí)行官要幾個月后才會正式上任。
“知識圖譜”仍然展示當(dāng)前的領(lǐng)導(dǎo)人,不過很多在谷歌輸入“大眾汽車首席執(zhí)行官”詞條的用戶可能尋求的是有關(guān)繼任者的信息。因此,盡管“知識圖譜”是正確的,其回復(fù)可能不會令用戶滿意。
谷歌還需要進行很多改進。首先是增加更多領(lǐng)域和行業(yè);該項目最近增加了汽車、視頻游戲及雨果獎(Hugo Award)獲獎?wù)叩闹R。
不過她表示,谷歌正嘗試找出如何提供更加復(fù)雜的結(jié)果——不再只是快速事實,還提供更主觀、更模糊的聯(lián)想?!叭藗儾恢皇菍κ聦嵏信d趣,”她說。
“他們對一些主觀性的東西也感興趣,如該電視節(jié)目是否好看。這些東西能幫助將‘知識圖譜’提升至新的級別?!边@就像谷歌并不希望讓用戶感覺自己在進行機械搜索,而是咨詢一位圣人,這位圣人不僅無所不知而且在文化方面還具有自己的獨立見解。
不過這還需要走很長的路,并且由于對“知識圖譜”所提供信息的預(yù)期提升,其所犯錯誤也不斷令用戶感到失望。
莫斯利最近較為煩惱,因為她意識到“知識圖譜”雖然了解電視節(jié)目的信息,但是缺乏有關(guān)新節(jié)目以及何時播出的內(nèi)容。
她說:“我希望有這樣的提醒,能告訴我本周有新節(jié)目播出,我也想知道哪些網(wǎng)站有放映,從而可以登陸觀看,”承諾最終谷歌將穿越這個“中間階段”,雖然該項目還沒有將所有東西都收入到目錄中。
談到期望提升,可能“知識圖譜”最顯眼的錯誤是谷歌在2010年夏天收購Metaweb時提到的兩個問題。
4年后,其搜索引擎仍然未能對“美國西岸學(xué)費低于3萬美元的大學(xué)”或“至少奪得過一個奧斯卡獎項的40歲以上藝人”等問題提供一站式答案。