最近Google指責(zé)Bing抄襲一事炒的火熱。Google先是策劃好在“搜索之未來”大會前一天爆料,然后Bing第一時間回應(yīng)說Google 是編小說呢,然后Google官方博客向Bing開火,Bing再次不承認(rèn),同時還倒打一耙說Google也抄襲我們呢,最后Matt Cutts繼續(xù)拿出了更多證據(jù),甚至連諷刺電視都插一腿進(jìn)來。事情已經(jīng)亂套了,這事到底誰對誰錯呢?SEL的主編Danny Sullivan來了個徹底的分析,他認(rèn)為Google錯怪Bing同學(xué)了,以下是長篇分析。
觀看用戶不算抄襲:微軟不承認(rèn)抄襲了Google的搜索結(jié)果,他們一直都沒承認(rèn)這一點(diǎn),因為他們沒直接看Google同學(xué)的考卷,而是利用點(diǎn)擊數(shù)據(jù)流改進(jìn)搜索結(jié)果的,只不過點(diǎn)擊數(shù)據(jù)流的來源有Google。Bing的集團(tuán)VP Harry Shum也一直堅稱:
Bing的經(jīng)理Stefan Weitz也說:
點(diǎn)擊數(shù)據(jù)流?Google堅持微軟利用了IE瀏覽器和Bing工具欄監(jiān)視用戶在Google搜索了什么,但Bing不承認(rèn)他們只監(jiān)視Google,他們監(jiān)視的是 用戶在整個網(wǎng)絡(luò)上的操作行為。Bing可以看到用戶正在瀏覽什么,假設(shè)他們?nèi)チ税俣?,Bing也會知道的,假設(shè)用戶在百度做了搜索,Bing也會知道你搜 索了什么點(diǎn)擊了什么。其實(shí)叫點(diǎn)擊數(shù)據(jù)流不太準(zhǔn)確,我們暫且給它一個更準(zhǔn)確的名字吧:沖浪數(shù)據(jù)流。 通過沖浪數(shù)據(jù)流獲得搜索活動:人們當(dāng)然上Google的次數(shù)最多,只要他們搜索了什么,Bing就知道,因為只要分析一下他們進(jìn)入的網(wǎng)頁地址就成了: 當(dāng)然Bing也知道用戶點(diǎn)擊了Google的哪個搜索結(jié)果──只需要記錄下一個去到的那個網(wǎng)站的地址即可。這樣做之后,Bing就知道用戶針對某個搜索關(guān)鍵字選擇了哪個最適合的搜索結(jié)果網(wǎng)站。 Bing確實(shí)在分析搜索引擎,但并不只針對Google:其實(shí)前面已經(jīng)說了,Bing的這種沖浪數(shù)據(jù)流的分析并不只針對Google,而是所有網(wǎng)站,即便是在百度搜索,可能也會被Bing所知道。等于說是全天下所有搜索引擎都在幫助Bing提升搜索質(zhì)量,這是一種很聰明的做法。Bing的Shum也承認(rèn)這一點(diǎn):
1000種信號種類:Bing號稱自己有1000種信號種類,搜索只是其中的一種,而且并沒有凌駕于其它信號種類之上。 即便是Google的測試也證明了搜索信號權(quán)重不高:Bing承認(rèn)對于那些怪異關(guān)鍵字的搜索,Bing收集到的沖浪數(shù)據(jù)流會導(dǎo)致其結(jié)果與Google的搜索結(jié)果相近。Google正是掌握了這個證據(jù)才 堅稱Bing抄襲了。但Bing不這么認(rèn)為,他們覺得即便是Google的測試也證明了搜索信號權(quán)重不高,因為Google測試了100個關(guān)鍵字,只有大 概9%導(dǎo)致Bing的搜索結(jié)果跟Google一樣了。 9%確實(shí)是個不高的數(shù)字,Google方面在爆料的時候也說他們不清楚為什么Bing只有9%的結(jié)果上鉤了。Bing稱就是因為搜索信號這個種類的權(quán)重并不高,不會導(dǎo)致自己的搜索結(jié)果全盤與Google一樣,Google的測試反到成了證明這一點(diǎn)的最好證據(jù)。 為啥Google發(fā)現(xiàn)Bing越來越像自己了?Google的故事里還說道他們不是無緣無故釣Bing上鉤的,他們之前已經(jīng)發(fā)現(xiàn)Bing越來越像自己了,非常多的首頁搜索結(jié)果跟Google一模一樣。 但Bing也不承認(rèn)這一點(diǎn)。在去年10月Bing內(nèi)部使用了全新的算法和稱為Aether的實(shí)驗系統(tǒng),來測試排名的變化。這個變化讓Google感到了沖浪數(shù)據(jù)流的存在。 實(shí)際上這是另外一個Google沒清楚回答的問題,Google說他們?nèi)ツ?月就發(fā)現(xiàn)Bing開始用沖浪數(shù)據(jù)流了,但為什么直到數(shù)個月之后才發(fā)現(xiàn)Bing的搜索像自己?Google也不知道,可能是Bing在后來提升了沖浪數(shù)據(jù)流的權(quán)重吧。 為什么說Bing沒有抄襲Google?Bing的部分搜索結(jié)果可能跟Google很像,但僅限非常少的關(guān)鍵字。比如咱們搜索“pontneddfechan”看看,這是南威爾士的一個小城的名字,點(diǎn)擊可放大: pontneddfechan絕對是個長尾的搜索關(guān)鍵字了吧?首先Google找到了71000個匹配結(jié)果,Bing只有9000個。然后首頁10個搜索結(jié)果里,Bing只有4個跟Google重合,而僅僅有一個(雷打不動的第一位維基百科)搜索結(jié)果的排名是完全一樣的。 再看看一個拼錯的單詞“bombilate”的搜索結(jié)果: 這是拼錯的單詞,Google會給出拼對的搜索結(jié)果,然后問你是不是要堅持搜索錯誤的拼寫。而Bing呢?壓根不問你,直接給出正確拼寫的搜索結(jié) 果,但是跟Google的結(jié)果并不一樣。別忘了Google當(dāng)初就是這么發(fā)現(xiàn)Bing在利用沖浪數(shù)據(jù)流抄襲自己的,但是在這個例子里二者的結(jié)果并不相同。 Google為啥要吵吵Bing抄襲了?9%的上鉤率,并不完全一樣的長尾搜索結(jié)果,并不完全一樣的錯誤拼寫搜索結(jié)果,那么Google干嘛還要高調(diào)爆料Bing抄襲了呢? 因為Google看到了Bing改進(jìn)搜索質(zhì)量的方法,特別是對于不常用搜索關(guān)鍵字和錯誤拼寫的搜索結(jié)果提升很明顯。對Google來說,Bing全盤抄襲Google并不是最可怕的,可怕的是Bing在利用自己的辦法對Google進(jìn)行去粗取精的篩選。 要Bing停止從Google去粗取精的行徑?Google并未起訴Bing,而只是爆料,并要求Bing停止通過沖浪數(shù)據(jù)流分析Google搜索結(jié)果的行徑。但Bing的經(jīng)理Weitz也做出了回應(yīng):
Weitz同時也指出他不相信Google就沒有使用Google Toolbar和Chrome瀏覽器做著同樣的勾當(dāng),以改進(jìn)自己的搜索質(zhì)量。其實(shí)就算Google不讓Bing直接從他們那里獲得沖浪數(shù)據(jù)流,他們一樣有 辦法,因為Google的搜索引擎正在驅(qū)動著很多很多的大網(wǎng)站,包括ISP合作商、Ask.com、大型門戶網(wǎng)站等等,Bing大可以繼續(xù)從他們那里獲得 數(shù)據(jù)。 Google的工具條在干著什么勾當(dāng)?Google起初的回應(yīng)是說自己從未利用工具條數(shù)據(jù)來截取任何Google的搜索結(jié)果頁面,是啊,他們何必要用這種繞一個大圈子的方式獲得自己搜索 引擎的數(shù)據(jù)呢?他們說自己的工具欄只是去測量網(wǎng)站速度,至于做不做其它的事情呢?這個問題自打事情爆出的第一天就拋給Google了,但至今他們?nèi)晕醋龀? 任何回復(fù),哈? 沒完沒了:這個事情還遠(yuǎn)遠(yuǎn)沒有結(jié)束,或者說才剛剛開始。這不是一場由兩家公司公關(guān)部門引起的爭端,而是工程師在真刀真槍的進(jìn)行著較量。搜索質(zhì)量和搜索結(jié)果是一 個搜索引擎的命根子,Google是否還在改進(jìn)自己的搜索結(jié)果?Bing是不是比以前更出色了?誰又超過誰了?這才是最重要的。 |
|