挖掘搜索2.0的線索
關于搜索引擎大家都有或多或少的期待,因為這個在網(wǎng)絡生活中助手級的工具,它的點滴提升都是能讓所有網(wǎng)民都受益的好事,但是類似百度Google這些業(yè)已成熟的搜索產品,能夠改進和期待的地方非常有限,更何況很多細微的內在的升級都根本都無法在搜索體驗上表現(xiàn)出來,所以關于改變搜索產品形態(tài)、從不同角度重新解讀和發(fā)展現(xiàn)有搜索技術的互聯(lián)網(wǎng)產品越來越多也越有趣,這些blogbeta都有概要的翻譯介紹,使用和研究這些新的所謂2.0的搜索服務以后,發(fā)現(xiàn)其或多或少的在某個角度發(fā)展了現(xiàn)有搜索引擎的,但是顯然離2.0還有些距離,我希望能對于某些細節(jié)作一些補充和仔細描述,試圖發(fā)現(xiàn)一些通往2.0的線索。
Ebrahim Ezzy寫過兩篇名為“Search 2.0 vs Traditional Search”的帖子,介紹了他心目中的2.0時代的搜索引擎。他認為傳統(tǒng)的搜索引擎雖然越來越準確而且覆蓋面也越來越大,但它只是簡單的文本匹配,而并非人們頭腦中關于這個詞匯的含義,而“搜索2.0技術可以使搜索更有意義、客觀和基于任務”“傳統(tǒng)搜索引擎只對尋找信息有利,搜索2.0更善于快速發(fā)現(xiàn)新的信息”。 在他的定義中,傳統(tǒng)搜索引擎是指基于信息檢索技術的搜索引擎,它們的操作包括:布爾查詢(boolean queries)、近似搜索(proximity searches)、文本關聯(lián)(text relevance)和鏈接分析(link analysis),例如:Google, Yahoo, MSN, Ask。 他認為搜索2.0是他心目中的第三代搜索技術,搜索技術發(fā)展的三代劃分是這樣的:第一代,根據(jù)網(wǎng)頁內容來進行網(wǎng)絡站點評級排列,比如早期的yahoo以及Alta vista;第二代,把網(wǎng)絡結構考慮進去,主要是依賴超鏈分析來評級排列,以Google和Overture為代表。第三代,是通過將現(xiàn)有的網(wǎng)絡搜索引擎與新型的經過改進的關聯(lián)模型進行融合設計而成的,它們看重用戶的偏好、合作性、集體智慧、豐富的用戶體驗以及其他很多能使得信息更富有效率的特別性能,例如: Swicki, Rollyo, Clusty, Wink, Lexxe。 對于第三代,作者列舉了十多個這方面的代表:Swicki、Rollyo、Clusty、Wink、Lexxe 、 Gravee 、Jookster、Otavo、 Outfoxed、Yoono、 Krugle 、Koders、LivePlasma、Truveo、 Pandora、Last.fm、Qube、ZoomInfo、ChaCha ,這些東東的確在某種程度上給我們耳目一新的感覺或者給我們打開了關于搜索引擎的新的暢想空間,但是無論從商業(yè)、產品體驗等都無法給人以下一個Google的期待。 以下將從新解讀各個產品來與大家討論,并會不斷補充最新涌現(xiàn)的類似搜索服務。 Swicki是一個社區(qū)化搜索引擎(community-driven),它允許用戶對某一特定術語創(chuàng)建深度集中的搜索。與傳統(tǒng)搜索相比, Swicki的搜索結果可以根據(jù)社區(qū)搜索的行為自動學習和適應,也就是說其搜索結果排序的模型的動態(tài)自我學習成長的。他與傳統(tǒng)搜索引擎的區(qū)別在于,他引入搜索環(huán)境因素影響來改進搜索結果。把搜索者納入到搜索的排體系中,聽起來很好,很難成為一種可成長的模式,用戶參與評價的驅動力是什么?如果用戶分布非常偏狹,這樣的用戶行為也不能會對搜索結果有好的改善,更何況一旦被SPAM盯上,那將更難做到有效提升。 Rollyo是用戶設定主題限定搜索站點集合的人力驅動型搜索。(可以設置包括或除外兩種方式或其結合)Rollyo根據(jù)用戶設定的參數(shù)決定的哪些內容哪些網(wǎng)址包含在他們的“SearchRoll”。用戶可以創(chuàng)建和公開共享他們自己的個人搜索引擎。 SearchRoll不能替代傳統(tǒng)搜索,它僅僅是一種你在特定范圍內搜索你喜歡的信息工具。這與Google Coop,Yahoo個性化搜索,以及l(fā)ive search自定義搜索都是這種類型。 接挖掘搜索2.0的線索(1),繼續(xù)介紹相關網(wǎng)站:
Clusty聚類式搜索引擎,他就是vivisimo的搜索服務站點,提供在搜索結果中把相關主題內容的類聚呈現(xiàn),即把相似項目分組聚合。用戶可以按照自己需要找尋的內容所屬的主題,它超越了傳統(tǒng)元搜索簡單整合集成普通其他搜索引擎的結果,提供了對搜索結果重新進行主題類聚,大大提高了搜索結果信息的豐富程度和二次搜索的靈活體驗。 Wink是people rank的典型,它能讓用戶給他們喜歡的結果打tag貼上標簽,屏蔽阻止不相關的垃圾信息并顯示最好的站點,系統(tǒng)根據(jù)用戶手動分揀的topic特征,站點用戶信任特征被屏蔽特征等形成新的排序參數(shù),以不斷優(yōu)化搜索排序。Google的personalized search正在作類似的工作. Lexxe在作的是做傳統(tǒng)搜索引擎已經在做的,就是主攻動態(tài)摘要技術,它旨在把動態(tài)摘要摘錄好的簡短回答以動態(tài)頁面形式直接返回給用戶,代替了以住的只是尋找答案所在位置的頁面。通過利用字詞的層次和相關含義,它更著重于語言而非符號的處理。某種意義上是在實現(xiàn)問答引擎。雖然現(xiàn)在傳統(tǒng)的搜索引擎已經在動態(tài)摘要和漂紅策略上已經能夠實現(xiàn)在搜索結果列表中解答用戶query的問題,但是需要改進的空間依然很大。這一發(fā)展方向與其他搜索引擎所倡導的onebox策略有所相似,如創(chuàng)始人喬鴻亮說"lexxe引擎把用戶打入文字當作語言來處理,而不是作為符號來處理。它的計算對象直接是語言,而不是一般符號,因為它具備了語言理解能力。" Gravee有個非常有趣的商業(yè)模式,他真正試圖改變搜索引擎經濟的產供銷關系,通過與內容所有者分享廣告收益并且付報酬給它們來獲得搜索結果。雖然這對于站長們來講是一個潛在的獲得收益的機會,但是從搜索引擎角度來看,對終端搜索用戶沒有提供任何顯見的價值,與tagging、community-based ranking相比它更是個虛的概念. Jookster是另一個社區(qū)驅動的社會化搜索工具,它基于瀏覽器toolbar工具欄或者button,源于用戶的社交網(wǎng)絡social network,搜索從一個用戶的書簽和與之相關聯(lián)的有趣的站點,從本質上看,它是社交網(wǎng)絡和搜索引擎的交叉點。有諷刺意義的是這樣對于絕大多數(shù)query將會比有機的結果有更多的廣告,也許當前受制于基本登陸用戶(via here),數(shù)據(jù)庫非常受限,它是社會化網(wǎng)絡和搜索的混合體。其他類似的服務如Otavo; Outfoxed; Yoono 如果說傳統(tǒng)的搜索引擎沒有能解決好你的某些搜索需求,同樣這些所謂的新式的搜索依然沒有能根本上改變這一局面,只是他們看起來那么的有潛力要做出一些新鮮東東出來,而這些東東要改變格局,不只是需要idea,還要接受歷史的考驗. Krugle是為開發(fā)者設計的搜索引擎。它可以很方便的搜索到技術信息、源碼并回答代碼相關的技術問題。它可以從開放源碼庫中、存檔、郵件列表、blog和網(wǎng)頁中獲得代碼樣本提供搜索。并且支持標簽,可共享代碼和搜索結果集合等。從主打優(yōu)勢來看,其在信息抽取上優(yōu)勢比較明顯,這也是現(xiàn)在很多垂直搜索試圖發(fā)展的基礎,比如酷訊.他們的面向的用戶群相對比較小, Krugle力圖幫助程序員快速解決他們問題或獲得相關信息, Koders也是這樣. 專注一域也許能成就一番天地.
LivePlasma 是個提供可視音樂和電影資源搜索的引擎,可檢索的資源涵蓋了樂隊、藝術家、電影、演員和導演等等, 界面支持多語言選擇。它以基于Flash的可視化數(shù)據(jù)檢索為特色,并運用了思維導圖(Mind Mappin)模式,來提示信息的關聯(lián),而且它還是一個推薦式的引擎,能夠發(fā)現(xiàn)相似的音樂和電影,給人們?yōu)g覽. Truveo, Pandora, Last.fm也提供類似的服務. Qube提供點擊一次即可得到搜索結果的桌面應用,不需用瀏覽器/切換程序,甚至不需要輸入關鍵字。它即時搜索已存在于屏幕上的(或手動輸入的)任何文本并快速返回結果,與此同時有實時拼寫檢查、歷史日志、字典結果等等增強搜索功能。所有這些都不會有任何操作性能損害。Qube是Ebrahim Ezzy‘s 的公司. ZoomInfoo為人們和他們的聯(lián)系信息搜捕網(wǎng)頁(公司網(wǎng)址、新聞發(fā)布會、電子新聞服務、證管會申報和其它在線公共信息)。它編制有關個人公司的簡明摘要,并已組織好的形式發(fā)表出來。如果你選擇成為他們的客戶還可以享用社會網(wǎng)絡工具。 隨著web普和增長,人的搜索引擎是一個有意義的需求,然而傳統(tǒng)搜索引擎,比如Google,已經包含巨大的相似信息,專門的人的搜索引擎能處理這些數(shù)據(jù)并且提供一個能充分理解的格式.zoominfoo將信息采集發(fā)揮到難以想像的境界。 Collarity 稱為個性化搜索引擎,是因為它會根據(jù)你的搜索習慣來給出相應的搜索結果。在Collarity中輸入關鍵詞時,搜索框下面會出現(xiàn)實時提示,提示類別分為個性化、社區(qū)和全球。也就是說,你可以查看符合你自己習慣的搜索結果,也可以在查看社區(qū)或大眾化的搜索結果。 ChaCha提供奪圖書館實時參考咨詢服務,由Scott Jones創(chuàng)辦,人稱Mr.Jones,語音郵件以及時下流行的iPod和iTunes音樂數(shù)據(jù)庫中的某幾項技術都和他有關。他所創(chuàng)建的chacha也是個搜索引擎,能提供自動化的搜索結果,同時,通過內嵌式的IM工具,能實時地向問題指導者提問進行咨詢,這些所謂的問題指導者都是網(wǎng)站招募的“打工者”--具有特定專長經驗(domain-specific experience)的人,他們會通過解答問題得到網(wǎng)站付給的酬勞,看來圖書館那些專業(yè)的咨詢員們可以去撈點外快了。 Wondir也是類似的提供圖書相關信息檢索和咨詢的平臺,它的創(chuàng)始人Matthew Koll則在網(wǎng)絡還少有人知的,上個世紀90年代初期,就開發(fā)了一套文本搜索引擎Personal Library Software(PLS)(1998年賣給了著名的AOL),90年代中期,他又第一次提出了Invisible web的概念。2004年8月創(chuàng)建了wondir,它的最初理念是將元搜索技術(matasearch)、深層搜索(deep search)技術以及成百上千的由圖書館員開設的AskA的數(shù)字參考服務結合起來,形成一個用matasearch搜索表層網(wǎng)(Open web)、用deep search搜索深層網(wǎng)(Invisible web)、用人(圖書館員以及志愿者)來進行實時交流,從而將表層網(wǎng)、深層網(wǎng)和人力三個方面的資源結合成一個社區(qū)(community)的知識發(fā)現(xiàn)、共享、交流服務。 如果你看膩了百度Google的平淡,希望新奇玩酷,也可以嘗試Ms.Dewey、searchmash,Snap,甚至可以換個角度看世界用倒過來的elgoog、百度,依然不妨礙你的確要使用搜索引擎找東西的時候還得回到傳統(tǒng)搜索引擎。 |
|