隨著Blog的普及和流行,專門針對(duì)Blog的搜索引擎就顯得越來越重要,尤其是今后預(yù)計(jì)會(huì)有越來越多的企業(yè)更加重視來自Blog的個(gè)人的聲音,因此他們會(huì)產(chǎn)生強(qiáng)烈的追蹤Blog內(nèi)容的需求。
正因?yàn)锽log搜索有著重要的應(yīng)用前景,國(guó)外不斷涌現(xiàn)出新的Blog搜索引擎,其中比較常用而且支持中文的主要包括technorati,Feedster,icerocket,bloglines,blogpulse,還有推出測(cè)試后就不見蹤影的Yahoo RSS Search。而中文Blog搜索引擎還處于發(fā)展的初期,無論是知名度還是用戶的使用率應(yīng)該都比較低,主要是八方,Grassland,,,RssShow。
我并不想在此做個(gè)詳盡的中文Blog搜索引擎的測(cè)試,我也不具備這樣搜索引擎詳細(xì)測(cè)試的知識(shí)背景,只是想從幾個(gè)簡(jiǎn)單的方面來判斷哪個(gè)搜索引擎目前能夠帶給我最好的中文Blog搜索結(jié)果。
1、測(cè)試關(guān)鍵詞的選擇:
本來想用keso作為關(guān)鍵詞測(cè)試,但由于有些搜索引擎在結(jié)果中會(huì)根據(jù)URL收錄keso自己的blog,有些不會(huì),會(huì)造成搜索結(jié)果較大的偏差,而且keso這個(gè)詞太集中在IT blogger上。而豆瓣在中文Blog圈中成功的口耳相傳,是個(gè)不錯(cuò)的測(cè)試關(guān)鍵詞。而且豆瓣雖然在IT blogger中更常被提到,但由于其書評(píng)與影評(píng)的特性,非IT blogger中也常會(huì)提及。但是用豆瓣作為測(cè)試關(guān)鍵詞會(huì)有個(gè)問題就是搜索的結(jié)果中會(huì)包括豆瓣醬、郫縣豆瓣或者豆瓣魚這樣的結(jié)果,不過這樣也正好可以測(cè)試這些搜索引擎是否支持高級(jí)語法搜索。
2、豆瓣測(cè)試結(jié)果:
由于不少人在提到豆瓣的時(shí)候很可能會(huì)使用douban來代替,因此在搜索中如果搜索引擎支持就盡量使用OR來包含兩個(gè)關(guān)鍵詞。
英文搜索引擎:
technorati:搜索結(jié)果935個(gè),但是搜索結(jié)果中包括大量的豆瓣醬,不過technorati支持用NOT來去掉不希望出現(xiàn)的關(guān)鍵詞,在去掉豆瓣醬與豆瓣魚之后,搜索結(jié)果只剩下51個(gè),而且大部分的結(jié)果都是MSN Spaces上的blog。利用technorati的tag進(jìn)行搜索,標(biāo)記豆瓣或者douban作為tag的blog共有8篇
Feedster:搜索結(jié)果301個(gè),但點(diǎn)擊到后面的頁(yè)面會(huì)發(fā)現(xiàn)是空頁(yè),實(shí)際搜索到的結(jié)果是154個(gè),而且不支持進(jìn)一步的高級(jí)語法,不能去掉不相關(guān)結(jié)果和進(jìn)一步縮小搜索結(jié)果。
icerocket:搜索結(jié)果1388個(gè),同樣包括不少豆瓣醬的結(jié)果,去掉這些不相關(guān)的結(jié)果后,得到714個(gè)搜索結(jié)果
bloglines:立志要做Blog搜索引擎的bloglines的搜索結(jié)果卻非常讓人失望,居然只能找到兩個(gè)結(jié)果,大為出乎我的意料之外。
Blogpulse:得到27個(gè)搜索結(jié)果,搜索結(jié)果中不包含豆瓣醬的結(jié)果,但由于Blogpulse的特點(diǎn)在于追蹤某個(gè)詞在過去一段時(shí)間內(nèi)在Blog圈中被談?wù)摰念l率,因此它的搜索只能涵蓋過去3個(gè)月的結(jié)果。
Yahoo RSS Search:Yahoo RSS Search雖然沒有正式推出,但我們?nèi)匀豢梢栽赮ahoo搜索的高級(jí)選項(xiàng)頁(yè)面選擇RSS格式類型,得到595個(gè)搜索結(jié)果,去掉“豆瓣醬”等之后的搜索結(jié)果是503個(gè)。
中文搜索引擎:
八方:得到356個(gè)搜索結(jié)果,去掉“豆瓣醬”等不相關(guān)結(jié)果后得到243項(xiàng)結(jié)果。
GrassLand:搜索“豆瓣”得到61個(gè)結(jié)果,搜索“douban”得到7個(gè)結(jié)果,由于GrassLand還不支持高級(jí)語法,因此無法進(jìn)一步排除,初步目測(cè)大部分結(jié)果都是豆瓣網(wǎng),預(yù)計(jì)清除不相關(guān)結(jié)果后搜索到的blog應(yīng)該在50余篇。
feedss:得到186個(gè)搜索結(jié)果,去掉不相關(guān)結(jié)果后得到161個(gè)結(jié)果
feedsearch:搜索豆瓣得到30個(gè)結(jié)果,douban得到3個(gè)結(jié)果,也不支持高級(jí)語法搜索。
rssshow:得到63個(gè)結(jié)果,去掉不相關(guān)的之后得到62個(gè)結(jié)果,不過其中包括大量重復(fù)的搜索結(jié)果。
綜合中英文Blog搜索引擎的搜索結(jié)果,獲勝的是icerocket與Yahoo,而且搜索得到的結(jié)果與其他對(duì)手相比并不在一個(gè)數(shù)量級(jí)上。而在中文Blog搜索引擎中,八方優(yōu)勢(shì)明顯,其次是feedss。
3、搜索結(jié)果訂閱
絕大部分的Blog搜索引擎都支持RSS結(jié)果訂閱,其中technorati采用的是添加到watchlist的方式,不支持RSS訂閱,feedsearch與Rssshow均未提供RSS訂閱功能,feedss同時(shí)提供了將搜索結(jié)果以javescript方式訂閱輸出的功能。
4、其他功能
icerocket與blogpulse都提供了以圖形化輸出反映搜索結(jié)果變化趨勢(shì)的工具
icerocket、Feedster、八方與feedsearch都在搜索結(jié)果中提供了目標(biāo)網(wǎng)站的RSS以供訂閱
Yahoo可以將搜索的結(jié)果直接添加到My Web
GrassLand將搜索結(jié)果分為文章與評(píng)論兩類,但從評(píng)論中搜索到的結(jié)果似乎未必是blog的評(píng)論,困惑中。
以這樣簡(jiǎn)單測(cè)試的結(jié)果,無疑icerocket是目前功能最強(qiáng),搜索結(jié)果最齊全的blog搜索引擎,而其他的中文blog搜索引擎與它還存在不小的差距。但icerocket的高級(jí)搜索不支持僅在中文blog或其他特定語言中搜索,這方面Yahoo的功能最強(qiáng),如果Yahoo的RSS搜索正式推出,是否會(huì)成為Blog搜索的王者呢?那么Google呢?百度又是否會(huì)意識(shí)到對(duì)blog搜索的需求而盡早進(jìn)入這一領(lǐng)域呢?
Update:看來偷懶是不行D,加了比較結(jié)果表