以圖搜圖以圖搜圖,是通過搜索圖像文本或者視覺特征,為用戶提供互聯(lián)網(wǎng)上相關(guān)圖形圖像資料檢索服務(wù)的專業(yè)搜索引擎系統(tǒng),是搜索引擎的一種細(xì)分。通過輸入與圖片名稱或內(nèi)容相似的關(guān)鍵字來進(jìn)行檢索,另一種通過上傳與搜索結(jié)果相似的圖片或圖片URL進(jìn)行搜索。 產(chǎn)生原因以圖搜圖 互聯(lián)網(wǎng)上圖像的數(shù)據(jù)信息日漸龐大,用戶對(duì)網(wǎng)上圖像搜索的要求也在不斷提高,使各種基于Web的圖像搜索引擎應(yīng)運(yùn)而生。圖像搜索引擎的出現(xiàn),使我們對(duì)網(wǎng)上圖像信息的搜索變得非常簡(jiǎn)單,盡管還不很完美,卻已經(jīng)可以滿足我們的大多數(shù)需求。 使用方法一、上傳本地圖片 二、輸入圖片URL地址 用戶通過上傳圖片或輸入圖片的url地址,從而搜索到互聯(lián)網(wǎng)上與這張圖片相似的其他圖片資源,同時(shí)也能找到這張圖片相關(guān)的信息。 購物搜索引擎也是通過上傳圖片或輸入圖片的url地址,搜索到全網(wǎng)同款和相似的商品。 工作原理圖像搜索引擎需要為在Web上瀏覽過的圖像建立索引信息,能夠進(jìn)行圖像分析和判別,為圖像加注釋,存儲(chǔ)抽取出的索引信息建立索引庫,理想的圖像搜索引擎還應(yīng)該能支持基于內(nèi)容的圖像檢索。 1、自動(dòng)查找圖形文:可以通過兩個(gè)HTML標(biāo)簽,即IMG SRC和HREF來檢測(cè)是否存在可顯示的圖像文件,IMG SRC表示“顯示下面的圖像文件”,而HREF則表示“下面是一個(gè)鏈接”,這兩種標(biāo)簽經(jīng)常導(dǎo)向一個(gè)圖像文件。搜索引擎通過檢查文件擴(kuò)展名來判斷鏈接的是否是圖像文件。如果文件擴(kuò)展名是.GIF或.JPG,那它就是一個(gè)可顯示的圖像。 2、人工干預(yù)找出圖像并進(jìn)行分類:即人工對(duì)網(wǎng)上的圖像及站點(diǎn)進(jìn)行選擇。這種方法可以產(chǎn)生準(zhǔn)確的查詢體系,但勞動(dòng)強(qiáng)度太大,限制了處理圖像的數(shù)量。由于圖像不同于文本,需要人們按照各自的理解來說明其蘊(yùn)含的意義,因此圖像檢索比起文本的查詢和匹配要困難得多。圖像搜索引擎大多支持關(guān)鍵詞檢索和分類瀏覽兩種檢索方式,部分可提供可視屬性檢索,但也很有限。它們主要的檢索途徑有以下幾種: a. 基于圖像外部信息:即根據(jù)圖像的文件名或目錄名、路徑名、鏈路、ALT標(biāo)簽以及圖像周圍的文本信息等外部信息進(jìn)行檢索,這是圖像搜索引擎采用最多的方法。在找出圖像文件后,圖像搜索引擎通過查看文件名或路徑名確定文件內(nèi)容,但這取決于文件名或路徑名的描述程度。 b. 基于圖像內(nèi)容特征描述:這是一種語義層次的匹配。需要人工對(duì)圖像的內(nèi)容(如物體、背景、構(gòu)成、顏色特征等)進(jìn)行描述并分類,給出描述詞。檢索時(shí),將主要在這些描述詞中搜索你的檢索詞。這種查詢方式是比較準(zhǔn)確的,一般來講可以獲得較好的查準(zhǔn)率。但需人工參與,勞動(dòng)強(qiáng)度大,因而限制了可處理的圖像數(shù)量,并且需要一定的規(guī)范和標(biāo)準(zhǔn),效果取決于人工描述的精確度。 c. 基于圖像形式特征的抽取:由圖像分析軟件自動(dòng)抽取圖像的顏色、形狀、紋理等特征,建立特征索引庫,用戶只需將要查找的圖像的大致特征描述出來,就可以找出與之具有相近特征的圖像。這是一種基于圖像特征層次的機(jī)械匹配,特別適用于檢索目標(biāo)明確的查詢要求(例如對(duì)商標(biāo)的檢索)。產(chǎn)生的結(jié)果也是最接近用戶要求的。但這種較成熟的檢索技術(shù)主要應(yīng)用于圖像數(shù)據(jù)庫的檢索,在網(wǎng)上圖像搜索引擎中應(yīng)用這種檢索技術(shù)還具有一定的困難。 |
|