計算機視覺與人工智能有密切聯(lián)系,但也有本質的不同。人工智能的目的是讓計算機去看、去聽和去讀。圖像、語音和文字的理解,這三大部分基本構成了我們現(xiàn)在的人工智能。而在人工智能的這些領域中,視覺又是核心。大家知道,視覺占人類所有感官輸入的80%,也是最困難的一部分感知。如果說人工智能是一場革命,那么它將發(fā)軔于計算機視覺,而非別的領域。 人工智能更強調推理和決策,但至少計算機視覺目前還主要停留在圖像信息表達和物體識別階段?!拔矬w識別和場景理解”也涉及從圖像特征的推理與決策,但與人工智能的推理和決策有本質區(qū)別。 1、計算機視覺是一個人工智能需要解決的很重要的問題。2、計算機視覺是目前人工智能的很強的驅動力。因為計算機視覺有很多應用,很多技術是從計算機視覺誕生出來以后,再反運用到AI領域中去。 3、計算機視覺擁有大量的量子AI的應用基礎。 在深度學習出現(xiàn)之前,計算機視覺可以執(zhí)行的任務非常有限,并且需要開發(fā)人員和人工操作人員進行大量的人工編碼和工作。 例如,如果要執(zhí)行人臉識別,則必須執(zhí)行以下步驟: 創(chuàng)建數(shù)據庫:你必須以特定格式捕獲要跟蹤的所有主題的單個圖像。 為圖像添加注釋:對于每個單獨的圖像,你都必須輸入幾個關鍵數(shù)據點,例如眼睛之間的距離,鼻梁的寬度,上唇與鼻子之間的距離以及數(shù)十種定義獨特特征的其他測量值每個人。 捕獲新圖像:接下來,你必須捕獲新圖像,無論是照片還是視頻內容。然后,你必須再次執(zhí)行測量過程,在圖像上標記關鍵點。你還必須考慮拍攝圖像的角度。 經過所有這些手動工作,應用程序最終將能夠將新圖像中的測量結果與數(shù)據庫中存儲的測量結果進行比較,并告訴你它是否與所跟蹤的任何配置文件相對應。實際上,涉及到的自動化很少,大部分工作都是手動完成的。而且誤差幅度仍然很大。 盡管最近取得了令人印象深刻的進步,但我們甚至還沒有解決計算機視覺問題。但是,已經有多家機構和AI公司找到了將由神經網絡驅動的C計算機視覺系統(tǒng)應用于解決實際問題的方法。而且,AI人工智能下的機器學習與深度學習已經成為了趨勢。 從應用前景看,基于計算機視覺的視頻監(jiān)控技術所面臨的巨大市場潛力為視頻結構化技術提供了廣闊的應用前景。 |
|
來自: 記錄美好生活的 > 《互聯(lián)網資訊》