**機(jī)械學(xué)習(xí)** 機(jī)械學(xué)習(xí)是多領(lǐng)域交叉的學(xué)科,可以從學(xué)習(xí)模式和學(xué)習(xí)方法上面進(jìn)行分類,學(xué)習(xí)模式將機(jī)器學(xué)習(xí)分類為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等,學(xué)習(xí)方法可以將機(jī)器學(xué)習(xí)分為傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。 機(jī)器學(xué)習(xí)按學(xué)習(xí)方式分為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。 機(jī)器學(xué)習(xí)是一門涉及統(tǒng)計(jì)學(xué)、系統(tǒng)識別、逼近理論、神經(jīng)網(wǎng)絡(luò)、優(yōu)化理論、計(jì)算機(jī)科學(xué)、腦科學(xué)等多個(gè)領(lǐng)域的交叉學(xué)科。它研究計(jì)算機(jī)如何模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲得新的知識或技能,重新組織現(xiàn)有的知識結(jié)構(gòu)并使其持續(xù)。提高其性能是人工智能技術(shù)的核心?;跀?shù)據(jù)的機(jī)器學(xué)習(xí)是現(xiàn)代智能技術(shù)中最重要的方法之一。根據(jù)不同的學(xué)習(xí)模式、學(xué)習(xí)方法和算法,機(jī)器學(xué)習(xí)有不同的分類方法。 **知識圖譜** 知識圖譜本質(zhì)上是語義網(wǎng)絡(luò)(Semantic Network)的知識庫”。但這有點(diǎn)抽象,所以換個(gè)角度,從實(shí)際應(yīng)用的角度出發(fā)其實(shí)可以簡單地把知識圖譜理解成多關(guān)系圖。 本質(zhì)上來說知識圖譜是結(jié)構(gòu)化的語義知識庫,是一種由節(jié)點(diǎn)和邊組成的圖數(shù)據(jù)結(jié)構(gòu),以符號形式描述物理世界中的概念及其相互關(guān)系,其基本組成單位是“實(shí)體—關(guān)系—實(shí)體”三元組,以及實(shí)體及其相關(guān)“屬性—值”對。不同實(shí)體之間通過關(guān)系相互聯(lián)結(jié),構(gòu)成網(wǎng)狀的知識結(jié)構(gòu)。在知識圖譜中,每個(gè)節(jié)點(diǎn)表示現(xiàn)實(shí)世界的“實(shí)體”,每條邊為實(shí)體與實(shí)體之間的“關(guān)系”。通俗地講,知識圖譜就是把所有不同種類的信息連接在一起而得到的一個(gè)關(guān)系網(wǎng)絡(luò),提供了從“關(guān)系”的角度去分析問題的能力。 知識圖譜可用于反欺詐、不一致性驗(yàn)證、組團(tuán)欺詐等公共安全保障領(lǐng)域,需要用到異常分析、靜態(tài)分析、動態(tài)分析等數(shù)據(jù)挖掘方法。特別地,知識圖譜在搜索引擎、可視化展示和精準(zhǔn)營銷方面有很大的優(yōu)勢,已成為業(yè)界的熱門工具。但是,知識圖譜的發(fā)展還有很大的挑戰(zhàn),如數(shù)據(jù)的噪聲問題,即數(shù)據(jù)本身有錯(cuò)誤或者數(shù)據(jù)存在冗余。隨著知識圖譜應(yīng)用的不斷深入,還有一系列關(guān)鍵技術(shù)需要突破。 **自然語言處理** 自然語言處理是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向,研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語言進(jìn)行有效通信的各種理論和方法,涉及的領(lǐng)域較多,主要包括機(jī)器翻譯、機(jī)器閱讀理解和問答系統(tǒng)等。 機(jī)器翻譯 機(jī)器翻譯技術(shù)是指利用計(jì)算機(jī)技術(shù)實(shí)現(xiàn)從一種自然語言到另外一種自然語言的翻譯過程?;诮y(tǒng)計(jì)的機(jī)器翻譯方法突破了之前基于規(guī)則和實(shí)例翻譯方法的局限性,翻譯性能取得巨大提升?;谏疃壬窠?jīng)網(wǎng)絡(luò)的機(jī)器翻譯在日??谡Z等一些場景的成功應(yīng)用已經(jīng)顯現(xiàn)出了巨大的潛力。隨著上下文的語境表征和知識邏輯推理能力的發(fā)展,自然語言知識圖譜不斷擴(kuò)充,機(jī)器翻譯將會在多輪對話翻譯及篇章翻譯等領(lǐng)域取得更大進(jìn)展。 語義理解 語義理解技術(shù)是指利用計(jì)算機(jī)技術(shù)實(shí)現(xiàn)對文本篇章的理解,并且回答與篇章相關(guān)問題的過程。語義理解更注重于對上下文的理解以及對答案精準(zhǔn)程度的把控。隨著 MCTest 數(shù)據(jù)集的發(fā)布,語義理解受到更多關(guān)注,取得了快速發(fā)展,相關(guān)數(shù)據(jù)集和對應(yīng)的神經(jīng)網(wǎng)絡(luò)模型層出不窮。語義理解技術(shù)將在智能客服、產(chǎn)品自動問答等相關(guān)領(lǐng)域發(fā)揮重要作用,進(jìn)一步提高問答與對話系統(tǒng)的精度。 問答系統(tǒng) 問答系統(tǒng)分為開放領(lǐng)域的對話系統(tǒng)和特定領(lǐng)域的問答系統(tǒng)。問答系統(tǒng)技術(shù)是指讓計(jì)算機(jī)像人類一樣用自然語言與人交流的技術(shù)。人們可以向問答系統(tǒng)提交用自然語言表達(dá)的問題,系統(tǒng)會返回關(guān)聯(lián)性較高的答案。常常用于企業(yè)的智能電話機(jī)器人開發(fā)之中,基于關(guān)鍵詞識別和爬蟲的索引找出一一對應(yīng)的語句,然后進(jìn)行答復(fù)。問答系統(tǒng)目前已經(jīng)有了不少應(yīng)用產(chǎn)品出現(xiàn),大多是在實(shí)際信息服務(wù)系統(tǒng)和智能手機(jī)助手等領(lǐng)域中的應(yīng)用,這是人工智能較為成熟的一個(gè)領(lǐng)域,在不斷市場化擴(kuò)張的同時(shí),機(jī)遇與挑戰(zhàn)并存,一款智能電話機(jī)器人好不好用同樣需要面臨自然語言處理的四大挑戰(zhàn): 1.詞法、句法、語義、語用和語音等不同層面存在不確定性; 2.新的詞匯、術(shù)語、語義和語法導(dǎo)致未知語言現(xiàn)象的不可預(yù)測性; 3.數(shù)據(jù)資源的不充分使其難以覆蓋復(fù)雜的語言現(xiàn)象; 4.語義知識的模糊性和錯(cuò)綜復(fù)雜的關(guān)聯(lián)性難以用簡單的數(shù)學(xué)模型描述,語義計(jì)算需要參數(shù)龐大的非線性計(jì)算 **人機(jī)交互** 人機(jī)交互是人工智能領(lǐng)域的重要外圍技術(shù)。主要研究人與計(jì)算機(jī)之間的信息交換,包括人與計(jì)算機(jī)、計(jì)算機(jī)與人之間的信息交換。人機(jī)交互是一門與認(rèn)知心理學(xué)、人機(jī)工程學(xué)、多媒體技術(shù)和虛擬現(xiàn)實(shí)技術(shù)密切相關(guān)的綜合性學(xué)科。傳統(tǒng)的人與計(jì)算機(jī)之間的信息交換主要依賴于交互設(shè)備,包括鍵盤、鼠標(biāo)、操縱桿、數(shù)據(jù)服裝、眼球跟蹤器、位置跟蹤器、數(shù)據(jù)手套、壓力筆等輸入設(shè)備,以及打印機(jī)、繪圖儀、顯示器、頭盔顯示器、揚(yáng)聲器等輸出設(shè)備。.人機(jī)交互技術(shù)除了傳統(tǒng)的基本交互和圖形交互外,還包括語音交互、情感交互、體感交互和腦機(jī)交互。 **計(jì)算機(jī)視覺** 計(jì)算機(jī)視覺是利用計(jì)算機(jī)模擬人的視覺系統(tǒng)的科學(xué)。它使計(jì)算機(jī)能夠提取、處理、理解和分析與人類相似的圖像和圖像序列。汽車駕駛、機(jī)器人、智能醫(yī)療等領(lǐng)域需要通過計(jì)算機(jī)視覺技術(shù)從視覺信號中提取和處理信息。近年來,隨著深度學(xué)習(xí)的發(fā)展,預(yù)處理、特征提取和算法處理逐漸融合,形成了一種端到端的人工智能算法技術(shù)。根據(jù)所解決的問題,計(jì)算機(jī)視覺可分為五類:計(jì)算成像、圖像理解、三維視覺、動態(tài)視覺和視頻編解碼。 目前,計(jì)算機(jī)視覺技術(shù)發(fā)展迅速,具有初步的產(chǎn)業(yè)規(guī)模。未來計(jì)算機(jī)視覺技術(shù)的發(fā)展將面臨以下挑戰(zhàn): 首先,如何更好地將不同的應(yīng)用領(lǐng)域與其他技術(shù)結(jié)合起來,計(jì)算機(jī)視覺可以廣泛地利用大數(shù)據(jù)來解決一些問題,這些問題已經(jīng)逐漸成熟,可以超越人類,但在某些問題上不能達(dá)到高精 度。 其次,如何減少計(jì)算機(jī)視覺算法的開發(fā)時(shí)間和人力成本。目前,計(jì)算機(jī)視覺算法需要大量的數(shù)據(jù)和人工標(biāo)記,并且需要較長的研究和開發(fā)周期,才能在應(yīng)用領(lǐng)域達(dá)到要求的精度和耗時(shí)。 如何加快新算法的設(shè)計(jì)和開發(fā)。隨著新的成像硬件和人工智能芯片的出現(xiàn),針對不同芯片和數(shù)據(jù)采集設(shè)備的計(jì)算機(jī)視覺算法的設(shè)計(jì)和開發(fā)也是一個(gè)挑戰(zhàn)。 **生物特征識別技術(shù)** 生物識別技術(shù)是指通過個(gè)體的生理或行為特征來識別和鑒別個(gè)體身份。從應(yīng)用過程來看,生物特征識別通常分為注冊和識別兩個(gè)階段。在注冊階段,人體的生物特征信息由指紋、人臉等光學(xué)信息、話筒語音等聲學(xué)信息、數(shù)據(jù)預(yù)處理和特征提取技術(shù)等傳感器采集,并存儲相應(yīng)的特征。 在識別過程中,根據(jù)配準(zhǔn)過程將識別器作為信息采集、數(shù)據(jù)預(yù)處理和特征提取,然后將提取的特征與存儲的特征進(jìn)行比較,完成識別。從應(yīng)用任務(wù)的角度來看,生物特征識別一般分為識別和確認(rèn)任務(wù)。識別是指從存儲庫中識別待識別人員身份的過程,這是一對多的問題。識別是指通過將信息與存儲庫中特定的個(gè)人信息進(jìn)行比較來識別待識別人員的過程。 |
|