干貨滿滿！2019百度AI十大技術(shù)創(chuàng)新，每一個(gè)都振奮人心

梅與牛 2019-12-16

展開全文

對(duì)于 AI 而言，即將過去的2019年是一個(gè)碩果累累的年份。一方面，它正在以可見的速度走到我們的身邊、滲透到各行各業(yè)中；另一方面，AI 技術(shù)本身也一直處于高速更迭換代的過程中，支撐著各種落地應(yīng)用成為現(xiàn)實(shí)。

?技術(shù)的進(jìn)化與多元的應(yīng)用場(chǎng)景相得益彰、相互促進(jìn)，“智能時(shí)代”幾乎已經(jīng)觸手可及。

作為中國(guó) AI 領(lǐng)軍者，百度一直在積極同步推動(dòng) AI 技術(shù)創(chuàng)新和產(chǎn)業(yè)智能化。2019年，百度 AI 技術(shù)多年積累和業(yè)務(wù)實(shí)踐的集大成——百度大腦，在算法突破和計(jì)算架構(gòu)升級(jí)的基礎(chǔ)上，實(shí)現(xiàn) AI 算法、計(jì)算架構(gòu)與應(yīng)用場(chǎng)景的融合創(chuàng)新，成為“軟硬一體的AI大生產(chǎn)平臺(tái)”，打通了人工智能產(chǎn)業(yè)化應(yīng)用落地相關(guān)的全部流程，實(shí)現(xiàn)了 AI 技術(shù)的標(biāo)準(zhǔn)化、自動(dòng)化、模塊化。

由此，企業(yè)和開發(fā)者不用重復(fù)“造輪子”，能直接將 AI 應(yīng)用在各個(gè)產(chǎn)業(yè)場(chǎng)景中，促進(jìn)產(chǎn)業(yè)智能化。百度也率先在業(yè)內(nèi)提出“人工智能進(jìn)入工業(yè)化大生產(chǎn)階段”。

干貨滿滿！2019百度AI十大技術(shù)創(chuàng)新，每一個(gè)都振奮人心

做行業(yè)的引領(lǐng)者，需要銳意創(chuàng)新的勇氣。那么，在這個(gè)大跨步向“智能時(shí)代”邁步的一年中，百度在推動(dòng) AI 技術(shù)進(jìn)步方面又給我們帶來了哪些驚喜？讓我們走近看一看。

干貨滿滿！2019百度AI十大技術(shù)創(chuàng)新，每一個(gè)都振奮人心

一、競(jìng)逐人工智能皇冠上的明珠：

知識(shí)增強(qiáng)的語義理解框架 ERNIE 超越谷歌 BERT

自然語言處理關(guān)乎智能體如何理解人類的語言與文字、并在理解的基礎(chǔ)上進(jìn)行人機(jī)智能交互，被稱為“人工智能皇冠上的明珠”，其重要性顯而易見。今年，在自然語言處理技術(shù)方面，百度打造了可持續(xù)學(xué)習(xí)的知識(shí)增強(qiáng)語義理解框架 ERNIE，通過建模海量數(shù)據(jù)中的實(shí)體概念等先驗(yàn)知識(shí)，學(xué)習(xí)真實(shí)世界的語義關(guān)系。

這種融合知識(shí)的語義建模大幅增強(qiáng)了模型的語義表示能力，在共計(jì)16個(gè)中英文自然語言處理任務(wù)上效果超越了谷歌 BERT 和 XLNet。近日，ERNIE 更是在自然語言處理領(lǐng)域權(quán)威數(shù)據(jù)集 GLUE 中榮登榜首，并刷新該榜單歷史，超越了微軟 MT-DNN-SMART, 谷歌 T5、ALBERT 等一眾國(guó)際頂級(jí)預(yù)訓(xùn)練模型。

在全球各國(guó)探尋 AI 關(guān)鍵技術(shù)的道路上，百度 ERNIE 代表中國(guó) AI 科技占據(jù)了舉足輕重的一席之地。

干貨滿滿！2019百度AI十大技術(shù)創(chuàng)新，每一個(gè)都振奮人心

二、方言、中英混合，通通不是問題：

SMLTA 加持，語音識(shí)別準(zhǔn)確率提升15%-20%

語音識(shí)別方面，百度提出流式多級(jí)的截?cái)嘧⒁饬δＰ?SMLTA，這是國(guó)際上首次實(shí)現(xiàn)局部注意力建模超越整句的注意力模型，也是國(guó)際上首次實(shí)現(xiàn)在線語音大規(guī)模使用注意力模型。

SMLTA 在大幅提升識(shí)別速度的同時(shí)，也提高了識(shí)別準(zhǔn)確率。在輸入法有效產(chǎn)品相對(duì)準(zhǔn)確率提升15%，音箱有效產(chǎn)品相對(duì)準(zhǔn)確率提升20%。

借助 SMLTA，百度輸入法實(shí)現(xiàn)了業(yè)界普遍認(rèn)為較難實(shí)現(xiàn)的中英文混說識(shí)別，在完全不影響中文語音輸入準(zhǔn)確率的情況下，能進(jìn)行高精準(zhǔn)的中英文混合語音識(shí)輸入。除此之外，方言與方言、方言與普通話的混合語音輸入也完全不在話下。

干貨滿滿！2019百度AI十大技術(shù)創(chuàng)新，每一個(gè)都振奮人心

點(diǎn)擊添加圖片描述（最多60個(gè)字）

三、僅需20句話就能錄制你的專屬聲音：

語音合成 Meitron 讓 AI 體驗(yàn)個(gè)性化起來

你可能已經(jīng)習(xí)慣了“前方路口左轉(zhuǎn)”這樣的地圖語音由一個(gè)標(biāo)準(zhǔn)的女聲發(fā)出，然而百度地圖推出的“語音定制”功能，則可以讓你用自己的聲音、或者是自己想要的其他人的聲音來幫你指揮方向。

這背后是百度語音合成技術(shù) Meitron 的功勞。針對(duì)現(xiàn)階段語音合成方面面臨的風(fēng)格遷移、音色模擬和情感擬人三大挑戰(zhàn)，百度的語音合成技術(shù) Meitron ，可以把聲音中的音色、風(fēng)格、情感等不同元素解耦分離，獨(dú)立組合，靈活控制合成的聲音，只需錄制20句話，就可以制作一個(gè)人的專屬聲音。

基于此技術(shù)，百度上線了全球首個(gè)地圖語音定制功能，為用戶帶來了前所未有的個(gè)性化體驗(yàn)。

干貨滿滿！2019百度AI十大技術(shù)創(chuàng)新，每一個(gè)都振奮人心

四、向著“巴別塔”之巔前進(jìn)：

更高準(zhǔn)確、更低時(shí)延的機(jī)器同傳

翻譯為人類重新建立交流的巴別塔，機(jī)器翻譯則讓無障礙溝通的門檻降得更低。在機(jī)器同傳領(lǐng)域，百度綜合聯(lián)合詞向量解碼、語篇翻譯模型等新技術(shù)，實(shí)現(xiàn)高準(zhǔn)確、低時(shí)延的機(jī)器同傳，并發(fā)布了語音到語音的機(jī)器同傳系統(tǒng)：DuTongChuan（度同傳），以及全球首個(gè)中文-英文演講場(chǎng)景語音翻譯數(shù)據(jù)集（BSTC）。

經(jīng)過真實(shí)測(cè)試，機(jī)器同傳效果媲美人類譯員?？梢哉f，隨時(shí)隨地自由溝通的夢(mèng)想離我們?cè)絹碓浇?/p>

干貨滿滿！2019百度AI十大技術(shù)創(chuàng)新，每一個(gè)都振奮人心

五、換個(gè)“姿勢(shì)”看視頻：

基于知識(shí)圖譜的視頻語義理解能力

在今年的“Baidu Create 2019”百度 AI 開發(fā)者大會(huì)上，百度 CTO 王海峰為大家展示了一段基于知識(shí)圖譜理解音樂紀(jì)錄片《大河唱》的內(nèi)容。影片中的角色、人物關(guān)系、音樂種類、取景地、影片主題等信息，都得到了精準(zhǔn)解析，在屏幕上一一呈現(xiàn)給觀眾。

這是融合了百度知識(shí)圖譜技術(shù)的視頻語義理解能力，通過結(jié)合視覺、語音和自然語言處理技術(shù)解析多模態(tài)信息，并與知識(shí)圖譜的相關(guān)實(shí)體建立關(guān)聯(lián)，通過計(jì)算和推理，得到電影內(nèi)容的結(jié)構(gòu)化語義表示，從而理解電影中出現(xiàn)的角色、音樂和民間藝術(shù)等。

還在因?yàn)橛洸蛔∧巢侩娪袄锛姺睆?fù)雜的的人物關(guān)系而頭疼？有知識(shí)的 AI 來幫你梳理梳理唄。該技術(shù)目前已在百度視頻搜索、推薦、內(nèi)容生成等多個(gè)產(chǎn)品上線。

干貨滿滿！2019百度AI十大技術(shù)創(chuàng)新，每一個(gè)都振奮人心

六、有溫度的 AI，從真人形象虛擬主播開始：

實(shí)時(shí)合成真人虛擬形象在多個(gè)場(chǎng)景應(yīng)用

百度的實(shí)時(shí)合成虛擬形象技術(shù)，結(jié)合多模態(tài)嘴型生成、GAN、TTS 等技術(shù)，實(shí)現(xiàn)了業(yè)界首個(gè)可以量產(chǎn)視頻的真人形象虛擬主播，同時(shí)具備自動(dòng)化、平臺(tái)化、實(shí)時(shí)計(jì)算、大規(guī)模應(yīng)用和效果逼真等技術(shù)特點(diǎn)，可以解決以往虛擬主播形象生硬、響應(yīng)速度滯后、播報(bào)內(nèi)容刻板等問題。

該技術(shù)已經(jīng)成功應(yīng)用于多個(gè)場(chǎng)景。例如，央視與百度合作打造 AI 虛擬主持人小靈，亮相央視2019五四晚會(huì)；與百度合作打造了第一個(gè)真人形象的虛擬主播早晚新聞欄目；浦發(fā)銀行與百度合作打造了業(yè)內(nèi)首個(gè)“金融數(shù)字人”，有顏值、有情感、還有專業(yè)的銀行知識(shí)，將升級(jí)銀行客服體驗(yàn)。

干貨滿滿！2019百度AI十大技術(shù)創(chuàng)新，每一個(gè)都振奮人心

七、讓中國(guó)最好的 AI 跑在中國(guó)自主可控的芯片上：

百度鴻鵠芯片發(fā)布，百度昆侖云服務(wù)器上線

AI 的發(fā)展需要算力的支撐，當(dāng)下 AI 領(lǐng)域精彩紛呈，算力的需求更是大規(guī)模上漲。而在算力層面，芯片始終是受到關(guān)注的焦點(diǎn)。特別是在中國(guó)，開發(fā)者和企業(yè)能否用上自主可控的芯片，又讓這一關(guān)注多了一層意義。

今年，百度發(fā)布了專為遠(yuǎn)場(chǎng)語音交互打造的百度鴻鵠芯片，其設(shè)計(jì)變革了傳統(tǒng)芯片設(shè)計(jì)方法，遵循“軟件定義芯片”的全新設(shè)計(jì)思路。同時(shí)，它采用雙核 HiFi4架構(gòu)，40nm 工藝，2.8M 大內(nèi)存，在此硬件規(guī)格上，僅僅100mW 左右平均工作功耗，即可支持遠(yuǎn)場(chǎng)語音交互核心的陣列信號(hào)處理和語音喚醒能力，將為車載語音交互、智能家居等場(chǎng)景帶來更大想象力。

而在12月，基于百度自主研發(fā)的 AI 加速芯片-KUNLUN1的百度昆侖云服務(wù)器也正式在百度智能云上線。百度昆侖云服務(wù)器與百度自主研發(fā)的產(chǎn)業(yè)級(jí)深度學(xué)習(xí)開源平臺(tái)飛槳深度適配，支持知識(shí)增強(qiáng)語義理解框架 ERNIE 等完全自主可控的領(lǐng)先算法模型，讓中國(guó)最好的 AI 跑在中國(guó)自己自主可控的芯片之上。

干貨滿滿！2019百度AI十大技術(shù)創(chuàng)新，每一個(gè)都振奮人心

八、打造自動(dòng)駕駛的智慧之眼：

國(guó)內(nèi)唯一的城市道路 L4級(jí)純視覺感知解決方案 Apollo Lite

作為車輛與周圍環(huán)境交互的紐帶，感知系統(tǒng)是實(shí)現(xiàn)自動(dòng)駕駛的關(guān)鍵環(huán)節(jié)，可謂是自動(dòng)駕駛系統(tǒng)的一雙“眼睛”。在今年的 CVPR 2019召開期間，百度公開了國(guó)內(nèi)唯一的 L4級(jí)自動(dòng)駕駛純視覺城市道路閉環(huán)解決方案——百度 Apollo Lite。

相比旋轉(zhuǎn)式激光雷達(dá)感知方案，視覺感知方案價(jià)格低且便于獲得，為企業(yè)、開發(fā)者們提供了一個(gè)低價(jià)、優(yōu)質(zhì)的自動(dòng)駕駛解決方案。

干貨滿滿！2019百度AI十大技術(shù)創(chuàng)新，每一個(gè)都振奮人心

九、為自動(dòng)駕駛提供仿真測(cè)試保障：

增強(qiáng)現(xiàn)實(shí)的自動(dòng)駕駛仿真系統(tǒng)登上《科學(xué)》子刊

安全性也是自動(dòng)駕駛至關(guān)重要的一環(huán)。業(yè)界一般認(rèn)為，一個(gè)可靠的、安全的自動(dòng)駕駛系統(tǒng)必須能保證在苛刻的測(cè)試環(huán)境下安全行駛數(shù)億公里。按照這一指標(biāo),若完全使用真實(shí)道路測(cè)試，可能需要長(zhǎng)達(dá)數(shù)十年。

基于計(jì)算機(jī)視覺和 AR 技術(shù)，百度開發(fā)了一種增強(qiáng)現(xiàn)實(shí)的自動(dòng)駕駛仿真系統(tǒng)（AADS），為自動(dòng)駕駛車輛提供更為可靠且廉價(jià)的仿真模擬方法，兼顧自動(dòng)駕駛系統(tǒng)測(cè)試的安全性的同時(shí)，提升測(cè)試效果并極大地縮短測(cè)試時(shí)間。

該系統(tǒng)相較于現(xiàn)有仿真系統(tǒng)，在真實(shí)感、擴(kuò)展性等方面都實(shí)現(xiàn)了突破性的技術(shù)進(jìn)展，并發(fā)表于《科學(xué)》雜志《機(jī)器人學(xué)》子刊。

干貨滿滿！2019百度AI十大技術(shù)創(chuàng)新，每一個(gè)都振奮人心

十、邁向未來計(jì)算新世界：

“量脈”實(shí)現(xiàn)量子軟硬件連接

最后一項(xiàng)關(guān)乎未來。量子計(jì)算被認(rèn)為是未來計(jì)算技術(shù)的心臟。2019年，百度研發(fā)出國(guó)際領(lǐng)先、國(guó)內(nèi)第一的云上量子脈沖系統(tǒng)“量脈”，可將量子計(jì)算軟件指令(邏輯門)轉(zhuǎn)換成控制量子硬件的脈沖序列，算法性能較同類工具實(shí)現(xiàn)成倍級(jí)別的提升，是實(shí)現(xiàn)量子軟硬件連接的關(guān)鍵橋梁。

干貨滿滿！2019百度AI十大技術(shù)創(chuàng)新，每一個(gè)都振奮人心

以上的十大技術(shù)創(chuàng)新，只是百度諸多技術(shù)成果中的一部分。時(shí)代在繼續(xù)向前發(fā)展，百度推動(dòng)技術(shù)創(chuàng)新的步履從不曾停歇。通過不斷推動(dòng)技術(shù)進(jìn)步，百度還將為人工智能產(chǎn)業(yè)和社會(huì)的發(fā)展貢獻(xiàn)更大的力量。

未來還會(huì)有哪些精彩？讓我們拭目以待。

干貨滿滿！2019百度AI十大技術(shù)創(chuàng)新，每一個(gè)都振奮人心

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：梅與牛 > 《人工智能＆編程》

舉報(bào)/認(rèn)領(lǐng)