一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

百度語音識別系統(tǒng)DeepSpeech簡介

 心不留意外塵 2016-04-14

2014-12-19 02:06:00 不久前,百度的首席科學(xué)家吳恩達(dá)(Andrew Ng)在接受采訪時曾談到了百度最近人工智能項目的進(jìn)展情況,強(qiáng)調(diào)了近期百度重點(diǎn)是攻關(guān)語音識別。現(xiàn)在他們已經(jīng)在這方面取得了突破。

這項成果的名字叫做Deep Speech,是一款采用深度學(xué)習(xí)技術(shù)的語音識別系統(tǒng)系統(tǒng)。其獨(dú)特之處在于,它可以在飯店等嘈雜環(huán)境下實現(xiàn)將近81%的辨識準(zhǔn)確率。

81%的準(zhǔn)確率聽起來似乎不算高。但是同樣環(huán)境下,其他的商業(yè)版語音識別API,包括Bing、Google以及Wit.AI等的最高識別率也只有65%。相比之下這就算十分突出的表現(xiàn)了。而且按照吳恩達(dá)的說法,這樣的結(jié)果依然低估了Deep Speech與其他語音識別系統(tǒng)的準(zhǔn)確率差異,因為Deep Speech進(jìn)行比較時還把其他語音識別系統(tǒng)那些返回空白字符串的結(jié)果排除在外了。而且Deep Speech跟頂級的學(xué)術(shù)型語音識別模型(基于流行的數(shù)據(jù)集Hub5 00建模)相比也高出9個百分點(diǎn)。

百度首席科學(xué)家吳恩達(dá)稱盡管這還只是一項研究,但是公司正在考慮將它集成到供智能手機(jī)和Baidu Eye之類的可穿戴設(shè)備使用的語音識別軟件當(dāng)中。而且百度還在開發(fā)與Amazon Echo類似、集成有語音助手的家電產(chǎn)品,名字叫做CoolBox。除此以外,百度在開發(fā)的智能自行車當(dāng)然也能利用Deep Speech技術(shù)。

Deep Speech的基礎(chǔ)是某種遞歸神經(jīng)網(wǎng)絡(luò)(RNN),這種遞歸神經(jīng)網(wǎng)絡(luò)經(jīng)常被用于語音識別和文本分析。

但是Deep Speech的成功主要得益于一個長達(dá)10萬小時的語音數(shù)據(jù)訓(xùn)練集。這是百度人工智能實驗室團(tuán)隊用新穎的辦法在嘈雜環(huán)境下建立的。其過程大致是這樣的。首先百度收集了7000小時的語音會話數(shù)據(jù),然后再將這些語音文件與包含有背景噪音的文件合成到一起,最后形成約10萬小時的訓(xùn)練集。這些背景噪音包括了飯店、電視、自助餐廳以及汽車內(nèi)、火車內(nèi)等場景。相比之下,Hub5 00的數(shù)據(jù)集總共只有2300小時。

當(dāng)然,這么龐大的數(shù)據(jù)大多數(shù)系統(tǒng)都不知道如何去處理。吳恩達(dá)表示,Deep Speech的成功很大程度上要取決于百度規(guī)模龐大的基于GPU的深度學(xué)習(xí)基礎(chǔ)設(shè)施。GPU(圖形處理器)往往是偏數(shù)學(xué)型計算的首選。許多深度學(xué)習(xí)系統(tǒng)都采用GPU避免通信瓶頸(不過微軟的深度學(xué)習(xí)系統(tǒng)Adam 卻走了不同的路線),但是像百度這樣大規(guī)模的設(shè)施卻是少見的。

百度的另一大改進(jìn),是對這個龐大的數(shù)據(jù)集采用了端到端的深度學(xué)習(xí)模型,而不是標(biāo)準(zhǔn)的、計算代價高昂的聲學(xué)模型。傳統(tǒng)上一般都會把語音識別分別為多個步驟,其中一步叫做語音調(diào)適,但是百度卻不做這一步,而是給Deep Speech的算法提供大量的數(shù)據(jù),然后讓它去學(xué)習(xí)所有需要學(xué)習(xí)的東西。這種做法除了收獲了準(zhǔn)確率以外,還顯著減少了代碼庫的規(guī)模。

這項研究是吳恩達(dá)領(lǐng)導(dǎo)的百度人工智能實驗室多位研究人員的努力成果,論文發(fā)表在了康奈爾大學(xué)圖書館的arXiv.org網(wǎng)站上,感興趣的可到此處下載。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    亚洲淫片一区二区三区| 亚洲午夜福利视频在线| 亚洲精品偷拍视频免费观看| 色哟哟精品一区二区三区| 91香蕉视频精品在线看| 日韩精品视频高清在线观看| 久久99午夜福利视频| 国产在线不卡中文字幕| 国产高清精品福利私拍| 高清不卡视频在线观看| 黄色片一区二区三区高清| 国产精品日韩精品一区| 少妇高潮呻吟浪语91| 又黄又爽禁片视频在线观看| 国产欧美另类激情久久久| 亚洲欧美日韩国产自拍| 国产免费自拍黄片免费看| 亚洲一区在线观看蜜桃| 中文字日产幕码三区国产| 日韩精品一级一区二区| 日韩在线中文字幕不卡| 欧美日韩国内一区二区| 久草视频这里只是精品| 亚洲综合色在线视频香蕉视频| 伊人久久青草地婷婷综合| 大香蕉精品视频一区二区| 成人国产一区二区三区精品麻豆| 亚洲男人的天堂久久a| 日韩丝袜诱惑一区二区| 自拍偷女厕所拍偷区亚洲综合| 国产又爽又猛又粗又色对黄| 久久这里只有精品中文字幕| 日韩中文字幕视频在线高清版 | 又大又长又粗又猛国产精品| 中文人妻精品一区二区三区四区 | 亚洲永久一区二区三区在线| 国产三级欧美三级日韩三级| 麻豆看片麻豆免费视频| 一区二区三区日韩经典| 国产欧美日韩在线精品一二区 | 亚洲国产av在线观看一区|