中國(guó)AI語(yǔ)音一哥怎么看未來(lái)? 過(guò)去,算法即壁壘,軟件即方案,AI語(yǔ)音缺精進(jìn)但更缺場(chǎng)景。 現(xiàn)在,算法無(wú)限接近極限,場(chǎng)景千樹(shù)萬(wàn)樹(shù)梨花開(kāi),但如何真正讓AI之能觸達(dá)用戶? 科大訊飛的答案:終端硬件,而且是算法定義的硬件。 這也是AI領(lǐng)域競(jìng)爭(zhēng)愈發(fā)激烈的情況下,科大訊飛展現(xiàn)出的最新動(dòng)向。 在2019新品發(fā)布會(huì)上,這家成立20年的AI公司,一口氣發(fā)布5款硬件,并對(duì)其核心的語(yǔ)音操作系統(tǒng)進(jìn)行了升級(jí)。 與往年不同的是,今年的新品發(fā)布會(huì)上,硬件完全成為主角。 不僅有核心級(jí)產(chǎn)品翻譯機(jī)的3.0版本更新迭代,還新推出了智能辦公本、轉(zhuǎn)寫(xiě)機(jī)、智能錄音筆、學(xué)習(xí)機(jī)等等應(yīng)用到工作、生活和學(xué)習(xí)等場(chǎng)景中的產(chǎn)品。 此外,發(fā)布會(huì)上,科大訊飛云端語(yǔ)音操作系統(tǒng)iFLYOS進(jìn)行了優(yōu)化升級(jí)。在今年3月首次亮相的全球首個(gè)多語(yǔ)種AI虛擬主播也現(xiàn)身發(fā)布會(huì),作為串場(chǎng),并用9種語(yǔ)言全程直播本次產(chǎn)品發(fā)布會(huì)。 一句話總結(jié)就是:圍繞語(yǔ)音技術(shù)高地,借硬件之手,以軟件為基,加速技術(shù)落地,覆蓋更多場(chǎng)景。 “借硬件之手”新品發(fā)布環(huán)節(jié)的大部分時(shí)間,都屬于面向C端銷售的硬件產(chǎn)品,也是科大訊飛近年來(lái)發(fā)展的重點(diǎn)。 根據(jù)科大訊飛2018年年報(bào),2018年,科大To C業(yè)務(wù)實(shí)現(xiàn)營(yíng)業(yè)收入 25.17 億,同比增長(zhǎng)96.54%,在整體營(yíng)收中占接近1/3。 訊飛翻譯機(jī)3.0率先登場(chǎng)的,是訊飛的核心產(chǎn)品翻譯機(jī)。截止到2018年底,翻譯機(jī)2.0的銷量已經(jīng)超過(guò)30萬(wàn)臺(tái)??拼笥嶏w表示,僅2018年,翻譯服務(wù)次數(shù)5億+次。 現(xiàn)在,這一產(chǎn)品迭代到了3.0版本。與先前版本相比,在線翻譯可翻譯語(yǔ)言覆蓋全球近200個(gè)國(guó)家個(gè)地區(qū),行業(yè)A.I.翻譯拓展到7個(gè)專業(yè)領(lǐng)域。 3.0版本的翻譯機(jī),支持普通話與粵語(yǔ)、東北話、河南話、四川話等方言之間的翻譯,還新增了維漢、藏漢等民族語(yǔ)言翻譯,翻譯速度也再度提升,達(dá)到“0.5秒閃譯”,并提升了圖像拍照翻譯水平。 此外,離線引擎也有了新的升級(jí),采用了新一代離線語(yǔ)音識(shí)別引擎、離線翻譯引擎,并內(nèi)置了高通驍龍八核處理器。 科大訊飛介紹,這些變化直接讓離線語(yǔ)音識(shí)別訓(xùn)練模型規(guī)模擴(kuò)大5倍,中英文識(shí)別率超95%;翻譯模型容量增加105%,涵蓋詞庫(kù)規(guī)模擴(kuò)大1倍。 這款產(chǎn)品已經(jīng)開(kāi)售,價(jià)格3499元。與2.0版本相比貴了500元。 訊飛轉(zhuǎn)寫(xiě)機(jī)緊跟著的是一款轉(zhuǎn)寫(xiě)機(jī)產(chǎn)品??拼笥嶏w將其定位為“面向辦公場(chǎng)景的語(yǔ)音轉(zhuǎn)寫(xiě)移動(dòng)工作站”。 最大的亮點(diǎn),是內(nèi)置離線解決方案,轉(zhuǎn)寫(xiě)準(zhǔn)確率能夠達(dá)到95%以上;并支持對(duì)講話人進(jìn)行智能分區(qū)、中英文同步展示、字幕實(shí)時(shí)疊加功能等等。 科大訊飛介紹稱,轉(zhuǎn)寫(xiě)速度上,能夠“1小時(shí)講話,5分鐘出稿”。并支持中英文混合識(shí)別,借助基于生成對(duì)抗網(wǎng)絡(luò)的數(shù)據(jù)轉(zhuǎn)換算法以及多分辨率層次化建模算法,中英混合識(shí)別效果從50%提升到85%+。 面對(duì)專業(yè)的轉(zhuǎn)寫(xiě)場(chǎng)景,這款設(shè)備還有音視頻同步采集功能,借助“語(yǔ)音+圖像”協(xié)同翻譯,能夠?qū)I(yè)名詞錯(cuò)誤率下降50%。 訊飛智能錄音筆緊接著,是智能錄音筆產(chǎn)品,這是一款軟硬件一體化的設(shè)備。同樣具備“1小時(shí)錄音,5分鐘出稿”的能力。訊飛介紹稱,借助其研發(fā)的音轉(zhuǎn)文字引擎,轉(zhuǎn)寫(xiě)識(shí)別準(zhǔn)確率能夠達(dá)到98%。 與大部分錄音筆不同,這款錄音筆還帶有獨(dú)立的觸摸屏,轉(zhuǎn)寫(xiě)結(jié)果可以直接看到。并支持翻譯功能,而且,翻譯結(jié)果不僅能夠?qū)崟r(shí)可見(jiàn),也能夠?qū)崟r(shí)可聽(tīng)。 對(duì)于錄音的后期整理上,也有不少針對(duì)性的功能,能夠?qū)χ攸c(diǎn)快速進(jìn)行標(biāo)記,支持語(yǔ)音便捷搜索,通過(guò)4G、WiFi方式連接網(wǎng)絡(luò),能夠?qū)崿F(xiàn)錄音文本快速分享。 續(xù)航能力是:滿電工作10小時(shí)。而且支持快充,充電5分鐘,錄音兩小時(shí)。 在這場(chǎng)發(fā)布會(huì)上,科大訊飛一共推出了2款錄音筆設(shè)備,分別是: 旗艦版SR 701,弧形陶瓷背板,3.5英寸觸控屏,內(nèi)置32G內(nèi)存和20G云空間,售價(jià)2999元。 標(biāo)準(zhǔn)版SR501,機(jī)銑玻璃背板,3.1英寸觸控屏,內(nèi)置16G內(nèi)存和10G云空間,售價(jià)1999元。 訊飛智能辦公本接下來(lái),是一款號(hào)稱“開(kāi)啟筆記本的新時(shí)代”的硬件產(chǎn)品,科大訊飛稱其為智能筆記本。 這是一款墨水屏智能硬件設(shè)備,屏幕大小為10.3吋。核心的亮點(diǎn)是,能夠讓你在錄音轉(zhuǎn)寫(xiě)的同時(shí),也能夠手寫(xiě)記錄要點(diǎn)。 手寫(xiě)關(guān)鍵詞也可以做到字音同步,只要點(diǎn)擊手寫(xiě)的文字,就能播放手寫(xiě)文本時(shí)的語(yǔ)音。 后期的整理與檢索也內(nèi)置了語(yǔ)音搜索功能,有語(yǔ)音分析、自動(dòng)標(biāo)簽、內(nèi)容關(guān)聯(lián)等自然語(yǔ)言處理能能力。 此外,作為一款墨水屏電子設(shè)備,也支持電子書(shū)閱讀功能,也可以手寫(xiě)郵件。 現(xiàn)在,這款產(chǎn)品已經(jīng)上線出售,售價(jià)4999元。 訊飛學(xué)習(xí)機(jī)硬件環(huán)節(jié)最后登場(chǎng)的是一部學(xué)習(xí)機(jī)。這款設(shè)備于今年4月首次亮相,與其他學(xué)習(xí)機(jī)相比,最大的不同點(diǎn)在于“智能推薦針對(duì)學(xué)”。 訊飛介紹稱,基于智學(xué)網(wǎng)隨機(jī)調(diào)研的400萬(wàn)學(xué)生中35億條數(shù)據(jù),他們發(fā)現(xiàn)學(xué)生60%的練習(xí)都是無(wú)效的。圍繞著這個(gè)方面,學(xué)習(xí)機(jī)主要有兩大功能:一是數(shù)理化精準(zhǔn)學(xué)習(xí)提升效率,二是英語(yǔ)聽(tīng)說(shuō)讀寫(xiě)綜合提升。 如何實(shí)現(xiàn)精準(zhǔn)學(xué)習(xí)?基于知識(shí)圖譜系統(tǒng), 科大訊飛將整個(gè)過(guò)程拆解成了三個(gè)步驟: 首先基于人工智能技術(shù)快速測(cè)試,找到弱項(xiàng);然后針對(duì)弱項(xiàng)進(jìn)行精準(zhǔn)學(xué)習(xí);最后鞏固內(nèi)化形成學(xué)習(xí)閉環(huán)。 圍繞著英語(yǔ)聽(tīng)說(shuō)讀寫(xiě)綜合提升方面,學(xué)習(xí)機(jī)中具備語(yǔ)音評(píng)測(cè)和語(yǔ)音轉(zhuǎn)寫(xiě)功能。效果怎樣?訊飛說(shuō),借助這款學(xué)習(xí)機(jī),“不會(huì)英語(yǔ)的家長(zhǎng),也能檢查孩子背課文”。 此外,作為一款學(xué)習(xí)機(jī),這款設(shè)備還有名師視頻、拍照搜題、同步練習(xí)、歷年真題試卷等等功能,也都內(nèi)置其中,售價(jià)3999元。 “以軟件為基”:iFLYOS 2.0這場(chǎng)新品發(fā)布會(huì)上,科大訊飛發(fā)布了智能物聯(lián)網(wǎng)操作系統(tǒng)iFLYOS的2.0版本,主講人為科大訊飛輪值總裁胡郁。 這一次在具體的功能上迭代與升級(jí),主要集中在以下的幾個(gè)方面: 首先,新增了21種方言識(shí)別、語(yǔ)句中英文混合識(shí)別能力,并加入了全雙工能力支持用戶連續(xù)對(duì)話; 其次,深度集成了訊飛的麥克風(fēng)陣列算法,整合了AIUI語(yǔ)義能力,提供云端芯一體化解決方案。 第三,開(kāi)放了多樣的處理模型,用戶可以定制技能以連接自己的服務(wù);使用自己的用戶體系;并支持用戶級(jí)和設(shè)備級(jí)的自定義喚醒詞,使用自己的發(fā)音人,把更多品牌元素結(jié)合到自己的產(chǎn)品內(nèi),打造屬于開(kāi)發(fā)者自己的操作系統(tǒng)。 胡郁介紹稱,現(xiàn)在的iFLYOS 2.0,已經(jīng)內(nèi)置了200+技能,有100+內(nèi)容合作方,1500萬(wàn)首正版音樂(lè)和1200萬(wàn)小時(shí)的有聲內(nèi)容。設(shè)備方面,已經(jīng)覆蓋4億智能手機(jī),3800萬(wàn)車載設(shè)備,1400萬(wàn)智能電視,以及500萬(wàn)機(jī)器人玩具。 他說(shuō),借助iFLYOS 2.0平臺(tái),原來(lái)需要6-12個(gè)月開(kāi)發(fā)周期的智能語(yǔ)音應(yīng)用,現(xiàn)在只需要5天就可以完成了。 關(guān)于iFLYOS 2.0,科大訊飛一共提供了兩個(gè)版本。 一是基礎(chǔ)版,云端支持語(yǔ)音合成、基礎(chǔ)語(yǔ)音識(shí)別、基礎(chǔ)語(yǔ)義理解、多場(chǎng)景模式、前后攔截器、技能工作室基礎(chǔ)版功能與基礎(chǔ)內(nèi)容、基礎(chǔ)技能等服務(wù)。終端方面,支持拾音降噪、SDK、API和“藍(lán)小飛”語(yǔ)音喚醒。 另外是專業(yè)版,除了基礎(chǔ)版所有功能之外,支持自定義賬號(hào)體系、麥克風(fēng)陣列設(shè)計(jì)、面向?qū)I(yè)領(lǐng)域的語(yǔ)音識(shí)別、芯片、PCBA、整機(jī)硬件參考設(shè)計(jì)等硬件方案,以及音樂(lè)、閑聊等其他收費(fèi)內(nèi)容。 科大訊飛二十載,如何兌現(xiàn)AI價(jià)值紅利?科大訊飛成立于1999年,至今已過(guò)二十載。從2008年A股上市以來(lái),一直是中國(guó)人工智能領(lǐng)域不可多得的AI商業(yè)化變現(xiàn)的代表。 如何挖掘人工智能價(jià)值?在這場(chǎng)大會(huì)上,一手創(chuàng)辦訊飛的劉慶峰給出了最新思考:
而訊飛,之所以能夠發(fā)展至此,正是跨越了多個(gè)技術(shù)鴻溝之后的結(jié)果。 劉慶峰登場(chǎng)之后,首先介紹的就是科大訊飛在過(guò)去一年內(nèi)跨越的“鴻溝”: 語(yǔ)音合成:語(yǔ)音合成自然度(MOS分)達(dá)到4.0,即真人說(shuō)話水平,業(yè)界唯一中、英文語(yǔ)音合成自然度達(dá)到并超過(guò)4.0分(普通人說(shuō)話水平)的系統(tǒng)。 語(yǔ)音識(shí)別:語(yǔ)音識(shí)別準(zhǔn)確率全面超過(guò)速記員。目前,科大訊飛的中文語(yǔ)音轉(zhuǎn)寫(xiě)準(zhǔn)確率已經(jīng)突破98%,英文達(dá)到95%。 語(yǔ)音評(píng)測(cè):在大規(guī)??荚囋u(píng)測(cè)中達(dá)到國(guó)家級(jí)測(cè)試員水平,業(yè)界唯一通過(guò)國(guó)家語(yǔ)委鑒定并大規(guī)模實(shí)用的技術(shù)成果。 機(jī)器翻譯:系統(tǒng)通過(guò)CATTI全國(guó)翻譯專業(yè)資格(水平)測(cè)試,達(dá)到專業(yè)資格合格標(biāo)準(zhǔn)。 認(rèn)知智能:如“智醫(yī)助理”通過(guò)國(guó)家臨床執(zhí)業(yè)醫(yī)師綜合筆試測(cè)試,讓醫(yī)生“核心能力”推廣成為可能。 這次科大訊飛發(fā)布會(huì)上呈現(xiàn)出來(lái)的產(chǎn)品,基本都是圍繞著上述技術(shù)構(gòu)建,也是其兌現(xiàn)價(jià)值紅利的載體。 在科大訊飛的董事長(zhǎng)看來(lái),2019年是人工智能規(guī)?;瘧?yīng)用落地元年,也將開(kāi)始進(jìn)入應(yīng)用紅利兌現(xiàn)年。 劉慶峰認(rèn)為,判斷人工智能技術(shù)價(jià)值兌換,有三個(gè)標(biāo)準(zhǔn): 首先,要有真實(shí)可見(jiàn)的實(shí)際應(yīng)用案例; 其次,能規(guī)模化應(yīng)用的核心產(chǎn)品; 第三,能夠統(tǒng)計(jì)數(shù)據(jù)的應(yīng)用成效。 以教育領(lǐng)域?yàn)槔?。在他看?lái),基于人工智能,可以讓每個(gè)孩子獲得更精準(zhǔn)的教學(xué),讓因材施教落到實(shí)處(實(shí)際應(yīng)用案例)。 現(xiàn)在, 科大訊飛智慧教育產(chǎn)品和應(yīng)用已經(jīng)覆蓋25000多所中小學(xué)(規(guī)模化應(yīng)用的產(chǎn)品)。 他們透露的成績(jī)單也頗為亮眼:學(xué)生學(xué)習(xí)效率提升50%,時(shí)間花費(fèi)減少32%,焦慮情緒舒緩20%(應(yīng)用成效)。 跨越AI技術(shù)鴻溝此外,劉慶峰也給出了訊飛接下來(lái)將要跨越哪些“鴻溝”:多模態(tài)擬人交互、常識(shí)推理突破、通用人工智能等等。 怎么跨越?他介紹了三把鑰匙:
其中,人機(jī)耦合是核心,劉慶峰也再次提出了“未來(lái)屬于人機(jī)耦合的新時(shí)代”的論斷。 并以翻譯為例,進(jìn)一步解釋了這一觀點(diǎn): 雖然科大訊飛的機(jī)器口譯測(cè)試全球首次達(dá)到專業(yè)資格合格標(biāo)準(zhǔn),但是這并不意味著機(jī)器可以替代人類同傳。 他說(shuō),人和機(jī)器的深度協(xié)作才是推動(dòng)人工智能應(yīng)用真正落地的關(guān)鍵,這也是人工智能時(shí)代社會(huì)倫理和人文發(fā)展的需要。 AI落地再探討總之,作為中國(guó)AI語(yǔ)音的一哥,也是中國(guó)AI的最早探索者,科大訊飛給出了最新的思考和探索結(jié)果。 AI算法的壁壘,訊飛一次次用國(guó)際競(jìng)賽獎(jiǎng)項(xiàng)突破證明。 AI硬件產(chǎn)品的壁壘,現(xiàn)在更多交給消費(fèi)者。 他們找到場(chǎng)景,打造產(chǎn)品,用軟件定義硬件,創(chuàng)造更多AI落地場(chǎng)景,讓更多人通過(guò)終端產(chǎn)品體驗(yàn)AI。 當(dāng)然,這條路上,訊飛也不孤單。 越來(lái)越多AI公司認(rèn)定這條路,越來(lái)越多AI技術(shù)被以產(chǎn)品化形態(tài)進(jìn)入千家萬(wàn)戶。 亞馬遜已經(jīng)在AI音箱領(lǐng)域取得成功。 Google已經(jīng)在“軟件+硬件+AI”戰(zhàn)略上初嘗勝果。 那么開(kāi)AI機(jī)器轉(zhuǎn)寫(xiě)與翻譯之先的訊飛,現(xiàn)在一口氣推出5款A(yù)I硬件新品的訊飛呢? 規(guī)律和趨勢(shì),會(huì)在這里有怎樣的延續(xù)? 不妨拭目以待。 作者系網(wǎng)易新聞·網(wǎng)易號(hào)“各有態(tài)度”簽約作者 — 完 — |
|