智東西(公眾號(hào):zhidxcom) 文 | 四月 漠影 智東西11月23日消息,國(guó)內(nèi)人工智能領(lǐng)域公司科大訊飛推出了多款基于語(yǔ)音技術(shù)的人工智能產(chǎn)品,也曬了不少數(shù)據(jù)和成績(jī)單。 其中,科大訊飛的服務(wù)機(jī)器人曉曼將于明年3月份量產(chǎn)推出??梢钥吹?,科大訊飛除了將語(yǔ)音技術(shù)在輸入法、音頻等基本場(chǎng)景的應(yīng)用,還延伸到了教育、汽車(chē)、電視等細(xì)分的行業(yè)領(lǐng)域,每個(gè)領(lǐng)域都有針對(duì)性的產(chǎn)品。 隨著人工智能的興起,科大訊飛在語(yǔ)音基礎(chǔ)技術(shù)方面的優(yōu)勢(shì)開(kāi)始體現(xiàn),科大訊飛輪值總裁胡郁詳細(xì)解讀了7個(gè)方向的技術(shù)和產(chǎn)品,智東西隨后對(duì)胡郁和科大訊飛高級(jí)副總裁江濤進(jìn)行了對(duì)話(huà),對(duì)科大訊飛在人工智能背后的布局和想法有了更深入的認(rèn)知。 現(xiàn)場(chǎng),科大訊飛董事長(zhǎng)劉慶峰公布的數(shù)據(jù)顯示,科大訊飛的語(yǔ)音云平臺(tái)用戶(hù)數(shù)據(jù)在近一年內(nèi)實(shí)現(xiàn)了較大增幅,每天使用人數(shù)達(dá)到30億次。在全球范圍內(nèi)的多次智能語(yǔ)音測(cè)試項(xiàng)目中獲得不少獎(jiǎng)項(xiàng),英語(yǔ)、漢語(yǔ)的語(yǔ)音識(shí)別技術(shù)已經(jīng)處于全球領(lǐng)先水平。 一、秀肌肉:多語(yǔ)言同聲速記 回顧近一年的發(fā)展,科大訊飛輪值總裁胡郁拿出了飛語(yǔ)音輸入法、訊飛超腦、訊飛云平臺(tái)、AIUI等現(xiàn)有產(chǎn)品的延伸和進(jìn)化,并推出飛魚(yú)助理、曉曼機(jī)器人、配音閣等新應(yīng)用和產(chǎn)品。 1、明星產(chǎn)品:訊飛語(yǔ)音輸入法 此前,羅永浩在錘子M1的發(fā)布會(huì)上的一輪推廣,讓訊飛的語(yǔ)音輸入法深入人心。具體成績(jī)包括:每分鐘可輸入400個(gè)字,成功率97%,超過(guò)4億用戶(hù)。 雖然已達(dá)4億用戶(hù),但科大訊飛并沒(méi)有止于手機(jī)移動(dòng)端。通過(guò)與電視等智能家居設(shè)備的結(jié)合,并引入離線(xiàn)手寫(xiě)語(yǔ)音引擎,科大訊飛利用語(yǔ)音輸入在家庭場(chǎng)景得到延伸。 活動(dòng)現(xiàn)場(chǎng),科大訊飛的產(chǎn)品經(jīng)理翟積薄在一塊電視面板前,演示了手勢(shì)懸空操控,手寫(xiě)掃描字體,并通過(guò)用語(yǔ)音實(shí)現(xiàn)文字修改,漢轉(zhuǎn)英翻譯,加書(shū)名號(hào)標(biāo)點(diǎn)等命令操作。在語(yǔ)音輸入的基礎(chǔ)上,加入手寫(xiě)功能,能夠讓機(jī)器對(duì)某些確定性命令進(jìn)行更準(zhǔn)確的識(shí)別。 2、驚艷現(xiàn)場(chǎng):同屏速記和翻譯 發(fā)布會(huì)全程,位于前臺(tái)兩塊顯示屏同步顯示了臺(tái)上嘉賓的發(fā)言?xún)?nèi)容,十分亮眼。除了由語(yǔ)音到漢字的速記功能,還包括英語(yǔ)、維語(yǔ)的同步翻譯。據(jù)胡郁介紹,語(yǔ)音同步速記功能自去年底發(fā)布后,主要實(shí)現(xiàn)了三大進(jìn)展: 1)準(zhǔn)確率和反應(yīng)速度進(jìn)一步提升。 2)推出更加安全的離線(xiàn)系統(tǒng),在線(xiàn)版的準(zhǔn)確率97%,離線(xiàn)單機(jī)版的準(zhǔn)確率達(dá)到95%。主要針對(duì)涉及到隱私和安全的語(yǔ)音內(nèi)容,上傳到網(wǎng)上云端處理可能存在安全隱患。 3)在細(xì)分行業(yè)領(lǐng)域的落地,包括在醫(yī)療、司法機(jī)構(gòu)等。在庭審場(chǎng)景,案件處理效率可提升30%。 此外,科大訊飛還推出了專(zhuān)業(yè)的工控機(jī)、針對(duì)速記的筆記本電腦等硬件設(shè)備。據(jù)介紹,產(chǎn)品已經(jīng)在國(guó)務(wù)院辦公廳,中央宣傳部等部門(mén)使用。 3、翻譯場(chǎng)景:自動(dòng)化的“同傳設(shè)備” 這是一款同手機(jī)大小的產(chǎn)品,可實(shí)現(xiàn)中、英、維語(yǔ)三種語(yǔ)音的即時(shí)互譯,類(lèi)似一款自動(dòng)化的同傳設(shè)備。活動(dòng)現(xiàn)場(chǎng),中、外兩位嘉賓進(jìn)行了跨語(yǔ)種的對(duì)話(huà),雙方各手持一臺(tái)翻譯機(jī),實(shí)現(xiàn)了中外兩種語(yǔ)音的的實(shí)時(shí)互譯和交流。胡郁介紹,該產(chǎn)品可推廣到出國(guó)旅行等場(chǎng)景。安徽省的援疆干部現(xiàn)在已經(jīng)用于和維族同胞交流。 二、語(yǔ)音AI如何穿透四大行業(yè) 除去圍繞語(yǔ)音技術(shù)常見(jiàn)的場(chǎng)景應(yīng)用,科大訊飛針對(duì)智能家居、車(chē)載、銀行、教育等細(xì)分領(lǐng)域進(jìn)行了技術(shù)延伸和產(chǎn)品落地。 1、AIUI系統(tǒng)在智能家居的落地:電視 針對(duì)大多數(shù)智能家居產(chǎn)品大且閑置率較高的情況,科大訊飛在去年推出的AIUI系統(tǒng)主要針對(duì)客廳入口電視進(jìn)行了落地,出貨量和受眾群更廣。在遙控器中植入第三代語(yǔ)音芯片,提供語(yǔ)音交互和按鍵的雙控制解決方案。 聽(tīng)起來(lái)似乎沒(méi)啥新意,但基于現(xiàn)場(chǎng)的演示,過(guò)程的流暢度明顯高于一般體驗(yàn),交互及反饋較一般智能電視產(chǎn)品更加自然。包括對(duì)語(yǔ)音點(diǎn)播電視節(jié)目、跳過(guò)片頭、快進(jìn)、播放過(guò)程中打斷詢(xún)問(wèn)等命令都能得到準(zhǔn)確執(zhí)行,值得注意的是這些命令都不需要命令熱詞啟動(dòng)。據(jù)介紹,科大訊飛在智能電視的市場(chǎng)占用率大于80%,合作廠商包括TCL、長(zhǎng)虹、海信、海爾等。 產(chǎn)品在家庭場(chǎng)景中的使用識(shí)別率已經(jīng)達(dá)到97%,并且針對(duì)影視資源和視頻流服務(wù)進(jìn)行了特定優(yōu)化,比如電視的類(lèi)別、劇名、常用的場(chǎng)景和命令語(yǔ)等?!霸擃?lèi)服務(wù)通過(guò)云端數(shù)據(jù)直接執(zhí)行,無(wú)需再針對(duì)機(jī)頂盒進(jìn)行升級(jí)”,胡郁介紹。 2、智能交通:推出飛魚(yú)語(yǔ)音助理 偏向前裝 今年的汽車(chē)市場(chǎng)進(jìn)軍智能化的步伐尤其迅猛,科大訊飛針對(duì)智能車(chē)載市場(chǎng)推出了飛魚(yú)語(yǔ)音平臺(tái)。負(fù)責(zé)該塊業(yè)務(wù)的產(chǎn)品經(jīng)理呂思楠進(jìn)現(xiàn)場(chǎng)演示了一些基本的導(dǎo)航交互,以及推薦餐廳、互動(dòng)娛樂(lè)等,同樣無(wú)需啟動(dòng)熱詞,突出降噪拾音功能。 現(xiàn)場(chǎng)采訪過(guò)程中,胡郁強(qiáng)調(diào),“車(chē)載、移動(dòng)設(shè)備、電視”是科大訊飛一直在深耕的三塊市場(chǎng)。但此前,在智能車(chē)載市場(chǎng)較活躍的似乎是另一家語(yǔ)音智能科技公司“云知聲”,科大訊飛的動(dòng)作較小。針對(duì)此,胡郁向智東西表示,兩家公司的區(qū)別在于科大訊飛更側(cè)重于前裝市場(chǎng),直接與車(chē)廠合作。在智能車(chē)載市場(chǎng),科大訊飛表示其合作客戶(hù)已達(dá)30余家品牌,100余款車(chē)型。 3、服務(wù)型機(jī)器人的示范作品:曉曼機(jī)器人 市面上的大多數(shù)家用型機(jī)器人產(chǎn)品的語(yǔ)音識(shí)別與合成技術(shù)背后均是來(lái)自科大訊飛的支持,這已不是什么新鮮事。活動(dòng)現(xiàn)場(chǎng),科大訊飛表示,在類(lèi)機(jī)器人市場(chǎng)中合作伙伴達(dá)到3000家,落地的產(chǎn)品超過(guò)1000項(xiàng)。 不過(guò)這回科大訊飛自己推出了一款示范性的產(chǎn)品,曉曼機(jī)器人,專(zhuān)用于銀行業(yè)務(wù)的接待。據(jù)介紹,目前已有20多臺(tái)在銀行網(wǎng)點(diǎn)試上崗。在銀行大堂,“曉曼”可以完成用戶(hù)身份識(shí)別、大數(shù)據(jù)分析和業(yè)務(wù)辦理推薦等工作。 現(xiàn)場(chǎng)演示過(guò)程中,機(jī)器人中的視覺(jué)識(shí)別模塊掃描人像后可準(zhǔn)確識(shí)別到用戶(hù)的準(zhǔn)確信息。隨后進(jìn)行了針對(duì)常見(jiàn)銀行業(yè)務(wù)的推薦和簡(jiǎn)單問(wèn)答,如利率評(píng)估,理財(cái)產(chǎn)品的推薦等?,F(xiàn)場(chǎng),曉曼機(jī)器人通過(guò)身份證可識(shí)別到用戶(hù)的銀行卡信息,再經(jīng)過(guò)聲紋驗(yàn)證身份,用戶(hù)可直接下達(dá)命令,最后一句“購(gòu)買(mǎi)”完成了一份10萬(wàn)元理財(cái)產(chǎn)品的訂單。雖然整個(gè)過(guò)程十分流暢,但僅通過(guò)一兩句語(yǔ)音命令就完成大數(shù)額的交易仍讓人對(duì)其可靠性心有余悸。 通過(guò)機(jī)器人代替人工進(jìn)行服務(wù)查詢(xún)和引導(dǎo)已經(jīng)很常見(jiàn),但要在銀行代替人工完成金額交易可能需要更普及的市場(chǎng)教育和消費(fèi)習(xí)慣培養(yǎng)。據(jù)介紹,該產(chǎn)品可實(shí)現(xiàn)70%的人工替代,將在明年三月份正式落地。 4、潛力市場(chǎng):教育應(yīng)用 在教育方面,語(yǔ)音輸入加大了對(duì)數(shù)據(jù)的支持,展示了訊飛超腦在認(rèn)知計(jì)算、自動(dòng)閱卷方面的應(yīng)用,讓線(xiàn)上線(xiàn)下的學(xué)習(xí)場(chǎng)景聯(lián)動(dòng)。面向?qū)W生的課程與教育產(chǎn)品包括: 1)通過(guò)分析班級(jí)在錯(cuò)誤題型的分布,可進(jìn)行個(gè)性化知識(shí)點(diǎn)和資源的推薦。 2)將課程內(nèi)容轉(zhuǎn)述成語(yǔ)音,基于語(yǔ)音檢索可識(shí)別視頻講解內(nèi)容,自動(dòng)切分教學(xué)環(huán)節(jié),按需精確學(xué)習(xí)。 據(jù)介紹,該塊業(yè)務(wù)目前覆蓋師生已超過(guò)7500萬(wàn),推廣至220個(gè)地區(qū),可提升教學(xué)效率30%,學(xué)生作業(yè)負(fù)擔(dān)降低40%。 此外,科大訊飛還推出了3款音頻新產(chǎn)品,包括配音閣、訊飛有聲和訊飛快聽(tīng)。前兩項(xiàng)為專(zhuān)業(yè)的配音軟件,第三款則可以實(shí)現(xiàn)文字收音機(jī)的功能,通過(guò)特定人物聲音的收錄,可實(shí)現(xiàn)語(yǔ)音轉(zhuǎn)文字的傳播,滿(mǎn)足更多聽(tīng)覺(jué)需求,比如父母的聲音可以始終伴隨兒女,兒童通過(guò)該產(chǎn)品在父母出差時(shí)能到“聽(tīng)父母講故事”。其中由羅永浩語(yǔ)音生成的音頻包也被當(dāng)作了產(chǎn)品。 三、市值400億:錢(qián)從哪里掙? 在A股市場(chǎng),科大訊飛市值超過(guò)400億,成立17年,這家以技術(shù)見(jiàn)長(zhǎng),并以此作為核心競(jìng)爭(zhēng)力的科技公司來(lái)說(shuō),靠什么保持持續(xù)發(fā)展或則說(shuō)賺錢(qián)的呢?在創(chuàng)業(yè)回歸商業(yè)本質(zhì)的行業(yè)討論大環(huán)境下,是個(gè)有意思的問(wèn)題。從智東西跟胡郁的對(duì)話(huà)看,to B(企業(yè))、to G(政府)、to C(個(gè)人)會(huì)是三個(gè)主要方向,前兩者之前是主力,但現(xiàn)在to B和to C的邊界正變得模糊,據(jù)說(shuō),科大訊飛現(xiàn)在已經(jīng)成立了專(zhuān)門(mén)負(fù)責(zé)消費(fèi)者業(yè)務(wù)的組織架構(gòu),負(fù)責(zé)人也是胡郁。 近幾年,人工智能技術(shù)才逐漸走入尋常百姓的生活,但實(shí)際上科大訊飛已經(jīng)積累了17年的行業(yè)經(jīng)驗(yàn),算得上是智能語(yǔ)音領(lǐng)域的“老司機(jī)”,與近幾年冒出的創(chuàng)業(yè)公司在體量方面存在一定差異。據(jù)胡郁介紹,科大訊飛每年將25%的營(yíng)收投入到研發(fā)中。投入產(chǎn)出比較一般的互聯(lián)網(wǎng)公司高出5倍,主要得益于在合肥形成了完整的研發(fā)體系。 據(jù)介紹,在技術(shù)早期階段,科大訊飛的業(yè)務(wù)仍主要集中在行業(yè)應(yīng)用,面向的更多是行業(yè)客戶(hù)與政府部門(mén)。近期通過(guò)語(yǔ)音技術(shù)在智慧城市、教育領(lǐng)域的落地,既是驗(yàn)證性的嘗試,也實(shí)現(xiàn)了營(yíng)收方面的增長(zhǎng),后續(xù)還將擴(kuò)展到醫(yī)療和司法領(lǐng)域。 值得注意的是,相較于B端市場(chǎng)的應(yīng)用,似乎直接面向消費(fèi)級(jí)市場(chǎng)更容易變現(xiàn),體量也更加可觀。而在C端市場(chǎng)變現(xiàn)出色的公司卻屈指可數(shù)。談及這一點(diǎn),現(xiàn)負(fù)責(zé)科大訊飛消費(fèi)者BD業(yè)務(wù)群的胡郁表示,公司的戰(zhàn)略路徑?jīng)]有局限在B端或者是C端市場(chǎng),主要的考量標(biāo)準(zhǔn)是“是否能在生態(tài)系統(tǒng)里獲得控制權(quán)”。在玩具、機(jī)器人領(lǐng)域,由于市場(chǎng)過(guò)于多樣化、分散化,盈利價(jià)值并不高。 在遵循市場(chǎng)規(guī)律的前提下,在胡郁看來(lái),技術(shù)類(lèi)公司更靠譜的策略是先通過(guò)B端輸出技術(shù),孕育商業(yè)機(jī)會(huì)等待時(shí)機(jī)爆發(fā)。當(dāng)然,無(wú)論是今年新成立的消費(fèi)者市場(chǎng)部門(mén),還是此前在機(jī)器人初創(chuàng)公司的大手筆投資,我們還是能夠感受到這家技術(shù)公司在C端市場(chǎng)的布局和重視程度。 關(guān)于后續(xù)的盈利增長(zhǎng)點(diǎn),科大訊飛高級(jí)副總裁江濤從另一個(gè)維度進(jìn)行了介紹。他表示,有兩塊核心模式是科大訊飛在后續(xù)技術(shù)商業(yè)化過(guò)程中的動(dòng)力: 1)基于智能手機(jī)市場(chǎng)的持續(xù)增長(zhǎng)能力,語(yǔ)音交互技術(shù)和服務(wù)具有變現(xiàn)能力,將從技術(shù)授權(quán)和芯片集成的方式切入。 2)從技術(shù)壁壘延展到市場(chǎng)、人才、運(yùn)營(yíng)層面。如在教育領(lǐng)域,通過(guò)收購(gòu)自學(xué)網(wǎng)、自建數(shù)字校園等,深入到技術(shù)在行業(yè)的應(yīng)用和運(yùn)營(yíng)層面。部分應(yīng)用軟件在與學(xué)校簽約時(shí),強(qiáng)調(diào)過(guò)程化數(shù)據(jù)的運(yùn)營(yíng)權(quán)的歸屬,用戶(hù)不在止于學(xué)校等教育機(jī)構(gòu)B端用戶(hù),而是直接對(duì)接到家長(zhǎng)等消費(fèi)者。 此外,江濤透露,科大訊飛該項(xiàng)運(yùn)營(yíng)模式還將推廣到醫(yī)療、法律等腦力勞動(dòng)行業(yè)。 四、結(jié)語(yǔ) 智東西(公眾號(hào):zhidxcom)曾關(guān)注科大訊飛幾年前的發(fā)展,2010年前后,科大訊飛從行業(yè)語(yǔ)音基礎(chǔ)技術(shù)提供商開(kāi)始往移動(dòng)互聯(lián)網(wǎng)行業(yè)靠,推出訊飛輸入法等移動(dòng)端產(chǎn)品。經(jīng)過(guò)幾年的發(fā)展,可以看到兩個(gè)明顯的改變: 1) 行業(yè)應(yīng)用更加深入,從傳統(tǒng)的政、企市場(chǎng)往出行、家居等智能化產(chǎn)業(yè)升級(jí)的領(lǐng)域縱深發(fā)展。 2) 開(kāi)始運(yùn)營(yíng)培育與消費(fèi)者距離更近的行業(yè)應(yīng)用,比如教育、體育等領(lǐng)域。 業(yè)界有一種說(shuō)法,說(shuō)今年是人工智能發(fā)展60年,并且普遍認(rèn)為過(guò)去60年人工智能經(jīng)過(guò)了2此大的發(fā)展高潮,又經(jīng)過(guò)了2次退潮,可能這只是一個(gè)假象,人工智能一直在持續(xù)的發(fā)展,但每個(gè)時(shí)代的應(yīng)用機(jī)會(huì)和程度有所不同罷了,每一次應(yīng)用高潮的出現(xiàn),則是一波企業(yè)的發(fā)展大好時(shí)機(jī)。 |
|