一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

投喂4萬(wàn)種噪聲,20種語(yǔ)言方言實(shí)時(shí)轉(zhuǎn)錄,搜狗「開掛」錄音筆這樣煉成

 板橋胡同37號(hào) 2020-02-28
作者:寓揚(yáng)

一款「開掛」的錄音筆,你會(huì)喜歡嗎? 

在 AI 的加持下,錄音筆仿佛有了開掛的「人生」: 

最高支持 10 米遠(yuǎn)距離拾音,可過濾 4 萬(wàn)余種真實(shí)噪音;可根據(jù)用戶語(yǔ)言習(xí)慣個(gè)性化轉(zhuǎn)寫,語(yǔ)音轉(zhuǎn)寫準(zhǔn)確率達(dá) 98%;還能區(qū)分不同人聲,做重點(diǎn)標(biāo)記,自動(dòng)提煉摘要。

它還能充當(dāng)你的翻譯官,支持 63 種語(yǔ)言的對(duì)話翻譯,以及同聲傳譯。

你可以用它做會(huì)議錄音、聽課記錄、采訪,也可以用它與不同國(guó)家的游客交流,甚至可以拿著它刷美劇。

沒錯(cuò),這正是搜狗新推出的新款 AI 錄音筆 S1。它的背后,不單單是一款硬件,更是搜狗 AI 能力的集合。


搜狗公司 CEO 王小川道出了他們做 AI 硬件的目的,「隨著 AI 技術(shù)的進(jìn)步,我們希望用戶能更自由的表達(dá),用你的聲音、表情或肢體來表達(dá),機(jī)器就可以理解,這些我們能做到的時(shí)候,就算達(dá)到了一個(gè)技術(shù)高度?!?/section>

01、搜狗 AI 錄音筆是如何煉成的?

從搜狗輸入法到語(yǔ)音交互、機(jī)器翻譯,再到 AI 硬件,這背后有著深刻的搜狗 AI 發(fā)展邏輯。

早在 2016 年,當(dāng)時(shí)搜狗沒有做 AI 硬件,而是做了語(yǔ)音開放平臺(tái)「知音引擎」,嘗試技術(shù)輸出。

但當(dāng)時(shí)各路語(yǔ)音平臺(tái)紛紛涌現(xiàn),方案上沒有誰(shuí)真正不可替代,客戶往往在多家間來回切換。另一方面,通用技術(shù)平臺(tái)體驗(yàn)并不理想,加上 AI 行業(yè)處于早期,軟件免費(fèi)的思路還停留在很多人心中。

因此從 2017 年下半年開始,搜狗開啟 AI 硬件的探索,沉淀技術(shù),打磨硬件與場(chǎng)景。

2018 年上半年,搜狗推出探索之作——AI 翻譯機(jī)和 AI 錄音筆。如今 AI 硬件,已和輸入法、搜索一樣,是搜狗的幾大重要戰(zhàn)略之一。

接著 2019 年 3 月,搜狗又推出一款小巧的 AI 錄音筆 C1,它具備了最新產(chǎn)品的雛形,支持語(yǔ)音轉(zhuǎn)寫、云端分享、中英同傳等多種 AI 功能。

更重要的是,C1 的出現(xiàn)讓略顯疲態(tài)的錄音筆行業(yè)鮮活了起來。經(jīng)過用戶一段時(shí)間的使用,搜狗對(duì)用戶行為數(shù)據(jù)深入分析后,第一次呈現(xiàn)了用戶的真實(shí)畫像。


搜狗發(fā)現(xiàn),使用錄音筆的第一大場(chǎng)景并非大家預(yù)想的媒體采訪,而是企業(yè)內(nèi)部的商務(wù)場(chǎng)景,比如會(huì)議記錄,占比高達(dá) 44%;其次是學(xué)習(xí)培訓(xùn)占比 24%,媒體采訪占比 21%,這三大場(chǎng)景占總使用場(chǎng)景的近九成。

正是基于對(duì)三大場(chǎng)景的思考,在 C1 的基礎(chǔ)上,搜狗推出全新的 S1 和 E1 兩款 AI 錄音筆,還與故宮宮廷文化合作推出兩款聯(lián)名產(chǎn)品。

對(duì)比這兩代產(chǎn)品,搜狗 CTO 楊洪濤解釋,C1 系列解決的是隨身便攜的錄音需求,可以像領(lǐng)件一樣夾在衣領(lǐng)上,它的使用空間相對(duì)近場(chǎng),一般不要超過 3 米。而最新發(fā)布的 S1 和 E1 產(chǎn)品,主要解決復(fù)雜場(chǎng)景的錄音需求,能在多人會(huì)議、課堂聽講、嘈雜背景采訪中使用,可將使用范圍擴(kuò)大到 5~10 米。


為了滿足更為復(fù)雜專業(yè)的需求,搜狗在遠(yuǎn)距離拾音、降噪上投入頗多。AI 錄音筆 S1 搭配 2 顆哈曼指向性麥克風(fēng)和 6 顆全向麥克風(fēng),在麥克風(fēng)陣列算法的加持下,可有效過濾噪音,實(shí)現(xiàn)最高 10 米遠(yuǎn)距離拾音。

更重要的是,它還采用 AI 降噪,能夠過濾 4 萬(wàn)余種真實(shí)噪音,讓人聲收錄更清晰。

搜狗 AI 交互技術(shù)部總經(jīng)理陳偉解釋道,在硬件降噪基礎(chǔ)上,搜狗首次將基于深度學(xué)習(xí)的降噪能力完全產(chǎn)品化?!肝覀兪褂昧?4 萬(wàn)多種噪聲,讓模型學(xué)習(xí)到人聲與噪聲的區(qū)別,從而達(dá)到超出麥克風(fēng)陣列以及行業(yè)其他降噪方案的更好降噪效果?!?/strong>

在現(xiàn)場(chǎng)的測(cè)試環(huán)節(jié),AI 錄音筆 S1 面對(duì)鍵盤敲打、吹風(fēng)機(jī)等的考驗(yàn)下,依然能夠過濾噪音,提取清晰的人聲。

可以看出,在硬件之路上摸爬滾打近 3 年后,搜狗對(duì)于 AI 硬件的理解也更為深刻。

只有面向用戶體驗(yàn),深入場(chǎng)景打磨技術(shù),將技術(shù)、硬件、場(chǎng)景融合才能構(gòu)建 AI 的競(jìng)爭(zhēng)力。

02、AI 要轉(zhuǎn)化為服務(wù)能力

搜狗內(nèi)部有一句話叫,只做技術(shù)是不夠的,技術(shù)要轉(zhuǎn)化為服務(wù)能力。因?yàn)闆]有面向場(chǎng)景的深度優(yōu)化,技術(shù)往往是一種雞肋。

搜狗 AI 錄音筆 S1

圍繞多人會(huì)議、學(xué)習(xí)培訓(xùn)、媒體采訪等核心場(chǎng)景,搜狗 AI 錄音筆 S1 除了做到「超強(qiáng)拾音」外,還具備「準(zhǔn)確轉(zhuǎn)寫」、「高效整理」、「全能翻譯」的能力,也呈現(xiàn)出搜狗將技術(shù)轉(zhuǎn)化為服務(wù)能力的思考。

如果放在一個(gè)工作流中,錄完音后,如何準(zhǔn)確快速地語(yǔ)音轉(zhuǎn)寫至關(guān)重要。如果交給人來做是個(gè)繁重的體力活,而語(yǔ)音轉(zhuǎn)寫軟件多不準(zhǔn)確。

搜狗稱,AI 錄音筆 S1 及 E1 目前已能達(dá)到 98% 的轉(zhuǎn)寫準(zhǔn)確率。這一數(shù)字背后搜狗做了大量的優(yōu)化工作。

首先,搜狗輸入法每天 8.3 億次的語(yǔ)音請(qǐng)求,為聽寫服務(wù)提供了絕佳的「練兵場(chǎng)」,結(jié)合遠(yuǎn)場(chǎng)語(yǔ)音數(shù)據(jù)和真實(shí)場(chǎng)景的優(yōu)化,已能將準(zhǔn)確率達(dá)到不錯(cuò)的效果。

在此基礎(chǔ)上,搜狗又打通用戶輸入法賬號(hào),根據(jù)用戶的語(yǔ)言習(xí)慣,進(jìn)行個(gè)性化轉(zhuǎn)寫。此外,搜狗語(yǔ)音團(tuán)隊(duì)還專門圍繞財(cái)經(jīng)貿(mào)易、醫(yī)療衛(wèi)生、IT 科技、政法、文化體育等 5 個(gè)領(lǐng)域,構(gòu)建專用語(yǔ)言模型,進(jìn)一步提升行業(yè)詞匯的識(shí)別,做到了 98% 的準(zhǔn)確率。

S1 及 E1 這兩款產(chǎn)品也十分高效,均可做到錄音 1 小時(shí),出稿 5 分鐘,并且支持 10 種語(yǔ)言和 10 種方言的錄音與轉(zhuǎn)寫。
 

搜狗 AI 錄音筆 E1

接下來是高效整理。結(jié)合使用場(chǎng)景,搜狗做了一些非常實(shí)用的功能點(diǎn),讓人印象深刻的是「敲重點(diǎn)」和智能摘要技術(shù)。

當(dāng)你在聽課或者參加會(huì)議時(shí),突然聽到一句神來之筆或者金句,「敲重點(diǎn)」就派上用場(chǎng)了。S1 有一個(gè)專用「M」鍵,按一下,它就會(huì)將這句話標(biāo)記為重點(diǎn)。

面對(duì)一篇萬(wàn)字長(zhǎng)文,如何能快速獲取其關(guān)鍵信息。正是出于這種考慮,搜狗推出智能摘要功能,但其效果如何呢?

陳偉坦言,在 AI 錄音筆中提取摘要,遠(yuǎn)大于學(xué)術(shù)研究中的摘要生成問題,因?yàn)殇浺艄P是在噪聲環(huán)境下,語(yǔ)音識(shí)別難以保證 100% 的準(zhǔn)確率,從噪音文本中整理出符合文章語(yǔ)意的摘要是相當(dāng)困難的。

因此在技術(shù)路線上,搜狗沒有使用生成模型,而是采用抽取式的摘要能力,基于原文找到關(guān)鍵詞,再通過排序算法,從文章中抽取關(guān)鍵句,形成摘要,保證足夠的精度。

此外,AI 錄音筆 S1 還能支持 5 人內(nèi)的人聲分離,從而在文稿中自動(dòng)分段呈現(xiàn)??紤]到掌聲、笑聲、點(diǎn)贊等節(jié)點(diǎn)可能會(huì)出現(xiàn)一些重點(diǎn)或金句,它還會(huì)自動(dòng)識(shí)別并重點(diǎn)標(biāo)記。

除了錄音筆所需要的服務(wù)外,搜狗還將 AI 翻譯能力內(nèi)嵌其中。

目前搜狗 AI 錄音筆 S1 支持 63 個(gè)語(yǔ)種的在線翻譯,9 種離線翻譯。在對(duì)話過程中,S1 還具備自由對(duì)話功能,能夠自動(dòng)識(shí)別說話人是否講完,進(jìn)而呈現(xiàn)翻譯結(jié)果,無(wú)需手動(dòng)操作。

此外,它還具備同聲傳譯功能,你可以帶著它聽英文演講、報(bào)告,屏幕上就會(huì)同步翻譯中文字幕。

種種服務(wù)背后,正如搜狗 CTO 楊洪濤所言,AI 錄音筆是為了讓人們更自由的表達(dá),而這背后所用到的技術(shù),相當(dāng)多是對(duì)搜狗原有技術(shù)體系的復(fù)用,并針對(duì)硬件做更好的 AI 優(yōu)化。

03、AI 加持,行業(yè)呈現(xiàn)「新藍(lán)?!?/strong>

與搜狗 AI 錄音筆迭代一同上演的是,錄音筆行業(yè)的洗牌與變革。

錄音筆是一個(gè)相對(duì)狹小的傳統(tǒng)市場(chǎng),過去 20 年間沒有太多變化,隨著智能手機(jī)集成功能的持續(xù)豐富,它面臨被手機(jī)替代的風(fēng)險(xiǎn)。

因此我國(guó)錄音筆每年銷量在 400 多萬(wàn)臺(tái)徘徊,增長(zhǎng)基本停滯,市場(chǎng)多被索尼、愛國(guó)者、紐曼等硬件廠商占據(jù)。

隨著搜狗 AI 錄音筆 C1 推出,市場(chǎng)格局開始出現(xiàn)變化。2019 年 6 月,它便成為京東錄音筆類目單品銷量冠軍、天貓錄音筆類目單品銷售額冠軍,隨后 11 月又拿下天貓京東雙平臺(tái)單品總銷量冠軍。

更為重要的是,AI 錄音筆的出現(xiàn),在主流電商平臺(tái)上,讓原本趨于平緩甚至下滑的錄音筆品類訪客數(shù)據(jù)明顯上升,既有的市場(chǎng)天花板正在被打破,行業(yè)呈現(xiàn)「新藍(lán)海」。


到 2020 年一季度,AI 錄音筆的銷量已占據(jù)整個(gè)錄音筆市場(chǎng)的 35%,行業(yè)變革正在上演。

與此同時(shí),行業(yè)逐漸意識(shí)到 AI 優(yōu)質(zhì)服務(wù)的重要性,不少公司主動(dòng)找到搜狗,甚至包括一些硬件上的競(jìng)爭(zhēng)對(duì)手,詢問能否購(gòu)買搜狗的 AI 能力。

對(duì)于搜狗而言,盡管在硬件上取得一定成績(jī),但很難一家獨(dú)大。因?yàn)樵?C 端硬件市場(chǎng),即使是最大的玩家,也很難占據(jù) 50% 以上的市場(chǎng)份額。但軟件不同,后者可以發(fā)揮網(wǎng)絡(luò)效應(yīng),一家獨(dú)大。

內(nèi)外部因素碰撞下,搜狗決定再往前邁一步,開放 AI 錄音筆背后的聽寫服務(wù)。去年 8 月,搜狗聯(lián)合愛國(guó)者、紐曼、索尼錄音筆、萬(wàn)城集團(tuán)等錄音筆行業(yè)頭部企業(yè),成立 AI 創(chuàng)新聯(lián)盟,將搜狗 AI 能力開放給業(yè)界。

傳統(tǒng)錄音筆以硬件為主的商業(yè)模式也正在被打破,「硬件+服務(wù)」的新型收益模式正在形成。

搜狗 CTO 楊洪濤稱,「過去傳統(tǒng)硬件主要是賣毛利,未來我們希望探索一種服務(wù)化模式,通過 AI 能力向用戶提供更多增值服務(wù),擴(kuò)展傳統(tǒng)商業(yè)模式的空間。」

在 AI 錄音筆身上,我們看到兩條不斷交織的線,一條是搜狗 AI 的演進(jìn)線,在「自然交互+知識(shí)計(jì)算」的指引下,從最初的語(yǔ)音識(shí)別發(fā)展到機(jī)器翻譯、搜狗分身,再到如今的多模態(tài)交互。

另一條是 AI 硬件變革線,將 AI 能力不斷注入硬件中,升級(jí)一個(gè)行業(yè),而錄音筆只是第一個(gè)。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多

    欧美乱妇日本乱码特黄大片| 午夜成年人黄片免费观看| 欧美日韩亚洲国产精品| 中文字幕亚洲人妻在线视频| 日韩精品视频免费观看| 免费大片黄在线观看日本| 国产午夜福利在线观看精品| 国产极品粉嫩尤物一区二区| 99国产一区在线播放| 国产成人精品久久二区二区| 亚洲丁香婷婷久久一区| 欧美亚洲三级视频在线观看| 国产亚洲欧美另类久久久| 日系韩系还是欧美久久| 欧美日韩少妇精品专区性色| 国产乱人伦精品一区二区三区四区| 中文字幕人妻综合一区二区 | 国产精品内射婷婷一级二级| 风间中文字幕亚洲一区| 黄色国产一区二区三区| 久久99夜色精品噜噜亚洲av| 国产欧美日韩在线一区二区| 香蕉尹人视频在线精品| 欧美日韩黑人免费观看| 色综合久久超碰色婷婷| 国产99久久精品果冻传媒| 青青草草免费在线视频| 欧美做爰猛烈叫床大尺度| 隔壁的日本人妻中文字幕版| 一个人的久久精彩视频 | 一区二区三区日韩在线| 国产一区二区三区香蕉av| 精品亚洲香蕉久久综合网| 成人午夜爽爽爽免费视频| 91欧美激情在线视频| 日本女优一色一伦一区二区三区| 免费在线播放不卡视频| 男女午夜福利院在线观看| 国产精品第一香蕉视频| 91人妻久久精品一区二区三区| 视频一区二区 国产精品|