據(jù)《圣經(jīng)·舊約·創(chuàng)世紀》記載,最初天下人都講一樣的語言,有一樣的口音。當(dāng)時的人類想要聯(lián)合起來興建一座通往天堂的高塔:巴別塔。為了阻止人類的計劃,上帝開始讓人類說不同語言,使得人類之間相互不能溝通,于是計劃擱淺…… 古籍如此記載,而實際上目前很多時候,我們確實也體驗到了語言隔閡在交流溝通,甚至日常生活中帶來的種種不便。 —你是席爾瑞斯嗎?—不,我是凱丁 美劇視頻中:你是席爾瑞斯嗎?不,我是凱丁。仔細看英文字幕,發(fā)現(xiàn): 好吧,這位字幕組小伙伴,你很優(yōu)秀 當(dāng)你去異國他鄉(xiāng)旅游或出差,想吃美食但無法準確表達給餐廳服務(wù)員; 當(dāng)你和公司外籍高管開會交流,卻總覺得自己的表達還不夠地道; 當(dāng)你想給父母報境外游,卻擔(dān)心語言不通而只能無奈報有導(dǎo)游帶隊的「購物游」 真希望全天下都講一樣的語言! 有這樣想法的可不止你一人。最重要的是,還真有人想出解決辦法了。獵豹移動近日發(fā)布的「小豹AI翻譯棒」就是這樣一款產(chǎn)品,小巧簡單的設(shè)計,通體就一個按鈕,輕輕一按然后對著它講話,即可流暢地實現(xiàn)中英、中日、中韓等多語種互譯和譯文朗讀。 僅45克的小巧身形,180天超長待機,一鍵點擊快速喚醒并快速互譯的簡單操作,這款產(chǎn)品一經(jīng)推出就吸引了大量用戶的追捧。甚至前段時間網(wǎng)絡(luò)上瘋傳的一位外國人借助翻譯設(shè)備看宮斗劇的視頻里,用到的就是獵豹移動的小豹翻譯棒。 市面上類似的產(chǎn)品也有不少,小豹翻譯棒何以如此出眾? 獵豹移動品牌市場副總裁韓建琦介紹到,小豹翻譯棒最大的特點在于速度快,結(jié)果準,并且操作簡便。無需設(shè)置源和目標語種,整個機身就一個按鈕,按下即可開始拾音,并快速將翻譯后的結(jié)果朗讀出來。 強強聯(lián)手優(yōu)勢結(jié)合,造就掌心里的語音同傳翻譯 小豹翻譯棒融合了獵豹移動,獵豹移動旗下子公司獵戶星空,以及微軟的諸多先進技術(shù)。在實際翻譯過程中,主要涉及三大流程: 1,麥克風(fēng)拾音,確定源語言,將聲音轉(zhuǎn)換成文字; 2,通過AI服務(wù)將轉(zhuǎn)換后的文字翻譯為目標語種的文字; 3,將翻譯后的文字用目標語言朗讀出來。 而微軟通過Azure認知服務(wù)提供的Speech API所實現(xiàn)的語言到文字轉(zhuǎn)換、文字到語音轉(zhuǎn)換,以及Translator Text API實現(xiàn)的文本翻譯功能上述三個環(huán)節(jié)起到了關(guān)鍵作用。 當(dāng)用戶按下按鈕開始講話時,翻譯棒中的雙麥克風(fēng)陣列即被激活,開始精確拾取用戶聲音并發(fā)送到Azure云端進行分析,判斷語種并借助Speech API將語音轉(zhuǎn)換為文字。隨后同樣在云端,基于人工智能技術(shù)構(gòu)建的Translator Text API將轉(zhuǎn)換后的文字自動翻譯為目標語言的文字。最后由Speech API的文字到語音轉(zhuǎn)換功能將翻譯后的文字用目標語言朗讀,通過翻譯棒上的揚聲器播放出來。這一系列過程,小豹翻譯棒只需瞬時就可以完成。 而這一套完整的解決方案完美實現(xiàn)了隨身翻譯機類產(chǎn)品一直以來會面臨的一些重要挑戰(zhàn): 用戶身處不同語言環(huán)境中,需要不同語言之間的識別、互譯和朗讀,如何讓自己的產(chǎn)品盡可能支持更多語言? 這類產(chǎn)品通常都需要訪問云服務(wù),而用戶身處全球不同位置使用時,如何確保體驗的流暢和一致? 微軟AI技術(shù)又是如何解決這些問題的? 在可支持的語言和語種方面,微軟相關(guān)的AI服務(wù)提供了完善的支持。Azure認知服務(wù)所提供的Speech API目前已經(jīng)可以支持包括中、英、日、韓、德、法、意等全球各大主要語言的識別、雙向互譯和朗讀。獵豹移動只需根據(jù)業(yè)務(wù)需求將Speech API用在自己的產(chǎn)品中,即可輕松快速地獲得所需語言的互譯功能。 為了能為身處全球各地的用戶提供快速流暢的訪問體驗,這需要在全球各大地區(qū)進行必要的部署。而在Azure的幫助下,這一點可以輕松實現(xiàn)。目前Azure智能云服務(wù)已經(jīng)在全球建立了54個區(qū)域,可在140個國家和地區(qū)使用。因此獵豹移動只需要在不同區(qū)域開通自己的Azure部署,隨后只需對產(chǎn)品代碼進行少量修改,即可借助全球化的Azure部署將一流服務(wù)擴展至世界各地。 語言翻譯,這僅僅是微軟AI技術(shù)的一種可能 除了獵豹移動所用的Azure認知服務(wù)Speech API,認知服務(wù)還提供了計算機視覺、知識、搜索、語言理解等不同類型的API。這些API均可輕松調(diào)用并快速開發(fā)出跨平臺的應(yīng)用和服務(wù)。 此外在AI的更廣范疇內(nèi),Azure也提供了一系列涵蓋機器學(xué)習(xí)、深度學(xué)習(xí)、Bot機器人服務(wù)、基因組學(xué)等熱點領(lǐng)域的智能服務(wù)。高效強大的AI工具,開放靈活的平臺,針對本地、云端和邊緣位置提供的一流支持,這些特點將幫助越來越多企業(yè)駕馭AI的為例,在AI和云的幫助下實現(xiàn)業(yè)務(wù)轉(zhuǎn)型和創(chuàng)新。 |
|