準(zhǔn)兒翻譯機適用于出國旅游中的多個場景應(yīng)用 □□本報記者 李琤 2017年我國出入境旅游高達2.69億人次,已成為世界第一大出境旅游客源國。在出行過程中,語言溝通障礙成為出境游人群最大的痛點,除了聽不懂語言,看不懂圖文,還有出外網(wǎng)絡(luò)流量貴、咨詢服務(wù)不方便等影響出境游體驗的重要因素。 近日,北京分音塔科技有限公司(以下簡稱“分音塔”)推出的清華準(zhǔn)兒第二代WiFi翻譯一體機——包括39個語種51國口音、集成無線上網(wǎng)功能的人工智能口語翻譯一體機,將有望解決出境游客行中語言痛點。 從旅游市場切入 現(xiàn)在,很多公司紛紛試水翻譯機的研發(fā)與生產(chǎn)。據(jù)不完全統(tǒng)計,僅從2016年上半年到2017年上半年,國內(nèi)外有多家企業(yè)推出了智能翻譯機產(chǎn)品,既有來自澳大利亞、日本、荷蘭的創(chuàng)業(yè)企業(yè),也有中國語音科技企業(yè)科大訊飛、雙猴科技和分音塔。 據(jù)分音塔CEO關(guān)磊介紹,分音塔研發(fā)的第二代翻譯機,定位出境游市場。第一是因為中國人出境游市場正在快速增長,市場很大;第二是隨著消費升級,出境游開始從大眾化的跟團旅游發(fā)展到深度游,“80后”“90后”更愿意自由行,語言溝通不暢成為出境游圖中的一大痛點。 清華準(zhǔn)兒翻譯機采用自主研發(fā)的清華準(zhǔn)兒深度學(xué)習(xí)算法和神經(jīng)網(wǎng)絡(luò)算法,應(yīng)用四麥線性差值陣列,越用越智能和精準(zhǔn),還支持多機對話,多人多語種跨地域?qū)υ挷辉谠捪隆?月即將上市的準(zhǔn)兒翻譯機是第二代產(chǎn)品,較之去年6月出品的一代產(chǎn)品來說,除了支持多機對話,還新增支持離線翻譯、拍照翻譯、景區(qū)導(dǎo)覽等功能,可以說集WiFi、翻譯、景區(qū)講解于一體。 在出外旅行過程中,翻譯機一般會應(yīng)用在機場、酒店、景點、商場和餐廳等場景中?!凹夹g(shù)只有解決用戶在實際場景的需求才更有價值。準(zhǔn)兒聚焦在出境游應(yīng)用中,也避免了通用型的翻譯語言在個性化的應(yīng)用場景中'失真’,翻譯準(zhǔn)確率也會更高。”關(guān)磊介紹,根據(jù)一代產(chǎn)品使用等數(shù)據(jù)顯示,準(zhǔn)兒翻譯機在旅游行業(yè)的復(fù)租率達到70%,日調(diào)用達100.4次,最高月調(diào)用率超過15000次。 跨語言溝通與使用環(huán)境有很大的關(guān)系。分音塔的準(zhǔn)兒翻譯機在旅游和日常交流中,中英口語翻譯準(zhǔn)確率達92%,中日翻譯準(zhǔn)確率達81%,中韓、中泰的翻譯準(zhǔn)確率在70%,在化工和醫(yī)療等其他專業(yè)化領(lǐng)域翻譯準(zhǔn)確率還不是特別高。關(guān)磊解釋說:“主要是我們的機器在這種專業(yè)化場景中的應(yīng)用較少,足夠的智能分析數(shù)據(jù)也是讓準(zhǔn)確率提升的重要因素?!?/p> 智能翻譯的創(chuàng)新者 關(guān)于解決語言溝通問題,很多企業(yè)從APP著手,譬如百度、有道等開發(fā)了在線翻譯的APP,用到出境旅游的場景中。螞蜂窩旅行翻譯官APP甚至支持多種語言,小語種場景化,手寫輸入翻譯。流行于歐美的Read for Me APP,可拍攝照片,直接翻譯,能識別30種文字,并能翻譯成36種語言,還提供18種語言的發(fā)音功能。 依托智能手機的攝像頭和觸屏,翻譯APP可以識別圖片和手寫輸入文字。對比翻譯機而言,關(guān)磊表示,翻譯APP產(chǎn)品存在使用低頻和短時單向的問題。 翻譯APP,更像一個電子詞典,輸入才輸出,手機要遞給對方看,即便是有朗讀軟件配合使用,也會出現(xiàn)交流延時,還不能做到即時聽說。如果完全借助APP,與目的地的居民做深入的交流存在困難,因為APP的準(zhǔn)確率還不是很高,即時交流還需要翻譯機輔助。 而且分音塔在做準(zhǔn)兒翻譯機的時候,遇到的問題復(fù)雜得多。比如用戶使用不在中國,使用的場景可能在美國、日本、塞班、馬爾代夫等世界各地,也可能在餐廳、酒店、酒吧、街頭等極其復(fù)雜的場景。在特別嘈雜的環(huán)境中,差距30厘米的語音識別效率會大幅度下降?!爸悄苁謾C語音識別的范圍在20厘米左右,超出這個范圍,語音識別度非常低。分音塔團隊研發(fā)的準(zhǔn)兒降噪技術(shù),已經(jīng)可以適用于50厘米到150厘米范圍內(nèi),識別效果非常好?!标P(guān)磊說。 與中國東南西北各地的口音差別一樣,外國人也有口音,英語有美式、英式、加拿大、南非等很多口音,美式英語的口音識別很差。分音塔的第一代翻譯機發(fā)現(xiàn)了這樣的問題,于是增加了語音的自然語言理解能力,從最早上線支持4種語音,到目前支持39種語言、52種口音,成為支持語言、口音最多的翻譯機。同時,它可以根據(jù)LBS(基于位置的服務(wù))場景來實時選擇當(dāng)?shù)厮枰目谝?,從而提升語音識別準(zhǔn)確率。 智能翻譯機將是新藍海 人和人溝通,7%的信息傳遞是通過語言,38%是通過語調(diào)和語速,55%是通過表情和動作。為了增強人機交互,分音塔團隊給準(zhǔn)兒增加了一塊屏幕,由此通過視覺來彌補聽覺的不足。 用戶在使用中還會面臨網(wǎng)絡(luò)環(huán)境的問題,比如中國、韓國、日本的網(wǎng)絡(luò)環(huán)境比較好,翻譯機在線工作不存在問題,但在加拿大、澳大利亞以及歐洲大部分國家的網(wǎng)絡(luò)信號不穩(wěn)定。這倒逼著分音塔團隊開發(fā)出離線語音識別技術(shù)。目前,分音塔團隊與清華大學(xué)語音和語言技術(shù)研究中心聯(lián)手攻克了中、日、英三種語言的離線語音識別技術(shù),其中日語離線語音識別技術(shù)是國內(nèi)零突破。 據(jù)關(guān)磊介紹,第二代準(zhǔn)兒翻譯機可以實現(xiàn)離線翻譯。支持WiFi、4G卡、虛擬卡的全球聯(lián)網(wǎng),機器本身可以作為熱點,分享給手機、Pad使用。首創(chuàng)翻譯機AI識物拍照,除了可拍照翻譯菜單、路牌、文字、標(biāo)識等,也可拍動植物,通過AI識別進行信息的翻譯和詳解。新增全球景區(qū)導(dǎo)覽功能,出境游自由行再也不用走馬觀花,而可以輕松運用AI拍照深度了解國外景點。 國內(nèi)智能翻譯機的技術(shù)模型成熟了,智能翻譯機的市場藍海未來發(fā)展前景如何?關(guān)磊認為,隨著技術(shù)的發(fā)展和AI技術(shù)的成熟,預(yù)計明年國內(nèi)國際會有很多公司去做翻譯機這款產(chǎn)品,包括仿制品都會出來。在關(guān)磊看來,未來的翻譯機一定是多種模型,就像人和人的交互一樣,有聲音的傳遞,有語氣語調(diào)的傳遞,有肢體語言的傳遞。然而,距離成熟的能達到同聲翻譯功能的機器面世還有很長的道路,智能翻譯機的未來將是一片新藍海。 |
|