AI翻譯服務(wù)通過硬件、軟件連接千千萬萬個(gè)應(yīng)用場景,會打破語言不通的尷尬局面嗎?會是人工翻譯的終結(jié)者嗎? 世界這么大,我想去看看!十一長假臨近,夢想中的你背起行囊,自由行走在異國的大街小巷。然而現(xiàn)實(shí)的畫風(fēng)很有可能是這樣的:走出國門沒幾天,你就發(fā)現(xiàn)期待已久的旅行,因?yàn)榭床欢牪欢?,而身在囧途。此時(shí)的你捶胸頓足地感慨道:世界上最遙遠(yuǎn)的距離,不是天涯海角,是你站在我面前,我卻不知道你在說什么。 9月21日,百度智能翻譯機(jī)在日本發(fā)布。名古屋有哪些好玩的景點(diǎn)?怎么乘車最便捷?翻譯機(jī)流暢精準(zhǔn)的中日互譯令人驚嘆不已。AI翻譯服務(wù)通過硬件、軟件連接千千萬萬個(gè)應(yīng)用場景,將會打破語言不通的尷尬局面。甚至有人認(rèn)為,AI翻譯是人工翻譯的終結(jié)者?,F(xiàn)實(shí)真的如此嗎? 現(xiàn)狀:產(chǎn)品雖多,準(zhǔn)確率有待提高 2017年可謂是AI大行其道的一年,作為現(xiàn)代科技的流行趨勢,不管是谷歌、蘋果,還是百度、阿里,都在相繼發(fā)布自己的人工智能產(chǎn)品,向智能行業(yè)進(jìn)軍。而AI翻譯,幾乎是所有互聯(lián)網(wǎng)巨頭都想涉足的領(lǐng)域。 機(jī)器翻譯已出現(xiàn)了70年,但過去一年里涌現(xiàn)出的AI翻譯軟硬件產(chǎn)品,已超過最近30年的總和。 在國外,微軟發(fā)布了翻譯工具M(jìn)icrosoft Translator,可以實(shí)現(xiàn)9種語言實(shí)時(shí)語音轉(zhuǎn)為文本翻譯。國內(nèi)的互聯(lián)網(wǎng)巨頭也不甘示弱。百度技術(shù)委員會聯(lián)席主席、自然語言處理部技術(shù)負(fù)責(zé)人吳華表示,百度翻譯支持全球28種語言互譯、756個(gè)翻譯方向,每日響應(yīng)過億次的翻譯請求。除百度外,科大訊飛也走在語音交互前列,推出了訊飛聽見升級版產(chǎn)品,加入多語種翻譯功能,五種語言同步翻譯成漢語,還發(fā)布了智能翻譯產(chǎn)品“曉譯翻譯機(jī)”。就連網(wǎng)絡(luò)游戲開發(fā)大戶騰訊公司,也悄然上線了一款實(shí)時(shí)語音翻譯APP“翻譯君”,這款以AI內(nèi)核驅(qū)動的翻譯產(chǎn)品,運(yùn)用了語音識別+NMT(神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯)等技術(shù),可以實(shí)現(xiàn)“同聲傳譯”功能,對著屏幕說話時(shí),邊說邊翻,就像身邊帶了一位私人翻譯官。此外,電商大咖京東也開始涉足AI翻譯,推出了一個(gè)可以進(jìn)行多國語言實(shí)時(shí)翻譯的人工智能翻譯機(jī)——準(zhǔn)兒翻譯機(jī)的眾籌項(xiàng)目,目前已經(jīng)有5008名支持者,輕松籌得320萬元的項(xiàng)目基金。 盡管AI翻譯進(jìn)步神速,卻不被傳統(tǒng)的翻譯行業(yè)所看好。傳神語聯(lián)網(wǎng)絡(luò)科技股份有限公司董事長何恩培表示:“無論是翻譯機(jī)還是APP,中文翻譯成英文或其他語種時(shí)準(zhǔn)確率還可以,但外國人說英文或其他語言時(shí),翻譯成中文的準(zhǔn)確率就很低,在實(shí)際交流時(shí)幾乎沒法用。” 今年2月,谷歌全新NMT系統(tǒng)在韓國世宗大學(xué)與人類譯員進(jìn)行的翻譯對戰(zhàn)就是一例佐證。在規(guī)定的50分鐘內(nèi),人類和機(jī)器同時(shí)翻譯兩段隨機(jī)文本。結(jié)果,人類以巨大優(yōu)勢戰(zhàn)勝了機(jī)器。賽后,評委表示,NMT系統(tǒng)翻譯出的文本90%都有語法問題。 難點(diǎn):數(shù)據(jù)有限,且語言規(guī)則不規(guī)律 全球范圍內(nèi),服務(wù)于各大跨國會議、發(fā)布會等的30多種翻譯機(jī)能幫人們解決一些場景中語言交流的問題,但目前的現(xiàn)狀就如科大訊飛聲明的那樣:雖然機(jī)器翻譯已經(jīng)取得非常大的進(jìn)步,但距離高水平翻譯所講究的“信、達(dá)、雅”還存在很大差距。 以“千山鳥飛絕,萬徑人蹤滅”這句人們耳熟能詳?shù)脑姙槔?,國際翻譯界最高獎(jiǎng)項(xiàng)之一“北極光”杰出文學(xué)翻譯獎(jiǎng)得主許淵沖教授將其譯為“from hill to hill no bird in flight,from path to path no man in sight.”這不僅符合近代著名翻譯家嚴(yán)復(fù)提出的“信、達(dá)、雅”翻譯原則,而且其中的意境與精髓只有熟習(xí)漢語的人才能領(lǐng)會。 “文學(xué)藝術(shù)翻譯要體現(xiàn)情感、色彩、語調(diào)、溫度、韻致、字里行間的意味等種種幽微之處。要傳達(dá)出這些,譯者的水準(zhǔn)、敏感、境界和心靈力量尤為重要。”中國社會科學(xué)院外國文學(xué)研究所編審高興說。 緣何能稱霸棋壇的人工智能AlphaGo,卻在翻譯領(lǐng)域不盡完美?何恩培告訴記者:“機(jī)器翻譯一直被公認(rèn)為人工智能領(lǐng)域最難的課題之一。而且語言和圍棋不同,語言背后的多元文化和復(fù)雜社會屬性,注定了語言規(guī)則不可能規(guī)律化?!薄拔膶W(xué)作品,以及有引申含義或邏輯關(guān)系復(fù)雜的句子,AI翻譯很難搞定,因?yàn)榉g它們不僅是基于理解,而且要使某種意義上待翻譯的語言和目標(biāo)語言對齊?!比A為諾亞方舟實(shí)驗(yàn)室資深研究員、自然語言處理專家呂正東說。 此外,AI翻譯要想達(dá)到“信、達(dá)、雅”的高度,還需克服口語化的兩大難題。一方面要聽得清,能準(zhǔn)確判斷出指令發(fā)出者的語音、停頓,并在極短時(shí)間內(nèi)進(jìn)行“語音斷句”。另一方面要克服口語交談中的語法問題,以及句子不連貫、沒有明確句子邊界等問題。 機(jī)器靠什么解決上述問題?在清華大學(xué)計(jì)算機(jī)系副研究員劉洋看來,AI機(jī)器翻譯的難點(diǎn)其實(shí)也是整個(gè)人工智能的難點(diǎn)——如何讓機(jī)器真正像人一樣有智能行為。他認(rèn)為,機(jī)器翻譯采用數(shù)據(jù)驅(qū)動的方法,其準(zhǔn)確程度取決于給計(jì)算機(jī)提供哪些數(shù)據(jù)。目前提供最多的翻譯數(shù)據(jù)來自于政府文檔,比如聯(lián)合國有多種官方語言,基本每份文件都有多語種版本,但基本沒有體育、娛樂等領(lǐng)域的數(shù)據(jù)。再加上各國的口語中都存在較多隨意性口語或網(wǎng)絡(luò)用語,生活化氣息濃厚,多為非正式的語體材料,因此智能翻譯需要龐大的基礎(chǔ)詞匯庫支撐。“其實(shí)所有上述問題,理論上來說都可以靠更多的數(shù)據(jù)來彌補(bǔ),但是我們數(shù)據(jù)是有限的。” 呂正東說。 展望:前路漫漫,發(fā)展需數(shù)據(jù)推動 近兩年,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(Neural Machine Translation, NMT)技術(shù)異軍突起使翻譯應(yīng)用進(jìn)一步革新。 NMT模仿人腦的神經(jīng)思考模式,產(chǎn)出媲美人工翻譯的高質(zhì)量譯文,并將誤差降低了55%—85%。目前,谷歌公司己將該技術(shù)應(yīng)用于網(wǎng)頁翻譯與手機(jī)應(yīng)用,譯文質(zhì)量明顯提升。此外,騰訊、百度、阿里巴巴等國內(nèi)互聯(lián)網(wǎng)公司也將深度學(xué)習(xí)理念應(yīng)用到機(jī)器翻譯。同時(shí),語言處理、語音交互等技術(shù)的進(jìn)步又加速了翻譯產(chǎn)品的場景升級,促使機(jī)器輔助翻譯”(CAT,Computer Aided Translation)過渡到“人工智能交互翻譯”(AI Interactive Translation)。 http://www./post/659.html |
|