圖片來(lái)源IC Photo 編者按:本文來(lái)自IDG資本,作者IDG君,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。 也許你并沒(méi)聽(tīng)過(guò)Luis von Ahn,但你一定在上網(wǎng)的時(shí)候輸入過(guò)登陸驗(yàn)證碼,并在輸錯(cuò)的時(shí)候心理默念:這是什么雞肋的步驟! 驗(yàn)證碼的問(wèn)世替網(wǎng)站分辨出了機(jī)器和人,解決了垃圾廣告和黃牛搶票的問(wèn)題。背后的創(chuàng)造者Luis是一位天才,他還創(chuàng)建了語(yǔ)言教育平臺(tái)Duolingo,其估值已達(dá)15億美元。 這兩個(gè)創(chuàng)新的一個(gè)共同特點(diǎn)是——在解決問(wèn)題的同時(shí)滿(mǎn)足了另一項(xiàng)需求,實(shí)現(xiàn)了資源的有效配置。 于是,因?yàn)樗陌l(fā)明,在不知情的情況下,全世界的用戶(hù)每年免費(fèi)將230萬(wàn)本書(shū)數(shù)字化,并在短短幾周就把CNN和《紐約時(shí)報(bào)》數(shù)年累積的內(nèi)容翻譯成其他語(yǔ)言。 而Luis創(chuàng)業(yè)的初心是為了為人類(lèi)解決切實(shí)問(wèn)題,這也為他帶來(lái)了巨大的財(cái)富。希望讀到這篇文章的你,也能從他解決問(wèn)題、實(shí)現(xiàn)共贏的方式中獲得啟發(fā)。 Luis出生于中美洲危地馬拉,后移居到美國(guó)。 18歲的他去了北卡羅來(lái)納州的杜克大學(xué)攻讀數(shù)學(xué)學(xué)位。之后,他又繼續(xù)在匹茲堡的卡內(nèi)基梅隆大學(xué)學(xué)習(xí)計(jì)算機(jī)科學(xué)。 成為了計(jì)算機(jī)科學(xué)教授后的Luis發(fā)明了“人計(jì)算”,簡(jiǎn)單來(lái)說(shuō)就是人與計(jì)算機(jī)如何最優(yōu)協(xié)作以解決復(fù)雜任務(wù)。該領(lǐng)域的開(kāi)拓性工作讓他獲得了美國(guó)著名的麥克阿瑟研究員計(jì)劃獎(jiǎng),俗稱(chēng) “天才的補(bǔ)助金”。 30歲剛出頭的Luis就把自己手下的兩家公司賣(mài)給了科技巨頭谷歌,而他所開(kāi)發(fā)的技術(shù)被廣泛使用。 驗(yàn)證碼的進(jìn)化:人人都做免費(fèi)校對(duì)驗(yàn)證碼的英文縮寫(xiě)是CAPTCHA,全名為全自動(dòng)區(qū)分計(jì)算機(jī)和人類(lèi)的圖靈測(cè)試 (Completely Automated Public Turing Test To Tell Computers and Humans Apart)。 驗(yàn)證碼的出現(xiàn),還要追溯到一段往事。一天,Yahoo的一位主要研究員來(lái)到Luis所在的學(xué)校開(kāi)講座,主題是《我們無(wú)法解決的十大問(wèn)題》。其中一個(gè)問(wèn)題是,一些人使用電腦程序的自動(dòng)軟件創(chuàng)造了上百萬(wàn)的虛假電郵地址,成堆地給人們發(fā)送垃圾廣告。于是年僅21歲的Luis開(kāi)始思考如何解決這個(gè)問(wèn)題。 在沒(méi)有驗(yàn)證碼的日子里,網(wǎng)絡(luò)世界是雜亂無(wú)章的。網(wǎng)站無(wú)端地被注冊(cè)上萬(wàn)個(gè)空賬號(hào),黃牛利用機(jī)器把演唱會(huì)門(mén)票和火車(chē)票一掃而空。 但有了驗(yàn)證碼,網(wǎng)站就能保證填寫(xiě)表格的是一個(gè)真實(shí)的人,因?yàn)殡娔X程序無(wú)法在圖像上識(shí)別出扭曲的文字,但是人類(lèi)可以。 而Luis的思考并不止步于此。 驗(yàn)證碼的影響力之大,已經(jīng)擴(kuò)展到了全球范圍——每天有大約2億次的驗(yàn)證碼輸入,而每個(gè)驗(yàn)證碼平均耗時(shí)10秒鐘。如果將這個(gè)數(shù)字乘以2億,那么全人類(lèi)每天就在輸入驗(yàn)證碼上浪費(fèi)了50萬(wàn)個(gè)小時(shí)。 Luis對(duì)此表示耿耿于懷。于是,他又了一個(gè)新想法——既然不能因?yàn)榫W(wǎng)頁(yè)安全而放棄驗(yàn)證碼,那么有什么方法可以利用它來(lái)做點(diǎn)好事呢? 人在輸入驗(yàn)證碼的10秒鐘里,大腦精確運(yùn)行著,這甚至是電腦所無(wú)法匹敵的。怎樣才能讓這10秒鐘的工作變得有意義呢?有沒(méi)有什么目前電腦無(wú)法解決,但是可以分割成僅用10秒就能解決的難題呢? Luis想到了一個(gè)點(diǎn)子——書(shū)籍?dāng)?shù)字化。 市面上有很多書(shū)籍?dāng)?shù)字化的項(xiàng)目,包括亞馬遜的Kindle和谷歌都有這些需求。從一本舊書(shū)開(kāi)始,首先掃描,相當(dāng)于把每一頁(yè)照一張數(shù)碼照片,這樣就有了這本書(shū)每一頁(yè)的文字內(nèi)容。下一步,電腦需要解讀這些照片上的每一個(gè)字。 這就涉及到了OCR(Optical Character Recognition)技術(shù),也就是光學(xué)字符識(shí)別。但光學(xué)字符識(shí)別的技術(shù)并不是萬(wàn)能的,統(tǒng)計(jì)顯示,五十年前的書(shū),有30%的單詞電腦都無(wú)法識(shí)別。特別對(duì)于那些墨水褪色、書(shū)頁(yè)又泛黃的舊書(shū)。 于是Luis利用技術(shù)摘錄出那些電腦無(wú)法識(shí)別的單詞,這樣廣大用戶(hù)在網(wǎng)上輸入驗(yàn)證碼時(shí),就能將其識(shí)別出來(lái)。 但你要說(shuō)了,這怎么能知道用戶(hù)輸入的就是正確答案呢? Luis為此加入了雙單詞識(shí)別。 ▍其中一個(gè)單詞A是電腦無(wú)法識(shí)別的單詞——因?yàn)橄到y(tǒng)不認(rèn)識(shí)這個(gè)單詞,所以無(wú)法判斷輸入者的答案。 ▍另一個(gè)單詞B是系統(tǒng)已經(jīng)識(shí)別的單詞——但系統(tǒng)不會(huì)告訴你哪個(gè)是已知哪個(gè)是未知。 當(dāng)用戶(hù)輸入兩者的時(shí)候,如果能拼寫(xiě)正確系統(tǒng)已認(rèn)知的那個(gè)單詞B,那么就判斷該用戶(hù)為真人,同時(shí),對(duì)于單詞A,只要有10個(gè)人輸入了相同的單詞,那么這個(gè)詞就確定無(wú)誤了。 你以為你輸入的僅僅是驗(yàn)證碼,但其實(shí)你在免費(fèi)幫忙錄入陳舊的電子書(shū)。 成功后再創(chuàng)業(yè):讓3億人學(xué)習(xí)語(yǔ)言的同時(shí)免費(fèi)做翻譯如今的Luis的新身份,是全球語(yǔ)言學(xué)習(xí)程序Duolingo的聯(lián)合創(chuàng)始人。 Luis發(fā)現(xiàn),互聯(lián)網(wǎng)的大部分語(yǔ)言是英語(yǔ)。YouTube上耶魯大學(xué)的課程、科普視頻、Amazon的書(shū)籍、新聞網(wǎng)站、博客等等,基本都是英語(yǔ),這意味著只有懂英語(yǔ)才能使用這些網(wǎng)站。就算世界上有4.37億人說(shuō)西班牙語(yǔ),但西班牙語(yǔ)版的維基百科詞條數(shù)量也只是英語(yǔ)的20%。 當(dāng)然,一些網(wǎng)站還有其他幾種不同的主流語(yǔ)言,但如果用戶(hù)那幾種也不會(huì),就沒(méi)辦法使用。 那他們?cè)趺崔k呢?解決辦法是——復(fù)制粘貼到翻譯網(wǎng)站。在今天,機(jī)器翻譯雖然已經(jīng)得到廣泛應(yīng)用,但準(zhǔn)確度不夠高,這個(gè)問(wèn)題可能在未來(lái)短期之內(nèi)都沒(méi)辦法很好地解決。 Luis認(rèn)為,網(wǎng)站翻譯的工作還是需要人來(lái)完成。但擺在面前的有幾大問(wèn)題:
Luis想,有沒(méi)有可能找一億人,免費(fèi)把網(wǎng)頁(yè)內(nèi)容翻譯成其他語(yǔ)言?后來(lái)他意識(shí)到,有一個(gè)方法可以一箭雙雕——語(yǔ)言學(xué)習(xí)。 語(yǔ)言學(xué)習(xí)不僅能讓無(wú)數(shù)人愿意去做翻譯練習(xí),同時(shí)如果這項(xiàng)學(xué)習(xí)是免費(fèi)的的話(huà),還能激勵(lì)越來(lái)越多的人參與。因此,路易斯開(kāi)始頭腦風(fēng)暴,并與一位名叫塞弗林·??说娜撕献?,創(chuàng)建了一個(gè)幾乎完全免費(fèi)的平臺(tái)。 Luis拿自己舉例,他說(shuō),自己的成功主要?dú)w功于他很幸運(yùn)地能夠在小時(shí)候?qū)W英語(yǔ)。雖然不是他的母語(yǔ),但他的醫(yī)生母親堅(jiān)持讓他從小就學(xué)英語(yǔ)。當(dāng)時(shí),中產(chǎn)家庭出身的他在危地馬拉城的一所私立英語(yǔ)學(xué)校上學(xué)。 與大多數(shù)危地馬拉人相比,他的學(xué)習(xí)機(jī)會(huì)太難得了——根據(jù)世界銀行的數(shù)據(jù),該國(guó)幾乎一半的人口生活在貧困中,其中9%處于極端貧困狀態(tài)。許多人受教育的機(jī)會(huì)是非常有限的。 當(dāng)今,全球有超過(guò)12億人口在學(xué)習(xí)外語(yǔ)。在美國(guó),每年有超過(guò)500萬(wàn)人支付了外語(yǔ)學(xué)習(xí)軟件,人均消費(fèi)超過(guò)500美元。但是,全球范圍內(nèi),能支付得起500美元的人非常有限。 Luis建立的新網(wǎng)站Duolingo,不僅能讓人們免費(fèi)學(xué)習(xí)外語(yǔ),與此同時(shí)能讓使用者學(xué)以致用,進(jìn)階翻譯。 Duolingo的產(chǎn)品邏輯是這樣的:
這全套流程,都在鼓勵(lì)用戶(hù)邊學(xué)邊用,學(xué)以致用。 神奇的是,這種學(xué)習(xí)方法,不僅可以迅速掌握外語(yǔ),而且讓學(xué)習(xí)更有趣味性。通過(guò)Duolingo,人們掌握的是真正的語(yǔ)言使用技巧,編造句子,而不是簡(jiǎn)單地背單詞。 為了讓翻譯達(dá)到專(zhuān)業(yè)水準(zhǔn),Duolingo智能地把數(shù)名用戶(hù)的翻譯結(jié)合起來(lái)。 再回到前面對(duì)維基百科翻譯工程的預(yù)計(jì)——把西班牙語(yǔ)翻譯成英語(yǔ),是價(jià)值五千萬(wàn)美元的工程。但如果有十萬(wàn)名活躍用戶(hù),這項(xiàng)工程就可以在五周內(nèi)完成。如果是一百萬(wàn)活躍用戶(hù)就只需要八十小時(shí)。 而截止至2018年,Duolingo在全球擁有超過(guò)3億用戶(hù),是世界上最受歡迎的語(yǔ)言學(xué)習(xí)應(yīng)用。 Luis對(duì)Duolingo最興奮的點(diǎn)在于,它為外語(yǔ)教育創(chuàng)造了一個(gè)公平的商業(yè)模式——為沒(méi)能力付費(fèi)學(xué)外語(yǔ)的人也敞開(kāi)了機(jī)會(huì)。 比起付費(fèi)來(lái)購(gòu)買(mǎi)外語(yǔ)學(xué)習(xí)軟件或是視頻,Duolingo的產(chǎn)品設(shè)計(jì)者認(rèn)為,人在學(xué)習(xí)的過(guò)程中,大腦也在創(chuàng)造價(jià)值。如此一來(lái),人的語(yǔ)言學(xué)習(xí)過(guò)程就貨幣化了。用戶(hù)不需要為語(yǔ)言學(xué)習(xí)付費(fèi),因?yàn)樗麄兏冻隽藭r(shí)間。 后期的Duolingo在用戶(hù)基群壯大的條件下,又加入了廣告運(yùn)營(yíng)模式。免費(fèi)用戶(hù)(freemium)可以繼續(xù)免費(fèi)使用Duolingo軟件,但愿意付費(fèi)的用戶(hù)可以通過(guò)花費(fèi)7美金的月費(fèi)升級(jí)成為Duolingo Plus 高級(jí)用戶(hù)(Premium)享受無(wú)廣告瀏覽。 而現(xiàn)在,Duolingo決策者的野心更大,他們想要參與到更廣闊的市場(chǎng)中。對(duì)第二、第三世界國(guó)家視野開(kāi)闊的人來(lái)說(shuō),雅思或托福考試是痛苦的障礙,要花很多費(fèi)用去學(xué)習(xí)。因此,Duolingo低調(diào)地開(kāi)發(fā)著自己的標(biāo)準(zhǔn)化考試,并被越來(lái)越多的機(jī)構(gòu)認(rèn)可。 |
|
來(lái)自: 昵稱(chēng)GYL89 > 《hzcya.com》