問題一:AI對人類存在威脅嗎? 在當(dāng)今,擔(dān)心人工智能的罪惡超能力就如同擔(dān)心火星移民計劃導(dǎo)致的人口過剩一樣,為時過早。因為實際上,我們甚至還沒有登陸到火星表面! 人工智能目前已經(jīng)有了巨大的進(jìn)展,并且我對于機器智能技術(shù)由上之下構(gòu)建服務(wù)更好的人類社會抱持樂觀態(tài)度。但是到目前為止,人工智能的發(fā)展仍然非常局限。幾乎所有深度學(xué)習(xí)的經(jīng)濟(jì)價值和社會價值仍然依賴于監(jiān)督學(xué)習(xí),即同時受限制于特定格式(比如,標(biāo)記過的數(shù)據(jù))。即便人工智能已經(jīng)能夠幫助者數(shù)億人,并以積極的姿態(tài)準(zhǔn)備去幫助更多的人,我也仍然沒有發(fā)現(xiàn)任何現(xiàn)實意義上能夠威脅到人類社會的人工智能方法。 長久來看,我發(fā)現(xiàn)很多種除了監(jiān)督式學(xué)習(xí)之外的人工智能方法技術(shù)都非常激動人心,比如無監(jiān)督式學(xué)習(xí)(由于數(shù)據(jù)無需再被標(biāo)記,就有了更多的可用數(shù)據(jù))。我個人或是其他的研究組在其他形式的學(xué)習(xí)方面也都有很多令人振奮的進(jìn)展。我們所有人都希望看到一個技術(shù)性的突破,但誰都沒法預(yù)測什么時候會真正到來。 我認(rèn)為諸如對于 「邪惡智能殺手」的恐懼,已經(jīng)都成為了決策者和領(lǐng)導(dǎo)人濫用資源來解決一個根本不存在的幻影的借口。實際上人工智能會引發(fā)的其他問題,但更集中于工作的取代上。即便人工智能在未來十年能夠幫助我們建立一個更好的社會,我們作為人工智能的創(chuàng)造者同時也應(yīng)該對可能引發(fā)的一系列問題肩負(fù)起應(yīng)有的責(zé)任。我希望 MOOCs(Coursera)成為解決問題的一部分,但是我們?nèi)孕枰逃飧嗟臇|西。 對于這個問題,我們看看深度學(xué)習(xí)三巨頭之一的Yoshua Bengio的回答: 在未來,我們是否能研發(fā)出具備人類水平智能、甚至超越人類的AI?這個問題依然有很大的不確定性。盡管我是一個樂觀主義者,但基于上述不確定性,我不能否認(rèn),我們不想看到的事依然有可能會發(fā)生。這就是我在FLI(Future of Life)呼吁AI應(yīng)該穩(wěn)健且有益于人類的公開信上簽字的原因。 然而,必須注意到,這種潛在的危險距離現(xiàn)在的我們還很遙遠(yuǎn)。新聞媒體總傾向于在這方面夸大其詞,以吸引注意力。這將損害AI研究。相反,我們應(yīng)該鼓勵研究者去更好地理解這些問題,如果有那么一天這些問題真的迫在眉睫,他們能讓我們準(zhǔn)備好,并為我們提供尊重人類價值的更安全的AI。 說到這里,我相信,將媒體的注意力從科幻片中的長期恐懼轉(zhuǎn)向AI短期內(nèi)可能帶來的更具體的社會、經(jīng)濟(jì)和政治問題上,是一件很重要的事。但是,我們必須提前思考這些問題,不要等到大多數(shù)人遭受不幸(比如失業(yè))而少數(shù)幸運者變得超級富裕且強勢時才想到這些問題。在決定要怎樣使用AI帶來的進(jìn)展時,我們必須發(fā)揮群體的智慧,讓它有利于大多數(shù)人,而不是少數(shù)人。為了與科技帶來的不斷增長的力量相匹配,弱肉強食的叢林法則是不合適的:為了當(dāng)代人以及我們后代的利益,個人和群體的智慧都必須有所增長。 問題二:無人駕駛汽車何時能真正上路? 我希望在三年之內(nèi)能夠看到大量的無人駕駛汽車問世,而在五年之內(nèi)能夠進(jìn)行大規(guī)模生產(chǎn)。(如果你愿意,你可以在你的日程中寫下這一點,三到五年之后再來檢驗我的預(yù)測是否正確。) 最近我們剛剛度過了斯坦福大學(xué)贏得DARPA無人駕駛汽車挑戰(zhàn)賽十周年紀(jì)念日。但是為什么無人駕駛技術(shù)花費了這么久的時間還沒有成熟呢? 首先,我認(rèn)為建造一輛可以滿世界跑的汽車的方法本身就非常具有挑戰(zhàn)性,而且通常情況下第一個要解決的目標(biāo)也是錯誤的(或者說不切實際的)。無人駕駛汽車最大的問題是解決所有的極端情況——即每行駛1萬甚至10萬英里才會發(fā)生的一些奇怪的事情。機器學(xué)習(xí)有助于將你的表現(xiàn)從90%的準(zhǔn)確率提高到99.9%,但是卻不會從99.9%提高到99.9999%。我認(rèn)為以另外一個目標(biāo)為起點或許更合適(更有希望):區(qū)間車只能選擇一條巴士路線,或者僅僅在很小的范圍內(nèi)活動。如果我們可以保證該路線的道路表面和車道標(biāo)線維護(hù)良好,例如沒有進(jìn)行施工等;這樣我們可以使得可觸范圍內(nèi)保持真正的安全;然后依照這樣我們可以慢慢加入新的路線,從而逐漸使得在這個區(qū)域內(nèi)我們都能安全行駛。這也是百度正在進(jìn)行的方案,我希望其他的小組也能采取這樣的方法。 其次,汽車看待世界的方式和我們不一樣。例如,今天的計算機視覺不能有效地分辨建筑工人朝你揮手時是在讓你「過來」還是「停下來」。另一方面,我們的無人駕駛汽車并沒有任何的盲點,隨時都可以進(jìn)行360°全方位觀察;我們的車載HPC系統(tǒng)的反應(yīng)速度也要比人類的反應(yīng)速度要快。因此,我并不認(rèn)為我們應(yīng)該期待無人駕駛汽車和人類駕駛汽車的方式一樣。我們可以讓無人駕駛汽車變得安全、有預(yù)測能力和更加可靠;但是,它們將會和人類駕駛的汽車不同。作為技術(shù)人員,我們必須要有政府和社會的參與,他們的參與不僅可以幫助建立新的法規(guī),而且能有效l了解社會對于這些汽車的新期望。 當(dāng)然,對于無人駕駛汽車的未來,我們非常樂觀。它將幫助人類節(jié)省大量的時間,以及避免大量的交通事故。我希望全球的科技社群能夠和政府與社會一起,通力合作,早日實現(xiàn)這一美好愿景。 問題三:未來20年的工作會是什么? 如果你是一名50歲的貨車司機,有一天你的工作突然被自動駕駛汽車搶了,你該怎么辦? 其實,我們的社會是很擅長為有技能的人提供機會的, 問題在于30多年累計的經(jīng)驗技能在一息之間就貶值了。在這種情況下,我們有道德上的義務(wù)去幫助這些受影響的個體,獲取新技能和新機會。 幸運的是,隨著MOOCs及其他可快速擴(kuò)張的教育形式的興起(如 Coursera, Khan Academy, Lynda),我們現(xiàn)在可以用較為實際的成本做到這點。我并不為20年后我們是否會缺少重要的工作崗位而擔(dān)心,因為其實有很多人們正在擔(dān)任的工作是機器在當(dāng)下或許在可預(yù)見的未來都無法勝任的; 但是我為個體的再教育需求感到擔(dān)心。 同時,我認(rèn)為基礎(chǔ)收入也是有必要的。這樣做可以為個體提供保障措施以及獲取新技能的機會。當(dāng)今社會以及政治現(xiàn)狀可能還不能接受「毫無緣由地付錢給人們」這個想法。所以,我提議向人們支付薪水,作為他們學(xué)習(xí)的回報。 這樣,既不會使大家無所事事,又可以有效地引導(dǎo)失業(yè)者去做一些有利于他們重新進(jìn)入勞動大軍的事情。 我十分喜歡Erik Brynjolfsson和Andrew McAfee寫的 「第二次機器時代」,他們在其中有討論這些問題。 問題四:開啟機器學(xué)習(xí)職業(yè)生涯最好的方法是什么? Cousera上的斯坦福大學(xué)的機器學(xué)習(xí)課程就是為了讓更多的人可以開始接觸機器學(xué)習(xí)而設(shè)計的。如果你熟悉基本的編程(通過任何一種語言),我都推薦你從這個課程開始。 很多人通過完成了這門網(wǎng)絡(luò)公開課得到了機器學(xué)習(xí)相關(guān)的工作。還有一些其他的類似的課程也很有用;比如約翰霍普金斯的數(shù)據(jù)科學(xué)專家系列。參加Kaggle或者其他的機器學(xué)習(xí)競賽也幫助很多人獲得了不少經(jīng)驗。Kaggle有一個帶有在線討論的社區(qū),你可以從中學(xué)到很多實用的技巧。參加本地的meetup見面會或?qū)W術(shù)會議(如果你愿意付這個價錢),還有多和有經(jīng)驗的人聊聊也很有幫助。 但是最重要的是要堅持學(xué)習(xí)。不單單是幾個月,而是幾年。 每周六,你都要在是在家里讀論文或?qū)嵺`算法與看電視之間選擇。如果你整個周六都在工作,短期內(nèi)也不會有太多回報,而且你現(xiàn)在的老板甚至不會知道,也不會對你說「干得好」。此外,即使一個周六的學(xué)習(xí)過后,你也不是真的就對機器學(xué)習(xí)那么在行。但是秘密在于:如果你不僅僅只是一個周末如此,而是堅持這樣學(xué)習(xí)一年,那么你會變得非常優(yōu)秀。 如今社會對具備機器學(xué)習(xí)技能的人才有很高的需求;一旦你得到一份機器學(xué)習(xí)的工作,你的學(xué)習(xí)只會進(jìn)步的更快。 世界需要更多的懂得機器學(xué)習(xí)的人來幫助解決問題。我們的社會有太多的數(shù)據(jù)和計算資源,(這些使得)機器學(xué)習(xí)就像有超能力一般,允許你創(chuàng)造令人震驚的東西; 但是現(xiàn)在只是沒有足夠的(懂的機器學(xué)習(xí))的我們來做這些事。我希望我的讀者們可以更加努力,學(xué)好機器學(xué)習(xí)。 對這個問題,我們來聽聽Yoshua Bengio的回答: 首先,你要經(jīng)過基礎(chǔ)的數(shù)學(xué)和計算機科學(xué)的訓(xùn)練。就深度學(xué)習(xí)而言,你可以看麻省理工出版社出版的深度學(xué)習(xí)的書的第一部分(現(xiàn)在網(wǎng)上有電子版,最終麻省理工出版社會出版紙質(zhì)版)來溫習(xí)或者看數(shù)學(xué)和計算機科學(xué)領(lǐng)域最相關(guān)的內(nèi)容。然后你需要閱讀機器學(xué)習(xí)方面的內(nèi)容,比如Chris Bishop和 Kevin Murphy的書,Andrew Ng的coursera課程,和Hugo Larochelle關(guān)于神經(jīng)網(wǎng)絡(luò)的視頻,然后你在深度學(xué)習(xí)書的第五部分中總結(jié)出許多基本問題。然后你就需要開始練習(xí)了,比如自己編寫一些算法,用數(shù)據(jù)訓(xùn)練它們,試著參加Kaggle的比賽。試著在優(yōu)化超參數(shù)和選擇合適模型方面成為專家,同時繼續(xù)閱讀。如果你對深度學(xué)習(xí)感興趣,我的書的第二部分會告訴你最基本的算法基礎(chǔ)。此時,你已經(jīng)有足夠的知識背景積累,可以開始選擇你喜歡的書籍閱讀了。 問題五:Coursera早期時候最有趣的故事是什么? 慕課(MOOCs)從早期創(chuàng)建就與眾不同。 2011年,斯坦福大學(xué)推出了三個引人注目的MOOCs,包括機器學(xué)習(xí)、數(shù)據(jù)庫和人工智能;也正是這一舉動導(dǎo)致了今天的MOOC運動。人們當(dāng)時的反應(yīng)是,「哇,這真的是橫空出世的新鮮事物!」 但是如果你是其中的建造者之一,你就會看到它一步步的發(fā)展歷程,到最后如何實現(xiàn)了「橫空出世」。2011年推出的這個MOOC是我做的第六個在線教育網(wǎng)站。之前的一些都遠(yuǎn)不如這一個網(wǎng)站成功,或許你從未聽說過。但是我們從早期的原型中不斷地學(xué)習(xí)、總結(jié),直到2011年我們成功地建立了這樣實現(xiàn)質(zhì)變的產(chǎn)品。從 Jennifer Widom和我寫的《現(xiàn)代MOOC的起源》中你可以讀到更多早期的故事(我們倆負(fù)責(zé)2011年MOOC推出的三門課中的兩門)。 后來,在深度學(xué)習(xí)中我們也看到了類似的現(xiàn)象。在外行人看來,他們的印象是「哇,這真的是橫空出世的新鮮事物!」(這種類似反應(yīng)出現(xiàn)在2012年,當(dāng)時我正負(fù)責(zé)谷歌大腦計劃,并宣布了貓的研究結(jié)果。)但是對于我們中這些為MOOC工作多年的人來說,這種進(jìn)步真的是一步步取得的。 線性范疇上的指數(shù)式進(jìn)步看起來通常都是一個不連續(xù)的變化過程。在科技領(lǐng)域我們看到了太多這樣的例子。 既然你問了這樣的問題,這里我就講述一個故事:2011年,我與斯坦福大學(xué)的四個學(xué)生一起工作。我們需要為已經(jīng)注冊的10萬學(xué)生建造新的功能,因此我們的壓力非常大。其中的一名學(xué)生(Frank Chen)聲稱另一名學(xué)生Jiquan Ngiam經(jīng)常將他滯留在斯坦福大學(xué)的大樓中,知道深夜才讓他搭車會宿舍,因此他沒有別的選擇,只有留下來并繼續(xù)工作。我從來沒有去核實這件事情的真實性。 你對學(xué)生們有何建議?當(dāng)面臨該如何支配時間這個問題時,我建議你考慮以下兩個方面:
即便是今天,這兩個標(biāo)準(zhǔn)也是決定我如何分配時間的標(biāo)準(zhǔn)。 我們現(xiàn)今的社會能夠給你非常多的機會讓你你去改變這個世界。在數(shù)字技術(shù)和先進(jìn)通信技術(shù)的幫助下,靈感和產(chǎn)品以前所未有的速度進(jìn)行傳播。擁有一個不錯的想法以及強大的執(zhí)行力,任何人都可以很快的幫助到地球上的很多人。 所以,問問自己:如果你正在做的事情是為了極力追求那些能夠超越你狂熱夢想的成功,那么你也沒有zai很大程度上幫助到其他人?如果不能,那么應(yīng)該保持探索的心去尋找一些其他的事情來做。而如果恰恰答案是肯定的,那么你就要全力以赴發(fā)揮自己最大的潛能去追求。 第二點,特別是當(dāng)你還年輕的時候,不要去試圖預(yù)估投資在你自己未來教育中的價值。 我定義的「年輕」是任何在100歲以下的人。 任何你所學(xué)習(xí)的東西都能夠在數(shù)十年后給予你回報。但這并不容易。一旦你離開了學(xué)校,投資于學(xué)習(xí)的時間在短時間內(nèi)幾乎很難看到明顯回報。沒有老師會站在你身后給你一個分?jǐn)?shù)評語或者督促你繼續(xù)用功。但是如果你肯自我激勵或者保持閱讀的習(xí)慣,繼續(xù)跟自己的想法較勁,和能夠讓你獲益的人保持溝通,那么在數(shù)年之后你可能會成為在特定個人領(lǐng)域?qū)W習(xí)之中的佼佼者。 拿我自己來說,我喜歡閱讀。我的kindle上有超過1000本的書籍,并且我每天晚上、每個周末都會花費很多時間進(jìn)行閱讀。我的閱讀范圍包括了學(xué)術(shù)研究論文、商業(yè)策略、創(chuàng)新過程、產(chǎn)品、我欣賞的人物的自傳,等等。有時我還會參加MOOC課程學(xué)習(xí),同時我也非常喜歡與那些能夠教會我新知識的人交談,無論新知還是故交。 學(xué)習(xí)的過程也會幫助你決定真正該從事什么,當(dāng)你看到了足夠多的關(guān)于別人如何改變世界的實例,你也會得到更多靈感來啟發(fā)自己如何去改變世界。 做一個簡單總結(jié):即使并不容易,但還是應(yīng)該堅持在學(xué)習(xí)中探索,同時積極尋找一種能幫助整個人類的事業(yè),并投身其中。 是什么促使你追求人工智能? 我希望我們可以使用人工智能建設(shè)一個更好的社會。 就如工業(yè)革命將人類從大量的體力苦工中解放出來(想想你的生活得是個什么樣子,如果你的衣服都需要你自己縫?)在未來,人工智能將會將人類從腦力苦工中解放出來。比如說,有了自動駕駛汽車,就意味著我們不再需要浪費一生中的三年時間在開車上。這將帶給我們更多的時間,用以陪伴所愛之人,以及追求更有價值的目標(biāo)。 我從16歲時就開始做神經(jīng)網(wǎng)絡(luò)(現(xiàn)在被稱作「深度學(xué)習(xí)」)。當(dāng)時我在新加坡國立大學(xué)實習(xí)。拿今天的標(biāo)準(zhǔn)來看,我們當(dāng)時做的非常微不足道,但是當(dāng)時我想幾行代碼就可以讓一個電腦來學(xué)習(xí),這件事實在太神奇了! 學(xué)霸小爆料:由于當(dāng)年我們的電腦用emacs太慢,我學(xué)會了用vi,并且一直對其有所偏愛使用至今。(譯者注:emacs是一種很古老的文本編輯器。在Unix文化里,Emacs是黑客們關(guān)于編輯器之戰(zhàn)的兩大主角之一,它的對手是vi、Vim。) 那段時間,我還做了另外一個實習(xí)——辦公室助理,并且做了一大堆復(fù)印工作。(技術(shù)上來說,我是辦公室助理的助理。)正是在那時,我意識到更聰明的機器可以幫人類做很多事情,這樣人類就可以去做更多在智力上有挑戰(zhàn)的事情。 在接下來的十年里,人工智能將改變社會。它將把我們所做的事情轉(zhuǎn)變?yōu)槲覀冏岆娔X為我們做的事情。也許在接下來的數(shù)十年里,將有人在Quora提出這樣的問題:「如果你不得不自己駕駛汽車,你的生活會是什么樣子?」 你更希望在產(chǎn)業(yè)中工作還是在斯坦福從事學(xué)術(shù)研究?當(dāng)人們向我咨詢自己該去產(chǎn)業(yè)界還是學(xué)術(shù)界時,我通常建議他們應(yīng)該先認(rèn)清自己想做什么。 比如,自己身上的使命是什么?你想為改變世界做些什么?當(dāng)你對以上問題有了答案時,就自然而然明白自己的心之所向了。 在產(chǎn)業(yè)界工作有這些東西是吸引我的:
當(dāng)然,學(xué)術(shù)環(huán)境也有它自身的優(yōu)勢:
對于我而言,讓我振奮的一個使命是構(gòu)建一個獲取最佳教育資源的普世方法,我認(rèn)為Coursera就是一條捷徑。我越來越喜歡通過人工智能技術(shù)的發(fā)展去幫助成千上萬的人,并且我認(rèn)為百度是實現(xiàn)這個夢想的平臺。但是也有很多同樣重要的使命,比如傳道授業(yè)、特定領(lǐng)域的投資研發(fā)等,這些我覺得更適合在高校中完成。 你對深度學(xué)習(xí)怎么看?深度學(xué)習(xí)是一個已經(jīng)在幫助數(shù)不清的小組制造了令人興奮的人工智能應(yīng)用的極棒的工具。它正在幫我們建造自動駕駛汽車,準(zhǔn)確的語音識別,能夠理解圖像的電腦,以及很多很多其他的。 在最近的一些進(jìn)步之外,我還是看到前方有大量的尚未被挖掘出來的機會。在精準(zhǔn)農(nóng)作、消費金融、醫(yī)藥等領(lǐng)域已經(jīng)出現(xiàn)了很多項目,在這些方面,我看到非常清晰的看到了深度學(xué)習(xí)大有作為的機會,但是至今卻尚未有人有時間專注其中。所以我對深度學(xué)習(xí)在近期絕對不會進(jìn)入「平臺期」很有信心,它會持續(xù)快速增長。 同時深度學(xué)習(xí)被過度炒作了。因為神經(jīng)網(wǎng)絡(luò)非常專業(yè)而且很難解釋,我們中的很多人過去習(xí)慣通過繪制人類大腦的類比圖來解釋它。但是我們其實基本上對生物腦到底是怎么工作的一無所知。加州伯克利大學(xué)的Michael Jordan將深度學(xué)習(xí)稱作生物腦的「卡通版」,即一個對于我們并不了解的東西的大量過度簡化的版本,我同意這個看法。除了在媒體的炒作中,我們離真正造出人類級別的智能還沾不到邊呢。因為我們從根本上就不知道到底人腦是如何工作的,我們試圖盲目地在計算機上復(fù)刻我們根本不了解的東西并沒有造出有用的人工智能系統(tǒng)。相反的,當(dāng)今最有效的深度學(xué)習(xí)工作是基于計算機科學(xué)和工程原則逐漸發(fā)展起來的,最多也就從生物領(lǐng)域獲得了一點點靈感,而不是試圖盲目的抄襲生物。 具體來說,如果你聽到有人說「大腦可以做X。我的系統(tǒng)也做X。因此,我們在建造大腦的路上」,我的建議是立刻掉頭別理他。 很多深度學(xué)習(xí)使用的思路已經(jīng)存在了好幾十年了。為什么它現(xiàn)在才開始起飛呢? 兩個主要的推動因素是1)數(shù)據(jù)規(guī)模;2)計算規(guī)模。鑒于我們的社會在網(wǎng)絡(luò)和移動設(shè)備上花費了更多時間,在過去的20年里我們一直在快速地積攢數(shù)據(jù)。也是到了最近我們才搞清楚如何通過大量增加計算來建造可以利用這些海量數(shù)據(jù)的深度學(xué)習(xí)算法。 以上已經(jīng)將我們帶入了兩個加速深度學(xué)習(xí)進(jìn)程的正循環(huán): 首先,我們現(xiàn)在有可以吸收海量數(shù)據(jù)的機器了,數(shù)據(jù)的價值逐漸清晰。這給獲取更多數(shù)據(jù)帶來了更大的激勵,與此同時,更多的數(shù)據(jù)又激勵我們建造更大更快的神經(jīng)網(wǎng)絡(luò)。 其次,我們現(xiàn)在有高速的深度學(xué)習(xí)裝備,這可以加速創(chuàng)新,并且加速深度學(xué)習(xí)研究的進(jìn)度。很多人低估了在計算機系統(tǒng)上的投資對于深度學(xué)習(xí)的影響。當(dāng)進(jìn)行深度學(xué)習(xí)研究時,我們一開始對哪些算法有效、哪些沒效一無所知,并且我們的工作就是進(jìn)行一大堆實驗,并且搞清楚到底哪些有效哪些無效。如果我們有一個高效的計算基礎(chǔ)設(shè)施,可以讓你可以用一天完成本來需要一周的實驗,那么你的研究進(jìn)度將要有7倍那么快。 這就是為什么2008 年左右,我在斯坦福的團(tuán)隊開始支持將深度學(xué)習(xí)轉(zhuǎn)移到圖形處理單元(GPU)上(當(dāng)時這相當(dāng)?shù)木哂袪幾h;但是現(xiàn)在每個人都這么做);現(xiàn)在我支持轉(zhuǎn)移到高性能超級計算策略(HPC)來增量深度學(xué)習(xí)。機器學(xué)習(xí)應(yīng)該擁抱高性能計算。這些手段將使得研究者更高效,并且加速我們整個領(lǐng)域的進(jìn)程。 總結(jié)一下:深度學(xué)習(xí)已經(jīng)幫助人工智能取得了巨大的進(jìn)展。但最好的還在未來! 來源:機器學(xué)習(xí)之心。 |
|