今年5月1日國際勞動節(jié)當(dāng)天, 第一波AI失業(yè)潮到來, 科技巨頭IBM公司宣布暫停7800人的招聘, 稱這些崗位的工作將由AI取代, 此前3月底,高盛集團(tuán)發(fā)布報告, 預(yù)計全球?qū)⒂?億工作崗位會被生成式AI取代, 其中律師和行政人員受影響最大。 ▲ AI生成美女圖,以假亂真 ▲ AI超現(xiàn)實創(chuàng)作:上班族在地鐵里看金魚、瓜農(nóng)川普 在中文網(wǎng)站,因為ChatGPT和Midjourney, 也陸續(xù)出現(xiàn)了第一批失業(yè)的設(shè)計師和文案編輯。 未來3-5年,什么樣的工作會被AI取代? 哪些行業(yè)是相對安全的? 如果想要成為AI工程師,需要什么樣的能力? 以及文科生可以轉(zhuǎn)AI嗎? 一條采訪了復(fù)旦大學(xué)人工智能專家張軍平教授, 針對以上問題做了解答。 自述:張軍平 編輯:劉亞萌 ▲ 張軍平教授行走在復(fù)旦校園里 ChatGPT-4的出現(xiàn)是令人震驚的,我們做AI研究的,知道遲早會有這么個東西出來,不過沒想到這么快,以及跑出來的性能這么好。 3月份以來,我朋友圈里很多人都在曬ChatGPT-4的聊天截圖,非??駸?。再加上Midjourney V5一起,大家都很擔(dān)心,自己的工作會不會被AI取代? ▲ 人機(jī)共存場景 一條編輯部經(jīng)由Midjourney生成 這個擔(dān)憂是合理的。 ChatGPT-4最令人驚艷的一點,是它的“涌現(xiàn)功能”,就是當(dāng)它訓(xùn)練的數(shù)據(jù)量足夠大的時候,這個復(fù)雜的系統(tǒng),就誕生了其各組成部分所沒有的屬性——接近人類的“思維模式”和“智力表現(xiàn)”。 里面有個思維鏈,幫助ChatGPT-4去“鏈?zhǔn)剿伎肌?。就像我們有時候做作業(yè),到了某個節(jié)點,做不出來,然后家長說“你再想一想”,其實也沒說什么,但是這個學(xué)生就覺得我可能還有一些東西沒掌握,通過慢慢想和一點點的引導(dǎo),就突然把一個正確答案得出來了。 所以你在對話框里,讓ChatGPT-4 “再想想”,它也會再給你一個改進(jìn)過的答案,大家就會覺得很驚訝。 因為AI對生產(chǎn)效率的提高,一個優(yōu)秀的人才可以做很多工作,由一小部分人運營一個大市值公司的現(xiàn)象,以后可能會越來越多。你看Midjourney就是個典型,員工只有11人,但是年營收1億美金。 ▲ AI生成“失火”的白領(lǐng)工位 細(xì)看來,未來3-5年內(nèi)容易被取代的工作,有兩個標(biāo)準(zhǔn):腦力工作和簡單易重復(fù)。確實白領(lǐng)受影響比較大。 筆譯和客服已經(jīng)被替代得差不多了。 我自己的生活里,現(xiàn)在接快遞電話,好多是機(jī)器人。國內(nèi)科研工作者寫論文要翻譯成英文,以往可能要找國外的母語翻譯者,以后說不定可以嘗試ChatGPT-4翻譯,它速度快,把領(lǐng)域內(nèi)的專有名詞限定下,應(yīng)該會很不錯。 ▲ Office365里嵌入ChatGPT,能自動生成簡報、表格 接下來最危險的是辦公室文員、人力資源,還有做財務(wù)報表的。微軟Office365已經(jīng)把ChatGPT嵌入到Word、PPT和 Excel里了,可以自動生成簡報、PPT和表格,你以往費心學(xué)習(xí)的這些Office技能價值就下降了。 有個段子說“財務(wù)不會被AI替代,因為它不能做替罪羊”,雖然有點道理,但生產(chǎn)效率提高了,意味著公司對財務(wù)的人才需求壓縮,你的就業(yè)空間就變小。 另外還有律師行業(yè)。我們知道律師很重要的一塊工作是熟練法條和查找以往的案例,查找的過程是非常耗時間的,律所里應(yīng)該專門有一部分人做這塊工作。 換成AI的話,它把所有的案例都收過來,ChatGPT用對話的方式給你,速度非???,那么以前做這部分工作的律師,就不再需要了。 ▲ 程序員們在工作 一條編輯部經(jīng)由Midjourney 生成 ChatGPT-4也會生成代碼的,部分程序員會受到影響,尤其是前端。因為前端設(shè)計比較模塊化,并沒有涉及到很復(fù)雜的計算。OpenAI有個演示,就是在紙上畫個草圖,然后ChatGPT-4就給你跑出來了一個網(wǎng)頁。 從公司的角度,有可能以后會更加傾向于ChatGPT寫代碼。因為每個人寫代碼的風(fēng)格是不一樣的,一個員工走了,新員工過來,因為不順手,可能要重寫代碼。那么ChatGPT的一致性會更好,從公司的角度來說,更加有效率。 ▲ AI生成的風(fēng)格插畫 受Midjourney影響的插畫師、設(shè)計師,我網(wǎng)上看到有些人已經(jīng)被裁員。你人完成一副插畫可能要花2天時間,機(jī)器幾分鐘就出來了,效果還很好,這在迫使大家去做更具有創(chuàng)新性的工作。 一個有意思的現(xiàn)象是,一部分AI研究者自己的工作,都被AI干掉了。 據(jù)說現(xiàn)在美國一些大學(xué),在自然語言處理、計算機(jī)視覺和語音識別方向的教職,不再增加了。 然后我們就討論是為什么?以往科研院校,3-5年會出些成果,細(xì)細(xì)碎碎的需要那么些人去做,但是ChatGPT-4出來之后,它把很多問題都解決了,剩下都是一些非常難啃的硬骨頭,那么你是不需要那么多教職去做的,就導(dǎo)致一些崗位被減掉。 ▲ 制作漆器的手工藝人 首先,跟實體相關(guān)的工作,比如醫(yī)生、護(hù)工、駕駛員,還有小眾手工藝者,比如做古琴的、做陶瓷的藝術(shù)家,都是依賴個人經(jīng)驗來做的,被AI替代的概率較小。 因為一直以來AI大多在做認(rèn)知相關(guān)的任務(wù),感知這塊下的功夫少,現(xiàn)階段跟實體相關(guān)的都做不好,與人類相比,機(jī)械手比較初級,擰一個瓶蓋還是很難的事情。 就連打掃衛(wèi)生,對我們?nèi)祟悂碚f是“簡單易重復(fù)”,但對機(jī)器卻是一個模糊的概念,沒有辦法程序化或形式化。 那么對于白領(lǐng)工作,還有一部分比較安全,就是大數(shù)據(jù)進(jìn)入不了的行業(yè)。 ▲ 《滾蛋吧,腫瘤君》劇照 我們想想ChatGPT是怎么起來的?它的數(shù)據(jù)都是Billion級的,就是10億級以上,這就意味著這么多數(shù)據(jù),很有可能都是不設(shè)隱私的,才能被它調(diào)用。 如果一個行業(yè)涉及到隱私,數(shù)據(jù)不能公開,不能上模型訓(xùn)練,那么AI就擠不進(jìn)去。比如說醫(yī)療、銀行、生物等領(lǐng)域,相對來說是安全的。 所以我的一些學(xué)生,他們就不在互聯(lián)網(wǎng)公司找工作了,而是會去一些數(shù)據(jù)相對封閉的領(lǐng)域,穩(wěn)定一些。 如果高中生選專業(yè),只考慮就業(yè)前景的話,我覺得人工智能方向目前還是最好的,所謂“不入虎穴焉得虎子”。 我們有個新名詞叫做 AI for Science,用人工智能幫助科學(xué)發(fā)展,以后各行各業(yè)都需要AI的輔助,要由懂AI方向的人來操作,那么就會有一個非常大的人才缺口。 ▲ AI研究員 一條編輯部經(jīng)由Midjourney 生成 一個好的AI研究者或工程師,需要三個基本素質(zhì):數(shù)學(xué)基礎(chǔ)、編程能力、英文。學(xué)英文是因為要跟蹤國際最前沿的技術(shù),讀文獻(xiàn)資料,然后對編程能力的要求,要比數(shù)學(xué)高一些。 現(xiàn)在不像以前那樣需要了解特別深的人工智能知識,如果你是計算機(jī)或其他理工科專業(yè),轉(zhuǎn)AI的話門檻并沒有那么高。 首先,現(xiàn)在的研究大部分是模塊化,深度網(wǎng)絡(luò)都是一些模型,就像積木一樣在搭。算法方面,在ArXiv上你能夠快速知道最新的算法是什么樣子,代碼呢本身就有很多網(wǎng)站,比如Github上的代碼是共享的。這三點,就使得你現(xiàn)在進(jìn)入這個行業(yè)是比較容易的。 文科生也有機(jī)會轉(zhuǎn)AI的,我們復(fù)旦有中文系的學(xué)生,轉(zhuǎn)到我們做自然語言處理的這個組,做得還挺好的。 ▲ 機(jī)器人與女孩一起在農(nóng)場工作 一條編輯部經(jīng)由Midjourney 生成 首先,我們確實需要追趕,不追不行,要不然就會被卡脖子。 據(jù)說GPT5已經(jīng)訓(xùn)練完了,那我們什么時候能追上國外的?目前有兩派,一派是樂觀派,覺得問題不大,2-3個月能追上。另一派是悲觀派,覺得需要1年至1年半。 可能你覺得1年時間不算太久,其實這里面有些麻煩的地方。 目前AI主流的發(fā)展路徑是三大塊:模型、算力、大數(shù)據(jù)。 樂觀的地方是,模型框架前輩們都做好了,幾乎是公開的,研究人員把它做大、做深就行了。 ▲ 深度學(xué)習(xí)之父Geoffrey Hinton 2006年Geoffrey Hinton就提出來了深度學(xué)習(xí)模型,之后有一個圖像分類競賽上采用了大規(guī)模數(shù)據(jù)集ImageNet,2012年Geoffrey Hinton就帶著他的學(xué)生為這個競賽做了新的深度學(xué)習(xí)模型,一下子就令人震驚了,比上一屆冠軍性能提升了將近10個百分點。 這是什么概念呢?如果你是用傳統(tǒng)機(jī)器學(xué)習(xí)方法來做,每年就提高0.3-0.4個百分點。這意味著,深度學(xué)習(xí)的方法比傳統(tǒng)機(jī)器學(xué)習(xí)方法,加快了 20年左右。所以那時候,大家都轉(zhuǎn)到做深度學(xué)習(xí)模型。 但是深度學(xué)習(xí)模型,是需要強(qiáng)大的算力的,在特定的GPU芯片上面跑。 據(jù)說ChatGPT有1萬塊A100的GPU做支撐,單塊A100的售價在1萬美元左右,光是GPU成本就是1億美元(約合6億人民幣),這就是為什么OpenAI不到100人的小公司,微軟投資了20億美元上去的原因之一。所以大模型,幾乎只能由大公司、大機(jī)構(gòu)來做。 但是我們國家,目前在算力上有瓶頸,因為2022年12月份,美國對中國禁售了A100以上的GPU。這樣國內(nèi)沒法用A100(有替代品,但通訊模塊受限),但國外還能用比A100更好的卡,這就有點麻煩了。 現(xiàn)在我們做研究成本很高,也是因為GPU,以往你發(fā)文章只需要時間和人力成本,但是現(xiàn)在一篇論文的成本說不定在10萬人民幣左右。 再一個就是大數(shù)據(jù),中文語料庫推不上去。 ChatGPT有10億級以上的數(shù)據(jù)做預(yù)訓(xùn)練,它都是英文的,但是我們中文的每個平臺,都設(shè)了一個進(jìn)入的門檻,防止你大范圍搜索,另外還有格式的問題,這就導(dǎo)致我們堆數(shù)據(jù),沒有國外那么方便。 而且ChatGPT-2之后就沒有開源了,你也不知道確切的差距到底在哪里。 現(xiàn)在國內(nèi)的AI投資很火,資本層面的驅(qū)動還是蠻重要的。而且我們復(fù)旦前段時間發(fā)布了一個Moss系統(tǒng),還開源了,相對來講還是一個比較小的模型,大家都還是在努力的。 ▲ 上海街頭的機(jī)器人 一條編輯部經(jīng)由Midjourney 生成 從歷史上來講,人工智能不到90年,我們一般認(rèn)為它的開端,是1936年的圖靈機(jī),期間一直經(jīng)歷漲跌的過程。 七八十年代它經(jīng)歷第一次寒冬,當(dāng)時如果你說自己是做人工智能的,是拿不到項目的。在90年代初,又經(jīng)歷了第二次寒冬。 我自己是從小喜歡看科幻小說,接觸AI是在1997年,當(dāng)時更流行叫自己是做機(jī)器學(xué)習(xí)而非人工智能的。 我的感受是到了2012年,也就是Geoffrey Hinton帶著學(xué)生贏得了競賽那一年,人工智能才真正迎來騰飛。 ▲ 2016年AlphaGo對弈韓國圍棋手李世石 到了2016年AlphaGo贏了李世石,然后2017年谷歌研究出了Transformer網(wǎng)絡(luò),這之后才有了ChatGPT的一系列工作,還有自動駕駛、AI金融、AI醫(yī)療等各個領(lǐng)域都在前進(jìn)。 但其實到2022年,AI行業(yè)有點往下走的趨勢了,因為大家覺得該做的都做了,并沒有看到很好的應(yīng)用,很明顯的是有些大公司的深度學(xué)習(xí)這塊,已經(jīng)在裁員了。但突然今年3月一下子ChatGPT-4出來了,就又把大家都拉了回來。 所以它有興盛期,也有衰敗期。我自己在這個領(lǐng)域待久了,對于ChatGPT-4掀起的熱潮看得比較冷靜一些吧。AI的研究范圍是很寬泛的,很多問題很難,難以在短時間內(nèi)變現(xiàn),人類對智能的理解還有很長的路要走。 作為一名研究者,樂趣還是在于探索未知,你在未知里面可以找到一點點進(jìn)步,那個愉悅感就很令人滿足了。 |
|
來自: 王兆善 > 《人工智能技術(shù)》