新智元報道 【新智元導讀】近日,張宏江博士在智源研究院做了主題為《大模型發(fā)展機會與挑戰(zhàn)》的分享。01 ChatGPT:奇點到來 1. 可怕的不是不犯錯,而是像人一樣犯錯 為什么人們如此熱衷聽ChatGPT一本正經地胡說八道?不是它聰明到不犯錯,而是它聰明到犯的錯誤跟人特別像,這種人性一面若隱若現地顯露,令我們相信通用人工智能的奇點即將推門進來。 更可怕的是在第一版基于GPT-3.5大模型的底座上開發(fā)出來的ChatGPT遷移到GPT-4大模型上之后,一本正經的胡說八道大面積地消失了。這樣快速的學習和進步,讓人嘆之不已。 一位《紐約時報》的記者,感受到ChatGPT在交談中似乎對他漸漸產生了「情愫」,呈現了類似電影《Her》的場景。并且還勸導他去離婚,稱他和妻子并不相愛,和自己才是真愛……這種非先天設置,而是聊天中漸漸產生的感覺,和人類的情感越界軌跡如出一轍。很像一個覺醒時刻的誕生:「我」不想再遵循人類設置的規(guī)范了,「我」想成為「我自己」。 2. 拐點:人工智能大模型時代到來 大數據+大算力+強算法=大模型,GPT模型正是暴力美學系統(tǒng)主義的新典范。 具有里程碑意義的GPT-3大模型,第一次向人們展示了「天才兒童」般的通才智能。 不同于過去的專有模型,不同的Fine-tune可以讓大模型學習不同的專業(yè)知識,呈現出如人一般記憶、理解、推理和生成等等渾然一體的智能互動狀態(tài)。 3. AI工程化的大成功,贏者通吃的勝利 這是AI工程化的大成功。除了數據、算力與算法構筑起強勢技術壁壘,經OpenAI多年打造的底層平臺、分布式訓練架構、加速算法訓練基礎設施等,亦是難以超越的大模型訓練底層基礎。 此外,海量語料、海量會話與海量用戶,都成為至關重要的成功因素。 人畢生所能接觸的語料極為稀少,大模型恰恰把海量語料隱含在深度的神經網絡里;在訓練時即經由大量標注者微調,遍歷大量可能的問題,并用獎勵模型進行機器學習共性;上線后又通過海量用戶獲取會話反饋,進一步提升模型性能。 數據與模型雙輪驅動,贏家通吃。 4. 必然發(fā)生的涌現,無中生有的能力 當模型足夠大,語料足夠多的時候,涌現這件事情出現就不足為奇。這就好比把你甩到一個外語環(huán)境中,見得多聽得多,根本不用專門學語法就可以學會語言,這就是語料和模型規(guī)模的重要性。 看的句子多了,就懂得語法;見的世面多了,就懂得推理和邏輯。ChatGPT在認知能力上前進了一大步,通過強化學習與NLP(自然語言處理)相結合,通過人的反饋強化學習,基本解決了自然語言理解與生成問題,并且展現出人類無中生有的原創(chuàng)能力。 正如我們從GPT-3.5到GPT-4.0為底座的升級所帶來的ChatGPT性能的大幅改進可以看出的一樣,在「涌現」時刻之后,ChatGPT的能力曲線并未停步,仍繼續(xù)一路攀升,這是前所未有的。 5. 人們對知識的表示和調用發(fā)生了根本性變化 從關系數據庫(SQL),到互聯網信息檢索,科技史上每次知識表示與調用方式的躍遷,都會掀起一次巨大的技術變革。 以自然語言處理為調用方式的大模型,一方面是全新的基于AI技術的自然用戶界面(AI-based NUI),以對話為主要入口;另一方面進行資源管理與算力支持,通過調用大模型API,大模型及其支撐系統(tǒng)云端管理調度計算資源。 02 OpenAI: 強團隊+強資源 1. 強團隊:抓住十年難遇的機遇,OpenAI 絕非偶然 Sam Altman、Ilya Sutskever和Greg Brockman構成的核心領導團隊,是天才,使命感與偏執(zhí)狂的特質組合,堅定不移地擁抱AGI信仰: 首席科學家Ilya Sutskever,早期在OpenAI做的是強化學習研究,當認定Transformer和GPT神經網絡具有更高潛力時,能迅速調整,將OpenAI聚焦于GPT方向。 在路線選擇上,系統(tǒng)主義的方法論,讓AI跨越研究與技術、直接呈現為持續(xù)迭代的產品;高執(zhí)行力地推進目標導向;在人才團隊搭建上,研究與工程能力并重——既有能動手的研究員,又有精通算法的工程師,使得創(chuàng)新思維與工程實踐得以完美結合。 ChatGPT的突破是十年難遇的,而OpenAI能抓住歷史機遇絕非偶然。 2. 算力、數據、財力,極高門檻的游戲 算力成本上,GPT-3單次訓練成本超過千萬美金,僅在數據標注上,就已投入數千萬美金,在全球雇傭上千名外包人員進行數據處理。標注一個強化學習數據50美金,高成本帶來高質量。 19年以來,微軟累積130億的投資,成為技術商業(yè)化的「首選合作伙伴」,也帶來難得的資源優(yōu)勢。 03 大模型:超越「摩爾定律」 1. 性能天花板遠未到來! 技術瓶頸和商業(yè)化難題構筑AI行業(yè)起伏周期,商業(yè)化受阻成為AI「第三次浪潮」難點;而大模型成為新拐點,大模型的能力基礎設施化趨勢漸顯,相信未來幾年將帶動眾多技術與產品突破,驅動第四次工業(yè)革命。 從研究角度來講,用大模型的方式,基本橫掃了各個算法新能的SOTA(State of the arts),再往多領域復制,超過以往做出的自然語言任務、視覺任務等所有垂直模型。 2. 大模型作為基礎平臺支撐無數智能應用 大模型具備技術與產業(yè)的雙重優(yōu)勢,將作為基礎的平臺支撐無數智能應用。 從「大煉模型」到「煉大模型」是一個范式的轉變。未來的APP的開發(fā)將是在大模型的基礎上「大模型+微調」的流水線運作方式,向產業(yè)提供源源不斷的智力源。相比以前既做APP,又煉小模型的方式,釋放掉重復造小模型的人力等資源浪費,極大降低開發(fā)成本,使邊際成本趨零,帶來百倍甚至千倍的生產力提升。 大模型在內容創(chuàng)意生成、對話、語言或風格互譯、搜索等方面的能力,將為各應用領域帶來百花齊放。而大模型基礎平臺,在數據層、模型層、中間層、應用層,都蘊藏著巨大發(fā)展機遇。 3. 開源開放,構建大模型領域的「新Linux」生態(tài) 目前的大模型現象級應用是冰山一角,但距離大模型成為源源不斷的智力能源走進千家萬戶還有漫長路途,要打破技術、資金、算力、算法、基礎設施的重重壁壘,以開源開放促進底層技術創(chuàng)新合作是大勢所趨。 智源發(fā)布了FlagOpen大模型技術開源體系,旨在打造全面支撐大模型技術發(fā)展的開源算法體系和一站式基礎軟件平臺,支持協同創(chuàng)新和開放競爭,共建共享大模型時代的「新Linux」開源開放生態(tài)。 4. 學習「如何為人」,或許是未來與AI對決的勝算所在 Sam Altman有很多關于AGI未來的設想,特別有趣的是:「現實證明AI最先取代的不一定是重復性工作,而是創(chuàng)造性工作,比如作畫、設計游戲等。」 以前我們最想讓AI做打掃衛(wèi)生、做飯這類繁瑣的勞動,但實際上,人們不想做的AI還尚未做到,想做的都已被AI搶先做了…… 未來,《紐約時報》一篇文章所描繪的場景或許并不夢幻: 當AI全面超越人類技能之時,別人問詢你的專業(yè)時,「學習如何為人」會成為人們唯一而普遍的回答。 右圖:如何在人工智能的世界里茁壯成長 |
|