一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

張宏江:大模型發(fā)展機會與挑戰(zhàn)

 天承辦公室 2023-03-20 發(fā)布于江蘇


  新智元報道  

來源:智源研究院
編輯:好困
【新智元導讀】近日,張宏江博士在智源研究院做了主題為《大模型發(fā)展機會與挑戰(zhàn)》的分享。

本文對張宏江博士的演講內容,進行了不改變原意的摘錄與編輯。

01 ChatGPT:奇點到來


1. 可怕的不是不犯錯,而是像人一樣犯錯

為什么人們如此熱衷聽ChatGPT一本正經地胡說八道?不是它聰明到不犯錯,而是它聰明到犯的錯誤跟人特別像,這種人性一面若隱若現地顯露,令我們相信通用人工智能的奇點即將推門進來。

更可怕的是在第一版基于GPT-3.5大模型的底座上開發(fā)出來的ChatGPT遷移到GPT-4大模型上之后,一本正經的胡說八道大面積地消失了。這樣快速的學習和進步,讓人嘆之不已。

一位《紐約時報》的記者,感受到ChatGPT在交談中似乎對他漸漸產生了「情愫」,呈現了類似電影《Her》的場景。并且還勸導他去離婚,稱他和妻子并不相愛,和自己才是真愛……這種非先天設置,而是聊天中漸漸產生的感覺,和人類的情感越界軌跡如出一轍。很像一個覺醒時刻的誕生:「我」不想再遵循人類設置的規(guī)范了,「我」想成為「我自己」。

2. 拐點:人工智能大模型時代到來

大數據+大算力+強算法=大模型,GPT模型正是暴力美學系統(tǒng)主義的新典范。

具有里程碑意義的GPT-3大模型,第一次向人們展示了「天才兒童」般的通才智能。

不同于過去的專有模型,不同的Fine-tune可以讓大模型學習不同的專業(yè)知識,呈現出如人一般記憶、理解、推理和生成等等渾然一體的智能互動狀態(tài)。

3. AI工程化的大成功,贏者通吃的勝利

這是AI工程化的大成功。除了數據、算力與算法構筑起強勢技術壁壘,經OpenAI多年打造的底層平臺、分布式訓練架構、加速算法訓練基礎設施等,亦是難以超越的大模型訓練底層基礎。

此外,海量語料、海量會話與海量用戶,都成為至關重要的成功因素。

人畢生所能接觸的語料極為稀少,大模型恰恰把海量語料隱含在深度的神經網絡里;在訓練時即經由大量標注者微調,遍歷大量可能的問題,并用獎勵模型進行機器學習共性;上線后又通過海量用戶獲取會話反饋,進一步提升模型性能。

數據與模型雙輪驅動,贏家通吃。

4. 必然發(fā)生的涌現,無中生有的能力

當模型足夠大,語料足夠多的時候,涌現這件事情出現就不足為奇。這就好比把你甩到一個外語環(huán)境中,見得多聽得多,根本不用專門學語法就可以學會語言,這就是語料和模型規(guī)模的重要性。

看的句子多了,就懂得語法;見的世面多了,就懂得推理和邏輯。ChatGPT在認知能力上前進了一大步,通過強化學習與NLP(自然語言處理)相結合,通過人的反饋強化學習,基本解決了自然語言理解與生成問題,并且展現出人類無中生有的原創(chuàng)能力。

正如我們從GPT-3.5到GPT-4.0為底座的升級所帶來的ChatGPT性能的大幅改進可以看出的一樣,在「涌現」時刻之后,ChatGPT的能力曲線并未停步,仍繼續(xù)一路攀升,這是前所未有的。

5. 人們對知識的表示和調用發(fā)生了根本性變化

從關系數據庫(SQL),到互聯網信息檢索,科技史上每次知識表示與調用方式的躍遷,都會掀起一次巨大的技術變革。

以自然語言處理為調用方式的大模型,一方面是全新的基于AI技術的自然用戶界面(AI-based NUI),以對話為主要入口;另一方面進行資源管理與算力支持,通過調用大模型API,大模型及其支撐系統(tǒng)云端管理調度計算資源。

02 OpenAI: 強團隊+強資源


1. 強團隊:抓住十年難遇的機遇,OpenAI 絕非偶然

Sam Altman、Ilya Sutskever和Greg Brockman構成的核心領導團隊,是天才,使命感與偏執(zhí)狂的特質組合,堅定不移地擁抱AGI信仰:

首席科學家Ilya Sutskever,早期在OpenAI做的是強化學習研究,當認定Transformer和GPT神經網絡具有更高潛力時,能迅速調整,將OpenAI聚焦于GPT方向。

在路線選擇上,系統(tǒng)主義的方法論,讓AI跨越研究與技術、直接呈現為持續(xù)迭代的產品;高執(zhí)行力地推進目標導向;在人才團隊搭建上,研究與工程能力并重——既有能動手的研究員,又有精通算法的工程師,使得創(chuàng)新思維與工程實踐得以完美結合。

ChatGPT的突破是十年難遇的,而OpenAI能抓住歷史機遇絕非偶然。

2. 算力、數據、財力,極高門檻的游戲

算力成本上,GPT-3單次訓練成本超過千萬美金,僅在數據標注上,就已投入數千萬美金,在全球雇傭上千名外包人員進行數據處理。標注一個強化學習數據50美金,高成本帶來高質量。

19年以來,微軟累積130億的投資,成為技術商業(yè)化的「首選合作伙伴」,也帶來難得的資源優(yōu)勢。

03 大模型:超越「摩爾定律」


1. 性能天花板遠未到來!

技術瓶頸和商業(yè)化難題構筑AI行業(yè)起伏周期,商業(yè)化受阻成為AI「第三次浪潮」難點;而大模型成為新拐點,大模型的能力基礎設施化趨勢漸顯,相信未來幾年將帶動眾多技術與產品突破,驅動第四次工業(yè)革命。

從研究角度來講,用大模型的方式,基本橫掃了各個算法新能的SOTA(State of the arts),再往多領域復制,超過以往做出的自然語言任務、視覺任務等所有垂直模型。

2. 大模型作為基礎平臺支撐無數智能應用

大模型具備技術與產業(yè)的雙重優(yōu)勢,將作為基礎的平臺支撐無數智能應用。

從「大煉模型」到「煉大模型」是一個范式的轉變。未來的APP的開發(fā)將是在大模型的基礎上「大模型+微調」的流水線運作方式,向產業(yè)提供源源不斷的智力源。相比以前既做APP,又煉小模型的方式,釋放掉重復造小模型的人力等資源浪費,極大降低開發(fā)成本,使邊際成本趨零,帶來百倍甚至千倍的生產力提升。

大模型在內容創(chuàng)意生成、對話、語言或風格互譯、搜索等方面的能力,將為各應用領域帶來百花齊放。而大模型基礎平臺,在數據層、模型層、中間層、應用層,都蘊藏著巨大發(fā)展機遇。

3. 開源開放,構建大模型領域的「新Linux」生態(tài)

目前的大模型現象級應用是冰山一角,但距離大模型成為源源不斷的智力能源走進千家萬戶還有漫長路途,要打破技術、資金、算力、算法、基礎設施的重重壁壘,以開源開放促進底層技術創(chuàng)新合作是大勢所趨。

智源發(fā)布了FlagOpen大模型技術開源體系,旨在打造全面支撐大模型技術發(fā)展的開源算法體系和一站式基礎軟件平臺,支持協同創(chuàng)新和開放競爭,共建共享大模型時代的「新Linux」開源開放生態(tài)。

4. 學習「如何為人」,或許是未來與AI對決的勝算所在

Sam Altman有很多關于AGI未來的設想,特別有趣的是:「現實證明AI最先取代的不一定是重復性工作,而是創(chuàng)造性工作,比如作畫、設計游戲等。」

以前我們最想讓AI做打掃衛(wèi)生、做飯這類繁瑣的勞動,但實際上,人們不想做的AI還尚未做到,想做的都已被AI搶先做了……

未來,《紐約時報》一篇文章所描繪的場景或許并不夢幻:

當AI全面超越人類技能之時,別人問詢你的專業(yè)時,「學習如何為人」會成為人們唯一而普遍的回答。

圖片
左圖:人類被鉤住了,機器在學習

右圖:如何在人工智能的世界里茁壯成長


    本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯系方式、誘導購買等信息,謹防詐騙。如發(fā)現有害或侵權內容,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    在线欧洲免费无线码二区免费| 国产一区二区三区草莓av| 中文字幕一二区在线观看| 成人精品一区二区三区在线| 亚洲天堂有码中文字幕视频| 久久精品伊人一区二区| 国产内射在线激情一区| 中文字幕免费观看亚洲视频 | 老司机激情五月天在线不卡 | 深夜视频成人在线观看| 制服丝袜美腿美女一区二区| 91国内视频一区二区三区| 九九热在线视频观看最新| 国产三级视频不卡在线观看| 在线观看免费午夜福利| 国产福利一区二区三区四区| av一区二区三区天堂| 国产精品伦一区二区三区在线| 人妻精品一区二区三区视频免精| 成人欧美一区二区三区视频| 经典欧美熟女激情综合网| 国产又粗又猛又大爽又黄| 欧美日韩国产综合特黄| 日本av一区二区不卡| 国产又爽又猛又粗又色对黄| 好吊色免费在线观看视频| 九九热精彩视频在线播放| 中文字幕91在线观看| 视频在线播放你懂的一区| 久久99热成人网不卡| 亚洲欧美日韩国产综合在线| 国产精品午夜视频免费观看| 日韩精品综合福利在线观看| 国产超薄黑色肉色丝袜| 欧美在线视频一区观看| 国产精品免费福利在线| 风间中文字幕亚洲一区| 国产精品久久男人的天堂| 国产免费观看一区二区| 男人把女人操得嗷嗷叫| 九九热精品视频在线观看|