一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

OpenAI內(nèi)斗時,Karpathy在錄視頻:《大型語言模型入門》上線

 天承辦公室 2023-11-25 發(fā)布于北京

機(jī)器之心報(bào)道

編輯:杜偉

趕緊學(xué)習(xí)起來吧!

OpenAI 的風(fēng)波暫時告一段落,員工也忙著「干活了」。

年初回歸 OpenAI 的 Andrej Karpathy 最近做了一場關(guān)于大型語言模型(LLM)的 30 分鐘入門講座,但該講座當(dāng)時沒錄制。因此,他基于這場講座重新錄制了一個長達(dá) 1 小時的視頻,希望讓更多人看到和學(xué)習(xí)。

視頻的主題為《大型語言模型入門》,涵蓋了 LLM 的推理、訓(xùn)練、微調(diào)以及新出現(xiàn)的 LLM 操作系統(tǒng)和 LLM 安全。視頻主打「非技術(shù)性」,偏科普,所以更加容易理解。

圖片

想要了解更詳細(xì)內(nèi)容,大家可觀看原視頻。

我們接下來整體了解一下 Karpathy 都講到了哪些內(nèi)容。視頻主要分為三大部分展開,分別是 LLMs、LLMs 的未來和 LLM 安全。

在第一部分,Karpathy 首先介紹了 LLM 的一些入門知識,并以 Meta 推出的開源大模型 Llama 2-70b 為例講解。該模型有 700 億參數(shù),它主要包含兩個文件,分別是參數(shù)文件(文件大小為 140GB)和運(yùn)行這些參數(shù)的代碼(以 C 語言為例需要約 500 行代碼)。

因此,在 LLM 推理階段,Karpathy 表示只要有這兩個文件再加上一臺 MacBook,我們就可以構(gòu)建一個獨(dú)立的系統(tǒng),無需聯(lián)網(wǎng)或其他設(shè)施。這里他展示了跑 70 億參數(shù)大模型的例子。

圖片

LLM 訓(xùn)練比推理復(fù)雜得多。Karpathy 表示,模型推理可以在一臺 MacBook 上運(yùn)行,但模型訓(xùn)練過程耗費(fèi)的計(jì)算量就非常大了。因此,我們需要對互聯(lián)網(wǎng)內(nèi)容進(jìn)行壓縮。他以 Llama 2-70b 為例來說明,訓(xùn)練該模型需要從網(wǎng)絡(luò)爬取約 10TB 的文本,大約需要 6000 個 GPU 訓(xùn)練約 12 天,耗資 200 萬美元,參數(shù)文件大小約為 140GB。

顯然 Llama 2-70b 并不是最大的,如果訓(xùn)練 ChatGPT、Claude 或 Bard,這些數(shù)字可能會增加 10 倍或者更多,耗資可能高達(dá)千萬甚至上億美元。

圖片

不過,一旦擁有了這些參數(shù),運(yùn)行神經(jīng)網(wǎng)絡(luò)的計(jì)算成本就相對較低了。Karpathy 解釋了什么是神經(jīng)網(wǎng)絡(luò),它的基本任務(wù)是預(yù)測序列中的下一個單詞。他將訓(xùn)練過程視為一種互聯(lián)網(wǎng)的壓縮,如果可以準(zhǔn)確地預(yù)測下一個單詞,則能夠用來壓縮數(shù)據(jù)集。

圖片

神經(jīng)網(wǎng)絡(luò)是如何預(yù)測下一個單詞的呢?Karpathy 介紹稱,正如以下 Transformer 神經(jīng)網(wǎng)絡(luò)架構(gòu)示意圖,1000 億參數(shù)分布在整個神經(jīng)網(wǎng)絡(luò)中。這就需要迭代地調(diào)整這些參數(shù),使網(wǎng)絡(luò)作為一個整體來更好地執(zhí)行預(yù)測下一個單詞的任務(wù)。

圖片

上面這些是訓(xùn)練的第一階段,稱為預(yù)訓(xùn)練,顯然還不足以訓(xùn)練出一個真正的助理模型。這就要進(jìn)入微調(diào)階段。預(yù)訓(xùn)練階段需要大量來自互聯(lián)網(wǎng)的文本數(shù)據(jù),這些數(shù)據(jù)可能質(zhì)量不高。但微調(diào)階段看重?cái)?shù)據(jù)的質(zhì)量而非數(shù)量,比如需要非常高質(zhì)量的對話文檔。

圖片

Karpathy 總結(jié)了如何訓(xùn)練自己的 ChatGPT。預(yù)訓(xùn)練階段獲得基礎(chǔ)模型,微調(diào)階段則需要編寫標(biāo)簽指令、雇人收集高質(zhì)量的 QA 響應(yīng)、對基礎(chǔ)模型進(jìn)一步微調(diào)、進(jìn)行大量評估以及部署等步驟。

圖片

第二部分講的是 LLMs 的未來,包括 LLM 縮放法則、工具使用、多模態(tài)、思考及 System 1/2、自我改進(jìn)及 LLM AlphaGo、LLM 定制、GPTs Store 以及 LLM 操作系統(tǒng)等。

所謂 LLM 縮放法則,即 LLM 的性能可以表示為非常平滑、表現(xiàn)良好且可以預(yù)測的兩個變量函數(shù),分別是網(wǎng)絡(luò)中的參數(shù)量(N)和要訓(xùn)練的文本量(D)。我們可以根據(jù)這兩個變量通過縮放來預(yù)測下一個單詞預(yù)測任務(wù)中的準(zhǔn)確率。

圖片

至于工具使用,Karpathy 提到了瀏覽器、計(jì)算器、解釋器和 DALL-E。這里著重講一下 DALL-E,它是 OpenAI 開發(fā)的文生圖工具。目前,最新版本 DALL-E 3 已經(jīng)集成到了 ChatGPT 中,可以輸入自然語言描述來生成圖像。

圖片

多模態(tài)也是近來領(lǐng)域關(guān)注的重點(diǎn),比如視覺、音頻等。在視覺領(lǐng)域,大模型不僅可以生成圖像,還可以看到(See)圖像。Karpathy 提到了 OpenAI 聯(lián)合創(chuàng)始人 Greg Brockman 的一個演示,后者向 ChatGPT 展示了一張 MyJoke 網(wǎng)站的手寫小圖。結(jié)果 ChatGPT 看明白了這張圖,并創(chuàng)建一個 MyJoke 網(wǎng)站。我們可以訪問這個網(wǎng)站,還可以看到笑話。

圖片

在談到 LLM 的未來發(fā)展時,Karpathy 提到了 System 1 和 System 2 的思維模式。System 1 是快速、本能和自動的思維過程,System 2 則是有意識、有思考的思維過程?,F(xiàn)在,人們希望為 LLM 引入更多類似 Sytem 2 的思維能力。此外 LLM 的自我改進(jìn)也是需要關(guān)注的重點(diǎn)問題之一。

圖片

LLMs 的定制化更是近來的熱點(diǎn)。OpenAI CEO Sam Altman 在開發(fā)者日上宣布推出的 GPTs 商店走出了模型定制化的第一步。用戶可以創(chuàng)建自己的 GPT,根據(jù)需求進(jìn)行定制,或者添加更多知識。未來對 LLM 進(jìn)行微調(diào)和定制的可能性越來越大。

圖片

至于 LLM 操作系統(tǒng),與當(dāng)前的傳統(tǒng)操作系統(tǒng)有很多相似之處。在未來幾年,LLM 可以閱讀和生成文本,擁有比任何個人都豐富的知識,瀏覽互聯(lián)網(wǎng),使用現(xiàn)有軟件基礎(chǔ)架構(gòu),具備查看和生成圖像、視頻的能力,聽到、發(fā)出并創(chuàng)作音樂,利用 System 2 進(jìn)行深入思考,能夠自我改進(jìn),針對特有任務(wù)微調(diào)和定制,等等。

圖片

第三部分是 LLM 安全性。Karpathy 講了越獄(Jailbreak)、提示注入(Prompt injection)、數(shù)據(jù)投毒或后門攻擊(Data poisoning or Backdoor atteck)等三種攻擊方式。

圖片

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    99热九九在线中文字幕| 亚洲精品成人午夜久久| 日韩人妻毛片中文字幕| 久久福利视频在线观看| 精品人妻一区二区三区免费看| 国产精品一区二区视频大全| 亚洲国产天堂av成人在线播放 | 中文日韩精品视频在线| 国产成人在线一区二区三区| 国产肥妇一区二区熟女精品| 亚洲国产天堂av成人在线播放| 在线观看视频日韩成人| 一区二区三区亚洲国产| 国产不卡视频一区在线| 国产又黄又猛又粗又爽的片| 国产精品福利精品福利| 97人妻精品一区二区三区免| 亚洲熟妇熟女久久精品 | 国产精品二区三区免费播放心| 日本一品道在线免费观看| 91在线播放在线播放观看| 国产精品久久久久久久久久久痴汉| 五月综合婷婷在线伊人| 丝袜破了有美女肉体免费观看| 亚洲国产成人一区二区在线观看| 国产永久免费高清在线精品| 真实偷拍一区二区免费视频| 熟女体下毛荫荫黑森林自拍| 国产成人在线一区二区三区| 日韩一级一片内射视频4k| 国产精品欧美日韩中文字幕| 国产不卡在线免费观看视频| 色婷婷国产精品视频一区二区保健| 日韩少妇人妻中文字幕| 欧美一区二区日韩一区二区| 国产视频一区二区三区四区| 国内自拍偷拍福利视频| 91精品国产综合久久精品| 亚洲高清欧美中文字幕| 午夜精品国产精品久久久| 亚洲精品一区二区三区免|