一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

AI進(jìn)化太快,我要學(xué)不動(dòng)了。。。

 黃爸爸好 2023-05-31 發(fā)布于上海

大家好,我是 Jack。

AI 領(lǐng)域的技術(shù),真是隔一段時(shí)間就有一個(gè)新突破!

全民都能訓(xùn)練大模型的時(shí)代,指日可待了!

LoRA

在講解新突破之前,先簡單科普下 LoRA。

LoRA,英文全稱 Low-Rank Adaptation of Large Language Models,直譯為大語言模型的低階適應(yīng),這是微軟的研究人員為了解決大語言模型微調(diào)而開發(fā)的一項(xiàng)技術(shù)。

后來,LoRA 不僅被應(yīng)用于大語言模型,還適配應(yīng)用到了 Stable Diffusion。

LoRA 的使用,大幅節(jié)省了微調(diào)的成本。比如 GPT-3 有 1750 億參數(shù),為了讓它能干特定領(lǐng)域的活兒,需要做微調(diào),但是如果直接對 GPT-3 做微調(diào),成本太高太麻煩了。

LoRA 的做法是,凍結(jié)預(yù)訓(xùn)練好的模型權(quán)重參數(shù),然后在每個(gè) Transformer 塊里注入可訓(xùn)練的層,由于不需要對模型的權(quán)重參數(shù)重新計(jì)算梯度,這樣就大大減少了需要訓(xùn)練的計(jì)算量。

LoRA 就好比是一個(gè)插件,可以幫助我們低成本的定制各種效果。

今天的主角,則是在 LoRA 基礎(chǔ)上再進(jìn)一步,加上了深度的量化過程,名為 QLoRA。

QLoRA

QLoRA 其實(shí)是核心就是在 LoRA 的技術(shù)加上深度的量化過程。核心優(yōu)化思想包括以下三點(diǎn):

  1. 4bit NoramlFloat Quantization :一種新的數(shù)據(jù)類型,只用 4 字節(jié)表征參數(shù)并且保證整個(gè)模型的精度損失極小。(和我們之前的 int8, int4 量化方式不同, 原理這篇先不展開了)
  2. Double Quantization :對第一次量化后的那些常量再進(jìn)行一次量化,減少存儲(chǔ)空間。
  3. Paged optimizers : 使用 NVIDIA 統(tǒng)一內(nèi)存功能,該功能在 CPU 和 GPU 之間進(jìn)行自動(dòng) page 對 page 傳輸,以便在 GPU 偶爾 OOM 的情況下進(jìn)行. 可以從現(xiàn)象上理解成出現(xiàn)訓(xùn)練過程中偶發(fā) OOM 時(shí)能夠自動(dòng)處理,保證訓(xùn)練正常訓(xùn)練下去。

只能說,太厲害了,這 GPU 的的成本大大大大縮減。EleutherAI/pythia-12b 推理只需 12G, finetune 也只需 23G. 單個(gè) 3090 就能搞定了。

QLoRA 技術(shù)讓 65B 參數(shù)訓(xùn)練從 780G 降到 48G,再結(jié)合一些新的優(yōu)化器,比如 Sophia,可以讓模型訓(xùn)練 adma 提速 2 倍。

兩者一結(jié)合,咱們也能訓(xùn)練大模型的日子,指日可待了!

項(xiàng)目地址:

https://github.com/artidoro/qlora

有位某乎網(wǎng)友,對 QLoRA 進(jìn)行了實(shí)測。

我們知道 120 億參數(shù)量的 pythia-12b,想要運(yùn)行起來,需要至少 48G 顯存,但是使用 QLoRA 之后,只需要 12.8G 顯存。

以下是實(shí)測記錄:

1、環(huán)境準(zhǔn)備

git clone https://github.com/artidoro/qlora.git

conda create -n qenv python-3.8
conda activate qenv
cd qlora
pip install -r requirements.txt

#項(xiàng)目涉及到的新代碼,都需要從源碼進(jìn)行安裝才能保證。這里有同學(xué)網(wǎng)絡(luò)不好的或者安裝失敗的可參見遇到的問題手動(dòng)安裝
pip install -q -U bitsandbytes
pip install -q -U git+https://github.com/huggingface/transformers.git
pip install -q -U git+https://github.com/huggingface/peft.git
pip install -q -U git+https://github.com/huggingface/accelerate.git

2、推理就是直接 跑sh scripts/generate.sh。這里建議先下載好模型和數(shù)據(jù)。避免老斷帶來的心情煩躁。網(wǎng)絡(luò)好的下載順暢的可跳過此部分。

EleutherAI/pythia-12b(需要24G存儲(chǔ))模型介紹:

EleutherAI 是一個(gè)非營利性的人工智能研究實(shí)驗(yàn)室,專注于大型模型的可解釋性和對齊性。pythia 是 EleutherAI 為了促進(jìn) LLM 的研究開源的一系列 LLM(70M, 160M, 410M, 1B, 1.4B, 2.8B, 6.9B, and 12B)。

#單獨(dú)起一個(gè)腳本就下載模型和數(shù)據(jù)。
# test.py 
#模型下載也可網(wǎng)上找那種不下到默認(rèn)目錄的。緩存目錄: ll ~/.cache/huggingface/hub/models--EleutherAI--pythia-12b/
from transformers import (
    AutoModelForCausalLM, 
)
model = AutoModelForCausalLM.from_pretrained('EleutherAI/pythia-12b')

# download dataset. 
#這里聯(lián)網(wǎng)下載不下來的,手動(dòng)下載地址 https:///datasets/tatsu-lab/alpaca/tree/main/data
# 就把24M數(shù)據(jù)下載下來, mkdir -p tatsu-lab/alpaca , 然后下載好數(shù)據(jù)丟里面就行
from datasets import load_dataset
dataset = load_dataset('tatsu-lab/alpaca')

3、前面的環(huán)境和數(shù)據(jù)都沒問題了,運(yùn)行scripts/generate.sh。

顯存大?。篍leutherAI/pythia-12b 推理只需要顯存12.8G. 好強(qiáng),我跑的第一個(gè)10B以上模型.

圖片

使用 QLoRA 在 3090 顯卡上跑 12B 模型的 finetune。

圖片
圖片
單卡23G即可finetune pythia-12b

以上內(nèi)容整理自:

52AI:https://zhuanlan.zhihu.com/p/632398047

奉孝翼德:https://zhuanlan.zhihu.com/p/610031713

總結(jié)

QLoRA 的出現(xiàn)進(jìn)一步節(jié)省了訓(xùn)練成本,再結(jié)合能夠指導(dǎo)網(wǎng)絡(luò)更快收斂的優(yōu)化器,訓(xùn)練成本大幅降低。

全民都能訓(xùn)大模型的時(shí)代,指日可待,就像現(xiàn)在訓(xùn)練分類、檢測、分割網(wǎng)絡(luò)一樣。

好了,今天就聊這么多吧,我是 Jack,我們下期見!

圖片
·················END·················

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    在线观看视频日韩精品| 中文字幕乱码一区二区三区四区| 亚洲妇女黄色三级视频| 国产一区二区三区丝袜不卡 | 丁香六月婷婷基地伊人| 黄色片一区二区在线观看| 午夜小视频成人免费看| 国产偷拍精品在线视频| 日韩性生活视频免费在线观看| 91欧美激情在线视频| 亚洲精品国产精品日韩| 国产精品亚洲二区三区| 日本午夜免费啪视频在线| 欧美熟妇喷浆一区二区| 日本一本不卡免费视频| 久久99午夜福利视频| 亚洲欧美日韩在线中文字幕| 午夜视频免费观看成人| 国产日韩欧美一区二区| 日本少妇中文字幕不卡视频| 欧美一级黄片免费视频| 精品欧美一区二区三久久| 国产精品成人一区二区在线| 欧美精品亚洲精品日韩精品| 中文字幕一区二区熟女| 高跟丝袜av在线一区二区三区| 亚洲欧洲日韩综合二区| 亚洲日本加勒比在线播放 | 日韩特级黄片免费观看| 亚洲欧美国产中文色妇| 久久午夜福利精品日韩| 日韩在线免费看中文字幕| 免费观看日韩一级黄色大片| 久草精品视频精品视频精品 | 国产一区二区在线免费| 97人妻人人揉人人躁人人| 91久久精品国产一区蜜臀| 欧美日韩人妻中文一区二区 | 在线免费看国产精品黄片| 色婷婷国产精品视频一区二区保健| 国产亚洲视频香蕉一区|