這是一篇關(guān)于stable diffusion本地部署并通過基礎(chǔ)模型搭配不同的lora生成圖片的教程,軟件很容易獲取,對電腦的要求也不是太高,相較于本地化的chatglm動(dòng)不動(dòng)就要6G顯存的門檻還是很低的,根據(jù)不同性能顯卡,同樣的參數(shù)生成圖片的速度也不一樣,4090-24G版本的幾秒就可以生成一張圖,1060-4G的幾乎要3-5分鐘才能生成一樣。下面主要講一講很多新手經(jīng)常搞不懂的問題和使用教程。 stable diffusion生成的古風(fēng)美女圖 對于軟件的安裝這里就不介紹了,網(wǎng)上很多的視頻教程更加的簡單易懂,本文以上圖為例,講一下如何生成同類型的圖,stable diffusion最方便的一個(gè)功能就是圖片信息,我們可以把圖片直接拖進(jìn)去,右邊就會(huì)顯示這張圖的描述和相關(guān)參數(shù)。如何看懂這個(gè)參數(shù)呢?我們要先知道stable diffusion模型和lora的區(qū)別,簡單講stable diffusion模型決定了可以生成圖的畫風(fēng)和類型,lora決定了生成圖的其他細(xì)節(jié):服裝、臉部特征、動(dòng)作等,也算是對模型的補(bǔ)充。 stable diffusion的圖片信息功能 通過上面的圖,我們可以看到右邊的各種描述,其中<lora:>這種形式的內(nèi)容,就是這張圖用到了這些lora,prompt中的一些關(guān)于畫質(zhì)、人物、動(dòng)作之類的描述都是通用的,我們可以直接復(fù)制使用,也有人對()內(nèi)的提示詞不太理解,其實(shí)每一個(gè)提示詞都有權(quán)重的,越靠前權(quán)重要高,如果想更高一點(diǎn)就可以加()加的括號(hào)越多權(quán)重也就越高。同理其他樣式的括號(hào)作用也是這樣的。右下角還提到了Model: chilloutmix-Ni,這是這張圖用的到基礎(chǔ)模型,如果我們模型和lora本地都有了就可以直接點(diǎn)下面的文生圖按鈕。(本地沒有可以去網(wǎng)上下載) stable diffusion的文生圖功能 如果你的默認(rèn)模型不是chilloutmix-Ni,可以在左上角切換模型,如果你的lora名字和提示詞不一樣,需要換成你本地的名字,需要注意大小寫和lora版本的問題,lora后面的數(shù)值:0.5是代表調(diào)用的權(quán)重,數(shù)值越高占比越高,最高是2。當(dāng)模型和lora都準(zhǔn)備好了,我們就可以點(diǎn)擊右邊的生成來煉丹了。下面的Steps、Sampler、Seed等參數(shù)都已經(jīng)設(shè)置好了,我們不需要?jiǎng)樱绻竺嫔傻膱D沒問題了,可以做適當(dāng)?shù)恼{(diào)整。 stable diffusion的文生圖功能 除了模型和lora要一致,還需要注意Negative prompt里面有沒有用到嵌入式的描述,一般帶下劃線的就是直接調(diào)用的embeddings文件夾里面的pt文件,這個(gè)我們也需要去網(wǎng)上下載下來放到對應(yīng)的文件夾里面,這里可以補(bǔ)充一下每個(gè)類型的文件放的文件夾位置,如果是超過1G的文件,基本上就是sd模型了,下載了直接放到models下面的stable diffusion文件夾里面,可以連圖片一起下載 會(huì)顯示縮略圖方便查看。幾十幾百兆的文件 一般都是lora,放到models下面的文件夾里面,還有一些插件是放在extensions文件夾里面的(比如常用的中文漢化、controlnet、posex-master、tagcomplete等等),只有幾十KB的文件就是文字型描述放在embeddings里面。 stable diffusion存放目錄 通過這樣的操作,我們就可以通過一張圖,生成同類型的其他圖了,搭配controlnet還可以實(shí)現(xiàn)不同的pose,下面放一些微調(diào)了提示詞的圖片供大家欣賞,如果對stable diffusion使用還有其他不了解的也歡迎大家討論。 stable diffusion生成的圖 stable diffusion生成的圖 stable diffusion生成的圖 |
|