” 目錄 一、引言 二、txt2img 標(biāo)簽頁(yè) 1、Prompt(正向提示詞) 2、Negative prompt(反向提示詞) 3、Width & Height(圖片尺寸) 4、CFG Scale(CFG值) 5、Seed(種子) 6、sampler methods(采樣方法) 7、Sampler steps(迭代步數(shù)) 8、Batch count & Batch size(批量處理) 9、Restore faces(臉部修復(fù)) 10、Tiling(瓷磚化) 11、Hires. fix.(高分修復(fù)) 1 引言 在上一篇文章中,我已經(jīng)詳細(xì)講解了如何在電腦上安裝能夠使用 SD 模型的 SD webui 。如果你尚未完成安裝過(guò)程,建議你先按照我提供的步驟進(jìn)行操作,完成安裝再接著往下看。 上期文章傳送門:超全攻略!免費(fèi)AI 繪圖模型Stable Diffusion的全面安裝指南! SD webui ,作為 SD 模型的用戶界面,具備了一套豐富且完善的功能,包括多種可自定義的參數(shù)選項(xiàng)。這些參數(shù)在圖像生成過(guò)程中起著關(guān)鍵性的作用,因?yàn)樗鼈兛梢詷O大影響最終生成圖像的效果和質(zhì)量。 實(shí)際上,許多在線的AI圖片生成器也提供了類似的參數(shù)調(diào)整功能。但是,SD webui 不僅覆蓋了這些功能,還提供了更多的自定義選項(xiàng),以滿足更復(fù)雜的需求。 在本篇文章中,我將首先介紹 SD webui 的一些基本參數(shù)。這些參數(shù)是控制 SD 模型的核心,理解它們的工作原理和作用,可以幫助你更好地掌握 SD 模型。 在后續(xù)的文章中,我還將進(jìn)一步探討 SD webui 的更多參數(shù)和特性,以便你能夠更深入地了解和使用 SD 模型。 2 txt2img 標(biāo)簽頁(yè) 以下是各個(gè)參數(shù)的詳細(xì)信息: 1、Prompt ![]() Prompt 即提示詞,這個(gè)參數(shù)也被稱為 Positive prompt(正向提示詞)。它是決定生成圖片內(nèi)容的最主要的參數(shù)。我們只需要在 Prompt 輸入框中鍵入相關(guān)的英文單詞或句子,就可以生成與之相關(guān)的圖像。你的描述越精確,生成的圖像就越接近你所期望的效果。 需要注意的是,目前 SD webui 僅支持英文輸入。 Prompt 參數(shù)的設(shè)定在掌握 AI 繪畫技術(shù)中占據(jù)了關(guān)鍵位置。一個(gè)優(yōu)質(zhì)的 Prompt 應(yīng)當(dāng)盡可能具體和詳細(xì),以便引導(dǎo)模型準(zhǔn)確理解并生成出你所期望的圖像。例如,如果你想繪制一只貓,你不應(yīng)該只是在 prompt 寫 “a cat”,你應(yīng)當(dāng)提供更多的信息,如它的品種、毛色,甚至包括它的姿態(tài)。 以下是一個(gè)例子: Prompt: a cat(一只貓) ![]() Prompt: a cute cat sitting on the ground, Persian cat(一只坐在地上的可愛(ài)的貓,波斯貓) ![]() 可以發(fā)現(xiàn),更具體的描述能夠獲得更接近期望的結(jié)果。因此你需要盡可能描述得更具體、更精確,以便生成更接近你所期待的圖像。當(dāng)然,如果你只是為了體驗(yàn) AI 繪畫的樂(lè)趣,而無(wú)具體的構(gòu)圖需求,那么這個(gè)原則就不那么重要了。 另外,你可能注意到框的右上角有 “0/75” 的標(biāo)識(shí),意思是你能輸入的 tokens 數(shù)量上限為75。在這里, “tokens” 可以理解為模型讀取和處理語(yǔ)言的基本單元,它可以是一個(gè)單詞,也可以是一個(gè)字符,取決于具體的語(yǔ)言和模型的設(shè)計(jì)。 許多網(wǎng)絡(luò)上的圖片生成式AI都不能輸入超過(guò)75 tokens 的提示詞。然而,在 SD webui ,你實(shí)際上可以輸入超過(guò)75個(gè) tokens。這得益于 SD webui 的一種特殊機(jī)制,該機(jī)制能夠處理超出標(biāo)準(zhǔn)限制的 tokens 數(shù)量。也就意味著,你可以輸入更長(zhǎng)的描述,提供更多的細(xì)節(jié)和指示,以幫助模型更準(zhǔn)確地生成你所期望的圖像。 盡管如此,你仍然需要注意描述的簡(jiǎn)潔性和明確性,以避免過(guò)于冗長(zhǎng)和復(fù)雜的描述導(dǎo)致模型理解困難。因此,如何在保證描述清晰度的同時(shí),盡量控制 tokens 數(shù)量,也是使用 SD webui 時(shí)需要注意的一點(diǎn)。 2、Negative prompt ![]() Negative prompt 即負(fù)向提示詞,是另一個(gè)重要的參數(shù),它可以幫助你更精確地控制生成圖像的內(nèi)容。正如其名字所示,負(fù)向提示詞是用來(lái)指導(dǎo)模型避免生成某些特定內(nèi)容的。 與正向提示詞直接描述你期望出現(xiàn)在圖像中的內(nèi)容不同,負(fù)向提示詞則用于描述你不希望出現(xiàn)在圖像中的內(nèi)容。通過(guò)這種方式,負(fù)向提示詞可以作為正向提示詞的補(bǔ)充,提供額外的指導(dǎo)信息,幫助模型更精確地生成你期待的圖像。 例如,如果你在正向提示詞中輸入 'a serene forest scene'(一個(gè)寧?kù)o的森林景觀),AI 可能偶爾會(huì)描繪出河流,但你希望避免圖像中出現(xiàn)河流,那么你可以在負(fù)向提示詞中輸入 'water'(水),這樣,模型在生成圖像時(shí),會(huì)盡可能地避免描繪出與水有關(guān)的事物。 以下是一個(gè)例子: Prompt:a serene forest scene (一個(gè)寧?kù)o的森林景觀) Negative prompt:無(wú) ![]() Prompt:a serene forest scene(一個(gè)寧?kù)o的森林景觀) Negative prompt:water(水) ![]() 可以發(fā)現(xiàn),在負(fù)向提示詞中添加了 'water' 后,森林中的水消失了。 總的來(lái)說(shuō),負(fù)向提示詞是一個(gè)很不錯(cuò)的工具,能夠提供額外的控制能力,幫助你生成更接近理想的圖像。通過(guò)熟練使用正向提示詞和負(fù)向提示詞,你可以更好地駕馭AI繪畫,創(chuàng)作出滿意的作品。 3、Width & Height ![]() 'Width' 與 'Height' 指的是生成圖片的寬度和高度,它們決定了生成圖片的尺寸和長(zhǎng)寬比。通過(guò)調(diào)整這兩個(gè)參數(shù),你可以根據(jù)需要更改圖像的大小以及寬高比。 基礎(chǔ)的SD模型——Stable Diffusion v1.5 是使用 512x512 尺寸的圖片進(jìn)行訓(xùn)練的,因此,如果你維持這個(gè)尺寸,將更有可能獲得理想的生成結(jié)果。這是因?yàn)樵谠摮叽缦拢P偷念A(yù)測(cè)能力最強(qiáng),可以更準(zhǔn)確地生成符合描述的圖像。 當(dāng)然,你也可以根據(jù)具體需求,嘗試其他的尺寸設(shè)置。例如,如果你的目標(biāo)是生成人物圖像,建議采用512x768的尺寸;如果是生成風(fēng)景圖像,則建議采用768x512的尺寸。 需要注意的是,使用過(guò)寬的尺寸生成人像可能會(huì)產(chǎn)生不正常的效果,例如生成的人物可能會(huì)有兩個(gè)頭或者兩個(gè)身體等等。 以下是個(gè)例子: prompt:oil painting, 1 girl, solo, running, happy, highly detailed stola, Running joyfully with light steps on the grassland, by William Adolphe Bouguereau, vintage, sharp focus,(油畫、1個(gè)女孩,單獨(dú)的,奔跑,開(kāi)心,高度細(xì)節(jié)的裙子,輕快的步伐在草原開(kāi)心地奔跑,William Adolphe Bouguereau 畫家,復(fù)古的,銳焦) ![]() 上圖的圖片尺寸為768x512??梢钥闯?,在寬畫幅里繪制人物,既使我在 prompt 里寫了 1 girl,并用 solo 強(qiáng)調(diào),但仍然會(huì)產(chǎn)生兩個(gè)人物。 當(dāng)然,并不是說(shuō)設(shè)置這個(gè)尺寸就一定會(huì)產(chǎn)生兩個(gè)人物,而是會(huì)增大這個(gè)趨勢(shì)或者說(shuō)概率。不過(guò),在很多SD微調(diào)模型中,這個(gè)問(wèn)題已經(jīng)得到改善。 另外,在其它設(shè)置保持不變的情況下,無(wú)論改變圖片的寬度或高度參數(shù),都會(huì)對(duì)最終生成的圖像產(chǎn)生顯著影響。因此,合理地設(shè)置并調(diào)整這兩個(gè)參數(shù),能夠幫助你更好地控制生成圖像的效果。 以下是個(gè)例子: 除了圖片尺寸以外,以下兩張圖的所有參數(shù)都是一致的,但是會(huì)得到兩張完全不一樣的圖片。 ![]() (768 x 512) ![]() (512 x 768) 最后,需要注意的是,生成更高分辨率的圖片需要更大的顯存。因此,如果你希望提高生成圖片的分辨率,但受限于顯存容量,你可能需要尋求其他的解決方案。 4、CFG Scale ![]() CFG Scale,全稱為 Classifier Free Guidance Scale,是一個(gè)可以調(diào)整生成圖像忠實(shí)于提示詞程度的重要參數(shù)。這個(gè)參數(shù)的設(shè)置將直接影響模型對(duì)提示詞的忠實(shí)程度,從而影響生成圖像的效果和質(zhì)量。 CFG Scale 的值越小,生成的圖像與提示詞的相關(guān)程度越低,模型會(huì)展現(xiàn)出更大的創(chuàng)造力;反之,CFG Scale 的值越大,生成的圖像將更加忠實(shí)于提示詞,模型會(huì)更嚴(yán)格地按照提示詞的內(nèi)容生成圖像。 以下是對(duì) CFG Scale 不同值的一些理解: 1 —— 這個(gè)值意味著模型幾乎會(huì)無(wú)視你的提示詞。 3 —— 這是一個(gè)比較有創(chuàng)造力的值,模型會(huì)根據(jù)你的提示詞生成比較有創(chuàng)意的圖片。 7 —— 這是默認(rèn)值,也是創(chuàng)意與忠實(shí)提示詞之間的一個(gè)平衡點(diǎn)。在這個(gè)值下,模型既能保持一定的創(chuàng)新性,也能較好地遵循提示詞。 15 —— 在這個(gè)值下,模型將在很大程度上忠實(shí)于提示詞,生成的圖像將更加接近你的期望。 30 —— 這是一個(gè)極端值,模型將嚴(yán)格按照提示詞生成圖像,幾乎沒(méi)有任何創(chuàng)新性。因此要求你的描述相當(dāng)完整才行。 其它參數(shù)保持相同,使用不同 CFG 參數(shù)的效果對(duì)比圖: ![]() 設(shè)置建議:通常建議遠(yuǎn)離1和30這兩個(gè)極端值。你可以從默認(rèn)值7開(kāi)始,然后根據(jù)需要進(jìn)行調(diào)整。如果希望生成的圖像更有創(chuàng)意,可以適當(dāng)降低 CFG Scale 值;如果希望生成的圖像更接近提示詞,可以適當(dāng)提高 CFG Scale 值。 5、Seed ![]() Seed,即種子,是控制圖像生成效果的關(guān)鍵參數(shù)之一。它的存在賦予了模型隨機(jī)性的特點(diǎn),使得每次生成的圖像都不盡相同,增加了生成圖像的多樣性。 當(dāng)其他參數(shù)保持不變的情況下,如果種子值也相同,那么生成的圖像將會(huì)完全相同(顯卡也需要相同)。這意味著,如果你想復(fù)制一張與他人完全一樣的圖像,你不僅需要知道提示詞(Prompt),同時(shí)也需要知道對(duì)應(yīng)的種子值(seed)。 當(dāng)種子值設(shè)置為-1時(shí),系統(tǒng)將使用隨機(jī)種子來(lái)生成圖像,這將使得每次生成的圖像都有所不同,增加了生成結(jié)果的多樣性。然而,如果你想在某張已生成的圖像基礎(chǔ)上進(jìn)行微調(diào),你應(yīng)當(dāng)固定種子值,并適當(dāng)調(diào)整其他參數(shù),如 Prompt,以便獲得更理想的效果。 當(dāng)你需要生成合適圖片的時(shí)候?qū)?seed 值設(shè)置為-1,而需要微調(diào)某張?zhí)囟▓D片的時(shí)候再固定 seed 值。 以下是個(gè)例子: Prompt:1 girl, :d, blue hair, (brown eyes:1.2), perfect nose, collarbone, detailed vintage dress, shinny glowing skin, upper body, ornate hairbind, jewelry, blue sky, cloud, grassland, sitting, highly detailed, sharp focus, stunningly beautiful, natural light(1個(gè)女孩,微笑,藍(lán)色頭發(fā),棕色眼睛,完美的鼻子,鎖骨,細(xì)節(jié)的復(fù)古裙子,發(fā)光的皮膚,上半身,華美的發(fā)夾,寶石,藍(lán)天,云,草地,坐著,高度細(xì)節(jié),銳焦,美麗的,自然光) ![]() 我覺(jué)得這張圖片很不錯(cuò),但是我還想讓她看著鏡頭。意味著接下來(lái)我需要針對(duì)這張圖片進(jìn)行調(diào)整,那么就需要將這張圖片的 seed 值復(fù)制到 seed 框內(nèi),seed 值可以在如下位置查看: ![]() 將這個(gè)值手動(dòng)復(fù)制到如下位置,或者點(diǎn)擊綠色回收按鈕,將種子值自動(dòng)復(fù)制到框內(nèi): ![]() 然后在 prompt 框內(nèi)添加 “l(fā)ooking at viewer”(看向觀眾),點(diǎn)擊 generate,你就可以得到一張與原圖類似的圖片,但是人物會(huì)看向鏡頭。 ![]() 另外,在 seed 框后邊還有一個(gè) extra 選項(xiàng),點(diǎn)開(kāi)之后可以看到如下四個(gè)參數(shù)調(diào)整項(xiàng)。 ![]() Variation seed 即變異種子,Variation strength 即變異強(qiáng)度。兩者需要搭配使用,將變異強(qiáng)度設(shè)定為0表示只使用種子值生成圖片,將變異強(qiáng)度為1則表示只使用變異種子值生成圖片,其它介于0到1之間的 變異強(qiáng)度值則可以獲得兩者不同程度融合的圖像。 以下是個(gè)例子: 將 seed 值設(shè)定為1或100,而其他參數(shù)保持完全相同,可以得到如下兩張圖片: ![]() 但如果我想要處于兩者之間的圖片,那么就需要點(diǎn)擊 extra,將 Seed 設(shè)定為1,將 Variation seed 設(shè)定為100,Variation strength 則在0到1之間調(diào)整。效果如下所示: ![]() 可以注意到,隨著 Variation strength 值增大,seed=1 的圖片逐漸過(guò)渡到 seed=100 的圖片。 在之前關(guān)于圖像大小參數(shù)的介紹時(shí),我提到過(guò)即使其它參數(shù)保持一致,只調(diào)整圖像尺寸也會(huì)對(duì)最終結(jié)果產(chǎn)生顯著影響。Resize seed from width & height 這個(gè)參數(shù)就是為了解決這個(gè)問(wèn)題而準(zhǔn)備的。 將圖像的原始尺寸輸入 Resize seed from width & height,將目標(biāo)尺寸輸入 width & height 參數(shù)框內(nèi),即可獲得更接近原始尺寸的圖片。 比如說(shuō)我喜歡這張512x512,seed=100 的圖片: ![]() 如果我直接改變這張圖片的尺寸,從512 x 512 → 768 x 512: ![]() 可以發(fā)現(xiàn),人物臉部和姿勢(shì)都變化非常大。 當(dāng)你使用 Resize seed from width & height,你會(huì)得到更接近原始圖像的結(jié)果。雖然這兩者仍然不是完全一致,但要更接近一點(diǎn): ![]() 6、sampler methods ![]() 采樣方法(Sampler Methods)是 SD webui 中的一個(gè)參數(shù)選項(xiàng),它決定了模型在解決擴(kuò)散方程以生成圖像時(shí)的策略。 SD webui 提供了多種采樣方法供用戶選擇: ![]() 盡管這些方法在理論上以不同的方式解決擴(kuò)散方程,但在實(shí)踐中,使用不同的采樣器生成的圖像差異通常比較小。換句話說(shuō),從圖像質(zhì)量的角度來(lái)看,選擇不同的采樣方法對(duì)最終結(jié)果的影響相對(duì)較小。 這并不是說(shuō)采樣方法不重要,而是意味著在選擇采樣方法時(shí),用戶可以更加專注于其他參數(shù)的調(diào)整,如分辨率、提示詞和 CFG 等,以獲得更好的圖像質(zhì)量。 以下使用不同采樣器的對(duì)比圖: ![]() 從這個(gè)結(jié)果來(lái)看,除了 DPM fast 和 Euler a 兩個(gè)采樣器的結(jié)果不盡如人意之外,其它采樣器都表現(xiàn)良好。 然而,不同的采樣方法在處理相同任務(wù)時(shí)所需的時(shí)間卻可能會(huì)有所不同。每個(gè)采樣方法都有其獨(dú)特的計(jì)算方式和算法特點(diǎn)。某些采樣器可能更加高效,能夠在較短的時(shí)間內(nèi)完成任務(wù),這對(duì)于需要快速結(jié)果的場(chǎng)景非常有利。其他采樣器可能會(huì)更加注重結(jié)果的準(zhǔn)確性和質(zhì)量,可能需要更多的計(jì)算時(shí)間才能達(dá)到理想的效果。 以下是對(duì)不同采樣方法所需時(shí)間的參考: ![]() 這些時(shí)間僅供參考,實(shí)際的處理時(shí)間可能受到多個(gè)因素的影響,包括計(jì)算機(jī)性能、圖像大小和選定參數(shù)等。 總的來(lái)說(shuō),在選擇適合的采樣器時(shí),我們需要綜合考慮時(shí)間效率和結(jié)果質(zhì)量之間的權(quán)衡。對(duì)于需要迅速獲得結(jié)果并能夠接受一定的精度損失的任務(wù),可以選擇較為高效的采樣器。而對(duì)于對(duì)結(jié)果準(zhǔn)確性要求較高且可以接受更長(zhǎng)計(jì)算時(shí)間的任務(wù),則可以選擇注重質(zhì)量的采樣器。 使用建議:如果你對(duì)采樣方法沒(méi)有特別的需求或偏好,推薦使用 DPM++ 2M Karras,這種方法在效率和效果上都表現(xiàn)較好。DPM++ SDE Karras 和 DPM++ SDE 則是質(zhì)量更佳的采樣器,很推薦使用,不過(guò)相對(duì)耗時(shí)。盡量避免使用 Euler a 和 DPM fast。 7、Sampler steps ![]() 采樣步數(shù)(Sampler Steps)是另一個(gè)影響圖像生成效果的重要參數(shù)。它決定了使用特定采樣方法進(jìn)行的采樣步驟的數(shù)量。一般來(lái)說(shuō),采樣步數(shù)越多,生成的圖片清晰度越高。 然而,這并不是說(shuō)采樣步數(shù)越多越好。雖然采樣步數(shù)的增加可以帶來(lái)圖像清晰度的提升,但同時(shí)也會(huì)導(dǎo)致圖像生成的時(shí)間增加。而且,當(dāng)采樣步數(shù)達(dá)到一定程度后,繼續(xù)增加步數(shù)所帶來(lái)的清晰度提升將會(huì)變得非常微小,甚至幾乎無(wú)法察覺(jué),而所需的時(shí)間卻會(huì)大幅度增加。因此,我們需要在圖像清晰度和生成時(shí)間之間尋找一個(gè)合適的平衡點(diǎn)。 以下是使用 DPM++ 2M Karras 采樣方法,隨著采樣步數(shù)增加,生成圖片的變化情況: ![]() 根據(jù)上圖可以觀察到,在采樣步數(shù)達(dá)到15步之前,隨著步數(shù)的增加,圖片的清晰度變化非常明顯。然而,一旦采樣步數(shù)達(dá)到15步以上,隨著步數(shù)的增加,圖片的清晰度變化已經(jīng)變得難以察覺(jué)。 基于這個(gè)觀察結(jié)果,在使用 DPM++ 2M Karras 采樣方法時(shí),建議將采樣步數(shù)設(shè)置在15到20之間。這個(gè)范圍內(nèi)的采樣步數(shù)可以在保持合理的計(jì)算時(shí)間的同時(shí),獲得較為滿意的圖像清晰度表現(xiàn)。 至于其他采樣方法,合理的采樣步數(shù)則需要自行嘗試和評(píng)估。不同的采樣方法可能具有不同的收斂速度和清晰度表現(xiàn)。因此建議根據(jù)具體情況進(jìn)行實(shí)驗(yàn),通過(guò)逐步增加采樣步數(shù)并觀察圖像的清晰度變化,來(lái)確定最適合的采樣步數(shù)。 總的來(lái)說(shuō),選擇適當(dāng)?shù)牟蓸硬綌?shù)是在使用不同采樣方法時(shí)的需要考慮的因素。通過(guò)將采樣步數(shù)設(shè)置在15到20之間,可以在DPM++ 2M Karras采樣方法中實(shí)現(xiàn)良好的平衡。對(duì)于其他采樣方法,建議自行實(shí)驗(yàn)和評(píng)估,以找到最佳的采樣步數(shù),從而得到滿意的結(jié)果。 使用建議:使用DPM++ 2M Karras,步驟15 - 20步 8、Batch count & Batch size ![]() 批次數(shù)(Batch Count)與每批次生成的圖片數(shù)量(Batch Size)是在使用SD生成圖片時(shí)需要考慮的兩個(gè)參數(shù)。它們決定了你每次運(yùn)行模型時(shí)生成的圖片的總數(shù)量,總數(shù)量等于 Batch Count 與 Batch Size 的乘積。比如,如果設(shè)置 Batch Count 為 2,Batch Size 為 4,那么每次運(yùn)行模型會(huì)生成 2 x 4 = 8 張圖片。 在實(shí)踐中,我們往往不會(huì)只生成一張圖片,而是會(huì)一次性生成多張圖片,這樣可以更好地判斷輸入的 prompt 是否能得到滿意的結(jié)果。 然而,Batch Count 和 Batch Size 并不是隨意設(shè)置的。它們的設(shè)定取決于你的顯存,尤其是顯存的大小。如果你的顯存較大,那么可以設(shè)置較高的 Batch Size值,因?yàn)檫@樣可以一次性處理更多的圖片,從而加快運(yùn)行速度。相反,如果顯存較小,那么應(yīng)設(shè)置較高的 Batch Count 值,以防止因一次處理的圖片過(guò)多導(dǎo)致的內(nèi)存溢出。 以下是個(gè)例子: 生成4張圖片,設(shè)置batch count = 1,batch size = 4。消耗時(shí)間 91.49s,內(nèi)存占用 3028M ![]() 而同樣生成4張圖片,設(shè)置 batch count = 4,batch size = 1。消耗時(shí)間 112.77s,內(nèi)存占用 2656M ![]() 因此在電腦性能允許的情況下,生成相同總量的圖片應(yīng)該盡可能提高 batch size 的值,以縮短總的繪圖時(shí)間。 9、Restore faces ![]() 'Restore Faces' 即修復(fù)臉部,是一個(gè)專門用于修復(fù)生成圖片中出現(xiàn)的不正常人臉形態(tài)的功能。 在使用SD生成人物圖片時(shí),有時(shí)可能會(huì)出現(xiàn)形狀扭曲或者表情異常的人臉,這會(huì)大大降低生成圖片的視覺(jué)質(zhì)量。'Restore Faces' 功能則通過(guò)對(duì)生成的圖片進(jìn)行后處理,專門修復(fù)人臉部分,而不會(huì)對(duì)圖像的其他部分造成影響。 以下是個(gè)例子: ![]() 在SD webui 中,提供了兩種人臉修復(fù)方法,分別是 CodeFormer 和 GFPGAN。這兩種方法在安裝 SD webui 的依賴項(xiàng)時(shí)就已經(jīng)被引入。CodeFormer 作為默認(rèn)的修復(fù)方法,能夠處理大部分的人臉異常情況。如果在使用 CodeFormer 方法后,人臉的修復(fù)效果仍然不理想,你可以嘗試切換到 GFPGAN 方法。 切換方法如下: 點(diǎn)擊 setting,點(diǎn)擊 face restoration,再切換為 GFPGAN 即可。Codeformer weight 可以用來(lái)調(diào)整面部修復(fù)的強(qiáng)度。請(qǐng)注意,codeformer weight 的數(shù)值越低效果越強(qiáng)。 ![]() 開(kāi)啟 'Restore Faces' 功能后,可以顯著降低生成圖片中出現(xiàn)不正常人臉的概率,從而提升生成圖片的整體視覺(jué)質(zhì)量。 雖然 “Restore Faces” 功能在修復(fù)生成圖片中的人臉形態(tài)方面有著顯著的效果,但并不意味著我們應(yīng)該一直保持這個(gè)功能開(kāi)啟。事實(shí)上,這個(gè)功能在運(yùn)行過(guò)程中需要占用額外的顯存。因此,建議根據(jù)自己的實(shí)際需求和硬件條件來(lái)合理決定是否開(kāi)啟這個(gè)功能。 10、Tiling Tiling(瓷磚鋪設(shè))是一種將瓷磚排列在一起的技術(shù)動(dòng)作,也可以理解為將圖像或模式“瓷磚化”。我們都知道,多塊瓷磚可以通過(guò)拼接方式形成反復(fù)出現(xiàn)的圖案。這些圖案可以是幾何形狀、花朵、動(dòng)物或抽象的設(shè)計(jì)。 Tiling 的主要目的就是生成一幅可以在水平和垂直方向上無(wú)限重復(fù)拼接的圖像。 以下是個(gè)啟用了 Tiling 功能的例子: Prompt:gems pattern(寶石圖案) ![]() 可以觀察到,啟用 tiling 后產(chǎn)生的圖片是周期性圖片的一部分。 將4張相同的圖片拼接起來(lái)就可以得到下圖: ![]() 這樣的拼接使得圖片在水平和垂直方向上呈現(xiàn)出周期性重復(fù)的效果。每張圖片在拼接過(guò)程中與相鄰圖片的邊緣無(wú)縫連接,形成一個(gè)連續(xù)的平鋪效果。 需要注意的是,這里的白色線條是為了方便區(qū)分和理解才添加進(jìn)去的,實(shí)際操作過(guò)程會(huì)嚴(yán)絲合縫。 11、Hires. fix. ![]() Hires.fix,即 high-resolution fix(高分辨率修復(fù)),是一種能夠提高原始圖片分辨率的選項(xiàng)。通常情況下,原始圖像的分辨率為512x512(當(dāng)然也有更高分辨率的,如768x768),而1080p顯示器的分辨率為1080x1920,遠(yuǎn)遠(yuǎn)超過(guò)了原始圖像的分辨率,因此觀感上會(huì)顯得模糊不清。 Hires.fix 并不僅僅是簡(jiǎn)單地?cái)U(kuò)大圖片尺寸,而是能夠?qū)D片放大為高分辨率圖像,并同時(shí)填充模糊的細(xì)節(jié)。 那為什么不直接生成分辨率更高的圖片呢?這是因?yàn)楦淖儓D片尺寸會(huì)對(duì)圖片內(nèi)容產(chǎn)生巨大影響,而且更高分辨率的圖像需要更多的顯存,并且處理時(shí)間也會(huì)呈指數(shù)級(jí)增長(zhǎng)。 因此,為了實(shí)現(xiàn)高分辨率修復(fù),我們必須先生成低分辨率的圖像,然后再進(jìn)行高清放大。這個(gè)過(guò)程通過(guò)利用圖像處理算法來(lái)填充丟失的細(xì)節(jié),以提升圖像的清晰度和細(xì)膩度。通過(guò)這種方式,Hires.fix 能夠在保持圖像內(nèi)容完整性的同時(shí),增強(qiáng)圖像的質(zhì)量。 在 Upscaler 選項(xiàng)框中選擇放大器類型。提高 Hires steps 可以增加圖像的清晰度。然而,與 sampler steps 一樣,我們需要注意不要將 Hires steps 設(shè)置得過(guò)高,因?yàn)槊恳徊?Hires 的計(jì)算時(shí)間都遠(yuǎn)大于原始采樣步驟的計(jì)算時(shí)間。一般來(lái)說(shuō),Hires steps = 15 步已經(jīng)足夠。 另外,Denoising strength 參數(shù)控制添加到原始圖像的噪點(diǎn)數(shù)量。隨著 Denoising strength 的升高,生成的圖像與原圖逐漸偏離。但由于某些原因,Denoising strength 小于0.5不能生成清晰的圖片。因此使用latent放大器不能獲得與原圖幾乎一致的圖片。 以下是開(kāi)啟Hires.fix前后的細(xì)節(jié)對(duì)比圖: ![]() (放大前) ![]() (放大后) 可以發(fā)現(xiàn),圖片的像素感消失了,皮膚也變得更加平滑。 接下來(lái),讓我們來(lái)觀察一下 Denoising strength 的效果。請(qǐng)將放大倍率調(diào)整為2x,將 upscaler 設(shè)置為 latent,并將 upscale steps 設(shè)置為15步。如下圖: ![]() 可以觀察到,Denoising strength 的值不應(yīng)該小于0.5。在0.6至0.9之間,我們可以獲得相對(duì)清晰的圖像,而設(shè)定為1.0則會(huì)導(dǎo)致圖像主題嚴(yán)重變形。因此,合理的 Denoising strength 值應(yīng)該在0.6至0.9之間。 需要注意的是,這個(gè)范圍是基于 latent 放大器的參考。不同的放大器模型可能具有不同的合理取值范圍,因此建議你根據(jù)具體的放大器模型進(jìn)行嘗試和調(diào)整。 雖然這是個(gè)不錯(cuò)的工具,但每個(gè)人對(duì)工具和方法都有自己的偏好和習(xí)慣。對(duì)于高分辨率放大,Extra 標(biāo)簽頁(yè)提供了更多的選項(xiàng)和自定義設(shè)置,使我們能夠更靈活地控制放大過(guò)程。 篇幅所限,這一期的內(nèi)容先介紹到這里。 · 如果還有其它問(wèn)題,歡迎在評(píng)論區(qū)留言~ · 下一期的內(nèi)容將會(huì)給大家繼續(xù)介紹其它標(biāo)簽頁(yè)的參數(shù)解析。 |
|