新智元報(bào)道 編輯:David 【新智元導(dǎo)讀】特斯拉前AI總監(jiān)點(diǎn)贊!這個(gè)開源AI藝術(shù)創(chuàng)作模型,想要開啟「人機(jī)合作」藝術(shù)創(chuàng)作新時(shí)代。 近日,由Emad Mostaque創(chuàng)立和資助的Stability.ai公司宣布公開發(fā)布AI創(chuàng)造的藝術(shù)作品。 你可能認(rèn)為這只是AI在藝術(shù)領(lǐng)域的另一次嘗試,但實(shí)際上遠(yuǎn)不止如此。 有兩個(gè)原因。 首先,與DALL-E 2不同的是,Stable Diffusion是開源的。這意味著任何人都可以利用它的骨干,免費(fèi)建立針對(duì)特定文本到圖像創(chuàng)作任務(wù)的應(yīng)用程序。 另外,Midjourney的開發(fā)者實(shí)施了一項(xiàng)功能,允許用戶將其與Stable Diffusion結(jié)合起來(lái),這導(dǎo)致了一些驚人的結(jié)果。 試想一下,在接下來(lái)的幾個(gè)月里會(huì)出現(xiàn)什么。 第二,與DALL-E mini和Disco Diffusion不同,Stable Diffusion可以創(chuàng)造出驚人的逼真和藝術(shù)作品,對(duì)OpenAI或谷歌的模型沒(méi)有什么可羨慕的。人們甚至聲稱它是「生成式搜索引擎」中新的SOTA。 (除非另有說(shuō)明,本文所有圖片都是通過(guò)Stable Diffusion創(chuàng)作的)。 Stable Diffusion 體現(xiàn)了人工智能藝術(shù)世界的最佳特征:它可以說(shuō)是現(xiàn)有最好的人工智能藝術(shù)模型,而且是開源的。這簡(jiǎn)直是聞所未聞,將產(chǎn)生巨大的影響。 更有趣的是,關(guān)于這些服務(wù)的消息可能會(huì)通過(guò)最意想不到的來(lái)源到達(dá)你的手中。你的父母、你的孩子、你的伴侶、你的朋友或你的同事。 這些人往往是人工智能領(lǐng)域發(fā)生的事情的局外人,他們即將發(fā)現(xiàn)這個(gè)領(lǐng)域的最新趨勢(shì)。藝術(shù)可能成為AI最終敲開那些對(duì)未來(lái)視而不見(jiàn)的人的大門的方式。這不是很有詩(shī)意嗎? 不只是開源的DALL·E 2 Stability.ai的誕生是為 了創(chuàng)造「開放的AI工具,讓我們發(fā)揮潛能」。 不僅僅是從未進(jìn)入大多數(shù)人手中的研究模型,而是具有現(xiàn)實(shí)世界應(yīng)用的工具,開放給我和你來(lái)使用和探索。 這是與其他科技公司不同的地方,比如OpenAI,它嫉妒地守護(hù)著它最好的系統(tǒng)(GPT-3和DALL-E 2)的秘密,或者谷歌,它甚至從未打算將自己的(PaLM、LaMDA、Imagen或Parti)作為私人測(cè)試版發(fā)布。 Stability.ai的這次公開發(fā)布不僅分享了模型權(quán)重和代碼——雖然這對(duì)科學(xué)和技術(shù)的健康發(fā)展很關(guān)鍵,但大多數(shù)人并不關(guān)心它們。而且還為我們這些不想或不知道如何編碼的人提供了一個(gè)無(wú)代碼的即用型網(wǎng)站。 網(wǎng)站名叫DreamStudio Lite,可以免費(fèi)使用,最多可生成200張圖片。像DALL-E 2一樣,它采用付費(fèi)訂閱模式,可以用10英鎊獲得1千張圖片(OpenAI每月補(bǔ)充15個(gè)積分,但要獲得更多的積分,你必須以15美元購(gòu)買115個(gè)包)。 DALL-E的成本為0.03美元/圖,而Stable Diffusion的成本為0.01英鎊/圖。 此外,還可以通過(guò)API大規(guī)模地使用Stable Diffusion(成本呈線性增長(zhǎng),所以你可以用1000英鎊獲得100K代)。除了圖像生成,Stability.ai很快將宣布DreamStudio Pro(音頻/視頻)和Enterprise(工作室)。 DreamStudio可能很快會(huì)實(shí)現(xiàn)的另一個(gè)功能是,可以從其他圖像生成圖像,而不是通常的文本到圖像的設(shè)置。就像下面這樣: 在網(wǎng)站上,還有一個(gè)關(guān)于提示工程的資源,如果你是這方面的新手,你可能會(huì)用得上。 另外,與DALL-E 2不同,你可以控制參數(shù)來(lái)影響結(jié)果,并對(duì)其保留更多的代理權(quán)。 Stability.ai已經(jīng)做了一切來(lái)促進(jìn)人們對(duì)模型的訪問(wèn)。OpenAI是第一個(gè),必須走得更慢,以評(píng)估模型固有的潛在風(fēng)險(xiǎn)和偏見(jiàn),但他們不需要將模型保持在封閉測(cè)試階段這么久,也不需要建立這樣一個(gè)限制創(chuàng)造力的商業(yè)模式。 Midjourney和Stable Diffusion都已經(jīng)證明了這一點(diǎn)。 安全 開源 > 隱私和控制 開源技術(shù)有其自身的局限性。 開放性應(yīng)該走在隱私和嚴(yán)格控制之前,但不應(yīng)該走在安全之前。 正如該公司在公告中解釋的那樣,它是「一個(gè)允許商業(yè)和非商業(yè)使用的許可」,重點(diǎn)是模型的開放和負(fù)責(zé)任的下游使用。它還強(qiáng)制要求衍生作品至少要受到同樣的基于用戶的限制。 開源模型本身是很好的模式,但如果我們不希望這項(xiàng)技術(shù)最終傷害人們,或以錯(cuò)誤信息的形式為互聯(lián)網(wǎng)增加更多的傲慢,建立合理的護(hù)欄也同樣重要。 「由于這些模型是在廣泛的互聯(lián)網(wǎng)搜刮的圖像-文本對(duì)上訓(xùn)練出來(lái)的,模型可能會(huì)重現(xiàn)一些社會(huì)偏見(jiàn),產(chǎn)生不安全的內(nèi)容,所以開放的緩解策略以及對(duì)這些偏見(jiàn)的公開討論可以讓大家參與到這個(gè)對(duì)話中來(lái)?!?/p> 在任何情況下,開放性 安全性>隱私和控制。 開源力量改變世界 憑借道德價(jià)值和開放性的堅(jiān)實(shí)基礎(chǔ),Stable Diffusion承諾在現(xiàn)實(shí)世界的影響方面超越其競(jìng)爭(zhēng)對(duì)手。 對(duì)于那些想下載它并在他們的電腦上運(yùn)行它的人來(lái)說(shuō),你應(yīng)該知道它需要6.9Gb的VRAM--這適合于高端消費(fèi)級(jí)GPU,使它比DALL-E 2要輕,但對(duì)大多數(shù)用戶來(lái)說(shuō)仍然是遙不可及的。其余的人,像我一樣,可以馬上開始使用Dream Studio。 Stable Diffusion 被普遍認(rèn)為是目前最好的AI藝術(shù)模型,它將成為無(wú)數(shù)應(yīng)用程序、網(wǎng)絡(luò)和服務(wù)的基礎(chǔ),重新定義我們?nèi)绾蝿?chuàng)造和與藝術(shù)互動(dòng)。 但現(xiàn)在,專門為不同使用情況設(shè)計(jì)的應(yīng)用程序?qū)念^開始建立,供所有人使用。人們正在增強(qiáng)兒童畫,用外畫 內(nèi)畫制作拼貼畫,設(shè)計(jì)雜志封面,畫漫畫,創(chuàng)造變形和動(dòng)畫視頻,從圖像中生成圖像,等等。 其中一些應(yīng)用在DALL-E和Midjourney中已經(jīng)成為可能,但Stable Diffusion可以推動(dòng)當(dāng)前的創(chuàng)意革命進(jìn)入下一個(gè)階段。用前特斯拉AI總監(jiān)、李飛飛高徒Andrej Karpathy的話說(shuō),就是讓「藝術(shù)創(chuàng)作進(jìn)入了人類 AI合作的新時(shí)代?!?/p> 像Stable Diffusion這樣的AI藝術(shù)模型涉及到一類新工具,應(yīng)該用我們所處的新現(xiàn)實(shí)的新思維框架來(lái)理解。我們不能簡(jiǎn)單地與其他時(shí)代進(jìn)行類比或平行對(duì)比,并期望能夠準(zhǔn)確地解釋或預(yù)測(cè)未來(lái)。 有些事情會(huì)相似,有些則不會(huì)。我們必須把這個(gè)即將到來(lái)的未來(lái)當(dāng)作未知的領(lǐng)域。 毫無(wú)疑問(wèn),Stable Diffusion的公開發(fā)布是人工智能藝術(shù)模型領(lǐng)域有史以來(lái)最重要和最有影響的事件,而這只是一個(gè)開始。 作者之一的Emad Mostaque在Twitter上說(shuō):'隨著我們發(fā)布更快、更好和具體的模型,預(yù)計(jì)質(zhì)量將繼續(xù)全面上升。不僅僅是圖像,下個(gè)月是音頻,然后轉(zhuǎn)向3D、視頻。語(yǔ)言、代碼,以及更多訓(xùn)練。 我們正處于一場(chǎng)為期數(shù)年的革命的邊緣,在我們互動(dòng)、聯(lián)系和理解藝術(shù),特別是一般的創(chuàng)造力的方式。而且不僅僅是在哲學(xué)、知識(shí)領(lǐng)域,而是作為現(xiàn)在每個(gè)人都分享和體驗(yàn)的東西。 創(chuàng)意世界將永遠(yuǎn)改變,我們必須進(jìn)行開放和尊重的對(duì)話,為所有人創(chuàng)造一個(gè)更好的未來(lái)。只有負(fù)責(zé)任地使用開源技術(shù),才能創(chuàng)造我們希望看到的變化。 參考資料: https://thealgorithmicbridge./p/stable-diffusion-is-the-most-important |
|
來(lái)自: 鄭飛3bbr5o1bk2 > 《繪畫》