現(xiàn)在是2點22分,跟朋友們打完LOL手游,準備倒頭就睡。 臨睡前,刷了一眼X。 然后,特么的,看到了一個消息,能給我震驚成傻逼的消息: OpenAI,發(fā)他們的文生視頻大模型,Sora了。。。。。 而且,是強到,能震驚我一萬年的程度。。。 https:///sora 如果非要用三個詞來總結(jié)Sora,那就是“60s超長長度”、“單視頻多角度鏡頭”和“世界模型” 我先放3個例子,再具體去說。 我的腦海中,突然冒出了《三體》中楊冬的一句話: “物理學,不存在了” 套用這句話。 那就是。 “現(xiàn)實,不存在了” 文本、圖片都已經(jīng)被AI攻占,而現(xiàn)在,AI視頻,這個人類最后的最堅固的堡壘,在OpenAI的Sora攻勢下,也已經(jīng)很難再分清,AI和現(xiàn)實的界限了。 什么以前的AI視頻工作流,全部成了往日泡影,全都滾犢子吧。 都TM跪下,都給OpenAI喊爸爸。 說回那三個最核心的特點: “60s超長長度”、“單視頻多角度鏡頭”,還有那個最核心的,“世界模型” 一. 60s超長長度 在一眾AI視頻,還掙扎在4s連貫性的邊緣,OpenAI,直接說: 勞資支持,60s,都TM跪下。 就,太特么嚇人了... 看這個case。 提示:一位時尚女性走在充滿溫暖霓虹燈和動畫城市標牌的東京街道上。她穿著黑色皮夾克、紅色長裙和黑色靴子,拎著黑色錢包。她戴著太陽鏡,涂著紅色口紅。她走路自信又隨意。街道潮濕且反光,在彩色燈光的照射下形成鏡面效果。許多行人走來走去。 60s,一鏡到底,而且不止主人物穩(wěn)定,連特么背景里面的人物,都穩(wěn)定的難以置信。從大中景無縫切換到臉部特寫。 這不是我對于AI視頻這個淺薄的理解能解釋的了的。 我完全不知道是如何能實現(xiàn)出來的,官網(wǎng)的解釋是: 等他們的技術文檔。 二. 單視頻多角度鏡頭 現(xiàn)在的AI工作流,都是單鏡頭單生成,一個視頻里面,有多角度的鏡頭,主體還能保證完美的一致性,這在以前,是無法想象的... 但是OpenAI直接一句Prompt,在一分鐘的鏡頭里,實現(xiàn)了多角度的鏡頭切換...而且...物體一致... 提示:一個美麗的剪影動畫展示了一只狼對著月亮嚎叫,感到孤獨,直到它找到狼群。 太特么嚇人了,一只狼對著月亮嚎叫,感到孤獨,直到它找到狼群。 孤獨。 這個詞,在這個視頻里,被描述的淋漓盡致。 而且,多鏡頭,無縫切換,而且每一個分鏡,都用的極其講究。。。 這就像其他家AI視頻,還在冷兵器作戰(zhàn),刀劍相拼,這玩意直接把超電磁炮掏出來了。。。然后一炮直接轟在大家大腦門上了。。。 三. 世界模型 我之前寫過一篇文章,聊過一些關于世界模型的話題。 在我的理解里,世界模型最難的,是收集、清洗數(shù)據(jù)。 Runway的世界模型,毫無動靜。 但是OpenAI的Sora,直接來了一波大的。 前面的視頻case,其實已經(jīng)能看出Sora,已經(jīng)能懂物理規(guī)律了。 比如這個Case: 提示:一只貓叫醒熟睡的主人,要求吃早餐。主人試圖忽視這只貓,但貓嘗試了新的策略,最后主人從枕頭下拿出秘密藏匿的零食,讓貓再呆一會兒。 這個視頻最離譜的在于... 貓在AI里...能踩奶了........這..........養(yǎng)貓的人,都一定深有感觸。。。 還有一個開車的case,吊打全世界所有AI視頻: 提示:鏡頭跟隨一輛帶有黑色車頂行李架的白色老式SUV,它在陡峭的山坡上一條被松樹環(huán)繞的陡峭土路上加速行駛,輪胎揚起灰塵,陽光照在SUV上飛馳。土路,給整個場景投射出溫暖的光芒。土路緩緩地蜿蜒延伸至遠方,看不到其他汽車或車輛。道路兩旁都是紅杉樹,零星散落著一片片綠意。從后面看,這輛車輕松地沿著曲線行駛,看起來就像是在崎嶇的地形上行駛。土路周圍是陡峭的丘陵和山脈,上面是清澈的藍天和縷縷云彩。 最后一個我也覺得很離譜的case: 提示:與中國龍一起慶祝中國農(nóng)歷新年的視頻。 這個真實的物理感覺,真的...我很希望他們是...過擬合了.... 因為之前跟某些大佬們聊,得到的信息是: '人經(jīng)歷過千萬年的進化,對于世界的常識,是藏在基因里的,會自動把一些冗余的信息以極快的速度,一步一步剔除直到只剩到最關鍵的信息,然后做做一些思考推斷。但是機器沒有,機器現(xiàn)在不懂抽象,所以需要人去做類似人類抽象化過程的學習算法,來抽離關鍵信息,收集視頻數(shù)據(jù)。' 收集數(shù)據(jù),是最難的。 而OpenAI,可能...解決了。。。 雖然他們表示,他們的世界模型,還有很多弊端... 但是... 寫在最后 一年的時間,OpenAI炸出來一個王炸。 一丁點消息不放,一丁點預熱沒有,直接王炸。 而且最騷的是,他們宣布,即將在今天晚些時候,更新技術論文: 一夜未眠,我在各大群里,看到的最多的幾句話是: “這怎么辦啊...” “都死吧” “這個行業(yè)要完蛋了...” 不僅僅是AI視頻行業(yè)...還有很多傳統(tǒng)的影視公司... 比如虛擬拍攝、比如特效、比如廣告.... 一將功成,萬骨枯。 我找不到更好的形容詞了。 就這樣吧,照這個AI發(fā)展速度,AGI應該很快了。 希望,這不是人類的落日。 以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉(zhuǎn)發(fā)三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章。 |
|