關(guān)于Sora,你應(yīng)該知道的一些事實 文\盧克文工作室嘉賓 星海艦長 最近,中國人還沒從過年的興奮中走出來,OpenAI就突然來了個王炸,發(fā)布了全球首款文生視頻模型——Sora。其最大特點,在于能夠根據(jù)文字指令,創(chuàng)造出宏大、精美且頗具想象力的作品,而且時長達到了1分鐘,是目前主流AI視頻工具好幾倍。 按照正常的思路,受Sora沖擊最大的,就是影視行業(yè)了,就像去年文生圖對繪畫和設(shè)計行業(yè)沖擊一樣。 但萬萬沒想到,Sora在中文輿論場上的沖擊,遠遠超出了影視業(yè)范疇。 打開抖音,各種各樣關(guān)于sora的短視頻紛至沓來,有的人哀嘆“完了完了,世界要顛覆了”,有的人反思“為啥搞出來的又是美國”,有的人販賣焦慮“你如果不懂Sora,下一個淘汰的就是你”,反正熱度一起來,各種真假難辨的消息紛至沓來。 那么,Sora到底情況如何?我們普通人如何抓住Sora帶來的機遇、并規(guī)避風(fēng)險呢? 1 在經(jīng)濟學(xué)界有一個經(jīng)典的賣鏟子故事,1848年,加州發(fā)現(xiàn)了金礦,無數(shù)淘金客蜂擁而至,大家都想淘到黃金,但也有少數(shù)聰明的人去了之后,并不是淘金,而是向淘金者賣鏟子。幾年過去了,真正淘到金子的人沒多少,反而是賣鏟子的人賺了大錢。 現(xiàn)在,賣鏟子的故事再次發(fā)生了。 在短視頻平臺只要搜索Sora,就會出來一大堆關(guān)于Sora的課程,有的說“24小時之內(nèi),我們上線了一款連國外都沒有發(fā)布的Sora課程,原價365,限時99”,甚至有一張Sora課程廣告(而且還是中文的),直接發(fā)在了山姆·奧特曼的X評論區(qū)。 估計奧特曼也一臉懵,我這Sora還沒發(fā)布啊,居然已經(jīng)有人賣課了?事實的確如此,目前,Sora并沒有向公眾開放,只官宣了技術(shù)文章和一些演示demo而已,暫時在官網(wǎng)上是找不到試用入口的,凡是教你怎么用sora的,現(xiàn)階段都是騙子。 而且這些demo也有不少bug,如一分鐘的東京街頭女郎漫步場景中,女郎走路過程中存在腿部變形、腿部交叉換位時錯亂等錯誤。 為啥奧特曼在Sora還不成熟的時候,著急忙慌地發(fā)布demo,但又不開放測試呢? 2月12日,奧特曼在會見阿聯(lián)酋中央銀行董事會主席阿勒納哈揚、軟銀董事長兼CEO孫正義以及來自臺積電的代表時,提出籌集5萬億美元~7萬億美元,用于提高全球芯片制造能力。這筆錢,相當(dāng)于年度美國軍費的8倍,可能是為了造勢,才在Sora還不成熟的時候發(fā)布了。 不過奧特曼沒想到,自己還沒弄到錢,中國賣鏟子的人,也就是賣Sora課的人反而先圈到錢了。 如果你花199買下了課包,他們會給你發(fā)一份文檔,里面包括Sora的介紹、生成的視頻、還包含大段其他媒體的解讀文章,這種內(nèi)容毫無營養(yǎng),網(wǎng)上到處都是,韭菜割了一茬又一茬,其中最著名的就是李一舟。 一年多前,清華大學(xué)博士李一舟賣課內(nèi)容還是關(guān)于個人IP商業(yè)變現(xiàn),直到2023年3月才開始發(fā)布人工智能、AI、ChatGPT等視頻,并開始直播賣起了AI課程。近期Sora大模型爆火后,李一舟又蹭上了熱點,賣起了sora課程,被網(wǎng)友稱為“中國AI教父”。 其實他壓根不是學(xué)計算機的,他這個博士也只是清華大學(xué)美術(shù)學(xué)院的博士而已。 蹭sora熱點賣課的不僅僅李一舟,發(fā)展到現(xiàn)在,賣課已經(jīng)發(fā)展到免費送課拉群,然后誘導(dǎo)付費的“套路”,甚至連“如何利用Sora焦慮賣課”,也成了賣的課程的一部分了。你學(xué)的不是Sora,而是利用Sora制造焦慮去賣課,一層套一層。 看來,懂Sora的人能不能通過Sora賺到錢還是未知數(shù),但不懂Sora技術(shù)的人,已經(jīng)利用Sora賺到錢了。再回想一下當(dāng)年區(qū)塊鏈、元宇宙、Web3.0等風(fēng)口出現(xiàn)時,賣課的似乎是同一撥人。 除了賣課,另一種賺錢方法就是賣賬號。 你去某二手平臺上搜索“Sora內(nèi)測”,能發(fā)現(xiàn)各種“內(nèi)測代申請”的帖子,但問題是,Sora還沒對公眾開放內(nèi)部測試權(quán)限。 OpenAI只說為了保證Sora的安全性,需要經(jīng)過紅隊安全測試之后再考慮面向公眾開放。所謂“紅隊”可以理解為模擬黑客團隊,募測的試者要求條件苛刻,必須同時擁有美國信用卡、美國居住地址、美國注冊的計算機設(shè)備以及非主機類IP地址,任何一個條件不符合都不行。 更關(guān)鍵的是,2月15日,OpenAI官網(wǎng)列出中國、俄羅斯、伊朗、朝鮮幾個所謂國家附屬行為AI威脅參與者,并終止相關(guān)OpenAI賬戶。 也就是說,任何一個中國IP都可能被封號,人家壓根不讓你參加內(nèi)測。賣課賺錢最起碼能給用戶一份注水的教程,而賣賬號的,這不是赤裸裸的詐騙么? 其實吧,更厲害的詐騙手段還有呢,那就是揚言要做國產(chǎn)版Sora,當(dāng)然,這主要是騙投資人的錢。 “做國產(chǎn)版Sora”具體咋弄呢?兩種方案。 第一種方案,是利用現(xiàn)有的工具包裝成Sora,同樣可以輸入文本內(nèi)容,生成出對應(yīng)的視頻,質(zhì)量雖然比不上Sora,但用來做個包裝,偽裝成自己研發(fā)的,還是可以的。 第二種方案,就是做個換殼,看起來是自研的Sora,但其實要調(diào)用Runway、Pika等國外文生視頻工具的接口,一樣能做到文生視頻的效果。 至于現(xiàn)在生成視頻的質(zhì)量沒法跟Sora相比,那也很好解釋,因為錢不夠,錢夠了,質(zhì)量就好了。但問題在于,無論哪種方案,和Sora的基本原理都不一樣,怎么能在后續(xù)迭代中趕上Sora?所以嚷嚷做國產(chǎn)版Sora的人,恐怕相當(dāng)一部分都是想短期騙點投資的,也許騙不了專業(yè)投資機構(gòu),但騙騙非專業(yè)投資者,已經(jīng)足夠用了。 最后一種騙局就是從外網(wǎng)扒下來視頻(實拍的),包裝成Sora做的,然后加上標(biāo)題副標(biāo)題發(fā)短視頻平臺,說電影行業(yè)要完蛋,中國人該怎么辦,通過制造焦慮,來賺點流量錢。 你看,雖然OpenAI還沒用Sora賺到錢,但中國已經(jīng)有不少聰明人通過炒作焦慮,發(fā)財了。 在輿論的熙熙攘攘中,驚嘆于Sora的強大沒問題,但也不要被輿論給嚇住了,否則你就成了別人的韭菜。 2 那么,我們普通人怎么趕上Sora的風(fēng)口,賺到錢呢? 首先,我們對Sora的原理要有個相對清晰的認(rèn)知,看不懂論文沒關(guān)系,Sora的技術(shù)來源之一的Transformer的參與研究者、上海交大天才少年、紐約大學(xué)助理教授謝賽寧已經(jīng)啃完了sora論文,對內(nèi)容做出了解讀,從中我們也許可以一探sora的究竟。 Sora為什么是一個顛覆性產(chǎn)品?因為它提出了一個全新的視頻生成思路:SpaceTime latent patch。 Sora是一個基于語言模型范式的視頻模型,語言模型我們其實已經(jīng)了解了,GPT就是。在GPT的自然語言處理中,token是指文本中最小的語義單元。比如,一個句子可以被分割成若干個單詞,每個單詞就是一個token。 比如,“我愛你”可以分割成三個token:“我”,“愛”和“你”。token可以幫助AI把文本分解成更容易處理和分析的部分。 所以,當(dāng)你打出“我”和“愛”時,AI就會猜測你想表達的真實含義,比如他會給你腦補“我愛你”“我愛吃飯”“我愛的人不愛我”等等,有點像輸入法的自動補全功能,這就是語言模型范式,通過上一個token,來猜測下一個token。 同樣的道理, Sora也是一個基于語言模型范式的視頻模型。 我們都知道,從去年的AI畫圖橫空出世后,AI繪畫和AI設(shè)計已經(jīng)被我們所知了,它可以利用繪畫模型來在神經(jīng)網(wǎng)絡(luò)中“拼湊”出一個畫面來。 但是,如何讓這個畫面動起來?在Sora之前,沒有特別好的大模型,雖然也有Runway Gen 2、Pika等工具問世,但效果非常一般,采取的大都是已知當(dāng)前幀,推測下一幀的算法,這種算法最大的限制就是沒法生成長視頻,因為往往推測著推測著就離題萬里了,上一秒你還在地上走,下一秒你就變成一只貓飛天上了。 而Sora最大的創(chuàng)新,是在論文中提出了一個SpaceTime latent patch的概念,你可以把它理解為一個“時空圖像塊”,每個“時空圖像塊”就相當(dāng)于語言模型的token。 通過對這一個個“時空圖像塊”運行現(xiàn)象的深度學(xué)習(xí),Sora理解了世界運行的邏輯。知道了這個邏輯,Sora就知道了人走路是左腳右腳交替行走,知道汽車要行駛在大地上而不是空中等等。 正是靠著這種對世界運行邏輯的理解,Sora才能生成出“一致性”相對強的視頻,讓人能感受到這是一個真實的畫面。 現(xiàn)在這種技術(shù)用在了生成視頻當(dāng)中,顛覆的是影視行業(yè),那如果用在了其他行業(yè)呢?這次Sora 只是小試牛刀,它展現(xiàn)的不僅僅是一個視頻制作的能力,它展現(xiàn)的是大模型對真實世界有了理解和模擬之后,會帶來新的成果和突破。 別忘了,人之所以能干很多機器干不了的事情,在于人能通過視覺看到圖像并做出判斷,然后做出對應(yīng)的反應(yīng),無論你開車,還是打螺絲,無論是你掃地,還是射擊,都是如此。 那么,如果把Sora接上攝像頭,讓他看遍這個世界上所有的視頻,甚至接入全球的監(jiān)控攝像頭網(wǎng)絡(luò)之后,會是什么效果? 在超大數(shù)據(jù)量的訓(xùn)練之中,Sora對世界運行邏輯的理解,會遠遠超過文字學(xué)習(xí),一幅圖勝過千言萬語,而視頻傳遞的信息量又遠遠超過一幅圖,那么Sora會進步成什么樣? 了解了Sora的原理,我們也就能夠分析,到底Sora會給哪些行業(yè)帶來變革,也就能夠有針對性地進行相應(yīng)的投資規(guī)劃。 從短期來說,最直接的獲利渠道就是股票。自從Sora發(fā)布后,港股AIGC概念一路走高。2月16日收盤時,港股AIGC指數(shù)的54家成份股中,有44家上漲。 而隨著Sora在未來經(jīng)過測試后發(fā)布,以Sora為代表的文生視頻模式,有望繼2023年GPT概念股爆火后,繼續(xù)成為新一年的熱門投資方向。 除了股票,你也可以去買個如何利用Sora賣課的課包,然后擊鼓傳花往下賣,還是有利可圖的,當(dāng)然這屬于割韭菜,并不光彩。 而且這樣做的人多了,市場必然稀釋,所以你可以另辟蹊徑,提前著手在應(yīng)用端賺錢。 比如,等Sora正式發(fā)布后,利用你的想象力,把現(xiàn)有的名著文本改編成Sora能聽懂的“提示詞”,然后用Sora做成視頻,剪輯上傳到視頻網(wǎng)站,賺廣告分成。 至于版權(quán)也不用擔(dān)心,著作權(quán)過期的名著比比皆是,國內(nèi)的《西游記?》、《水滸傳?》以及國外的《基督山伯爵?》、《巴黎圣母院?》、《福爾摩斯?》等等都是,只要你的想象力夠強大,寫出的提示詞更準(zhǔn)確更科學(xué),你就能先人一步用Sora賺到錢。 除此之外,雖然Sora對演員和特效師非常不利好,但卻利好編劇行業(yè),劇本、提示詞創(chuàng)作力在未來會成為核心競爭力。如果你擁有非常強大的提示詞創(chuàng)作能力,那么承接當(dāng)前火爆的短劇行業(yè)的外包視頻制作業(yè)務(wù),也是一個本小利大的路子。 如果你不是普通人,而是有一定資源的投資者,那么你在理解了Sora的基本原理后,也就會明白哪些行業(yè)會產(chǎn)生變革,進而做出投資決策。 比如,Sora相比GhatGPT來說,它的訓(xùn)練素材包括大量的視頻,視頻可比圖文更吃算力,所以硬件太重要了,在美國對華進行AI計算卡禁運的狀態(tài)下,國內(nèi)GPU企業(yè)正在不斷涌現(xiàn),一些頭部企業(yè)有很強的投資價值。 而且因為視頻需要的算力非常大,現(xiàn)有的算力未必夠,所以芯片還需要繼續(xù)進化,目前的硅基芯片肯定是不夠的,而傳說中的碳基芯片在能耗和制程工藝方面具備獨特的優(yōu)勢,在未來可能會取代現(xiàn)有的硅基芯片,成為主流。 所以在未來,硬件依然是重要的投資方向。 再比如,Sora正式發(fā)布后,必將帶來視頻行業(yè)的大爆發(fā),手里掌握大量可以改編為視頻的IP資源的企業(yè),就成了香餑餑。此外,Sora 1分鐘左右視頻自動生成的長度,天然契合短劇時長,非常利好短劇出海,甚至可以在國內(nèi)拍攝之后,可以用AI換臉成白人臉,進行低成本拍攝。 還有,Sora對物理世界的模擬,會給諸多依靠計算機視覺的產(chǎn)業(yè)帶來革命性進步,像AI自動駕駛,過去的自動駕駛技術(shù)過度強調(diào)感知層面,依靠激光雷達、攝像頭傳回的數(shù)據(jù),從大數(shù)據(jù)和算法中尋求答案再做出駕駛決策。 人的駕駛,是建立在了認(rèn)知層面,知道對方的速度、距離自己多遠、車道在哪里而做出的自主決策。那么一旦Sora通過圖像識別認(rèn)識到了真正的駕駛邏輯,毫無疑問就可以做出真正類似人類的駕駛行為。 此外,還有制造業(yè)企業(yè)可以依靠Sora配上攝像頭和機械臂對產(chǎn)品進行智能化制造,幫助企業(yè)對生產(chǎn)過程進行高精度的質(zhì)量檢測,確保產(chǎn)品符合嚴(yán)格的規(guī)格標(biāo)準(zhǔn),甚至幫你識別質(zhì)量問題的根本原因等等。 現(xiàn)在知道為什么360老總周鴻祎這么推崇Sora了吧?他認(rèn)為現(xiàn)在的Sora的問世,已經(jīng)標(biāo)志著AI從AIGC(人工智能生成內(nèi)容),向AGI(人工智能通用)發(fā)展了,AGI的實現(xiàn)可能不是10年20年的問題,而是在一兩年很快就可以實現(xiàn)(當(dāng)然,這個判斷不一定對)。 在輿論的熙熙攘攘中,最終還是要看懂技術(shù),看清Sora帶來的變革,投資這些變革,才是最清醒的選擇。 |
|