一代人的時間之內會有幾次出現這樣的產品:一項技術從工程部地下室的熒光陰暗處、書呆子的腥臭臥室、業(yè)余愛好者的孤獨洞穴中,直接變成你的七大姑八大姨(great-aunt Edna)都知道怎么用的玩意兒。 早在1990年就出現了網絡瀏覽器,但直到1994年網景瀏覽器(Netscape)的出現,大多數人才真正發(fā)現了互聯網;在2001年 iPod 首次亮相之前就有了 MP3 播放器,但這些前輩們并沒有引發(fā)數字音樂革命;而在蘋果于2007年推出iPhone之前也有智能手機,但在iPhone之前,并沒有如今這樣豐富的應用程序生態(tài)。 2022年11月30日,人工智能迎來了或許是屬于自己的“網景瀏覽器”時刻。 迎來這一時刻的是 OpenAI 的首席執(zhí)行官山姆·奧特曼(Sam Altman)。OpenAI 是一家位于舊金山的人工智能公司,成立于2015年,得到了一批硅谷重量級人物的資金支持,包括伊隆·馬斯克、彼得·蒂爾和貝寶幫,以及領英(LinkedIn)聯合創(chuàng)始人里德·霍夫曼(Reid Hoffman)。
去年11月30日,在公司成立約7年后,奧特曼在推特上說:“今天我們推出了ChatGPT,可以在這里試著與它交談?!?/p> 隨后的鏈接可以讓任何人注冊一個賬戶,開始免費與 OpenAI 的新穎聊天機器人對話。任何一個人都會這樣做,而且不僅僅是為了聊天氣。 一家軟件公司的首席執(zhí)行官兼工程師阿姆賈德·馬薩德要求 ChatGPT 對自己的代碼進行調試,這個 AI 做到了; 吉娜·霍莫卡是一位美食博主和影響者,讓 ChatGPT 寫一份健康巧克力餅干的食譜; Scale AI (譯注由麻省理工輟學的華裔天才少年創(chuàng)辦的提升數據標注效率的公司)的工程師萊利·古德賽德讓 ChatGPT 為《宋飛傳》(Seinfeld,譯注:知名美?。懸患瘎”?; 蓋伊·帕森斯則是一名營銷人員,他還經營著一個專門介紹人工智能藝術的在線畫廊,他讓人工智能為自己寫提示,以輸入另一個人工智能系統(tǒng) Midjourney,后者根據文本描述創(chuàng)建圖像; 斯坦福大學醫(yī)學院的皮膚科醫(yī)生羅克薩納·達內什尤(也在研究人工智能在醫(yī)學中的應用,她向人工智能提出了醫(yī)學問題; 而很多學生用ChatGPT來做家庭作業(yè)······ 上述這些應用場景,僅僅是在聊天機器人發(fā)布后的頭24小時之內出現的。以前也有過聊天機器人,但不是這個樣子的。ChatGPT 可以進行長篇的、流暢對話,回答問題,并編寫任何一個人所要求的幾乎任何類型的書面材料,包括:商業(yè)計劃書、廣告活動、詩歌、笑話、計算機代碼和電影劇本。 ChatGPT 遠非完美,其結果并不總是準確的。不能引用其信息來源;幾乎不知道2021年以后發(fā)生的任何事情;而且它所提供的東西,雖然通常足夠順利地通過高中課程甚至是大學課程,卻很少像人類專家所能提供的那樣精煉。 而另一方面,ChatGPT 在大約一秒鐘內就能完成這些內容。通常情況下,用戶側幾乎不需要提供任何具體的知識,而且它吐出的很多內容質量也不差。在發(fā)布后的5天內,有超過100萬人就使用過了 ChatGPT,這是 Facebook 最初花了10個月才達到的里程碑。 在過去十年中,人工智能技術已經穩(wěn)步進入了商業(yè)領域,并悄悄地改進了我們每天使用的許多軟件,但卻沒有引起非技術專家人群的興奮,而 ChatGPT 改變了這一點。 突然間,每個人都在談論人工智能如何顛覆他們的工作、公司、學校和生活。 ChatGPT 是人工智能技術浪潮的一部分,這些技術被統(tǒng)稱為“生成性人工智能”(generative AI),其中還包括像 Midjourney 和 Lensa 這樣熱鬧的藝術生成器;而 OpenAI 處于科技行業(yè)下一個大事件的前沿,具有創(chuàng)業(yè)史詩的特征,包括全明星陣容和投資者的狂熱,據說它的估值已達到290億美元。 即使最近的耀眼崛起激起了人們的羨慕、好奇和恐懼,比如谷歌,其利潤豐厚的搜索帝國可能會受到影響,據說在公司內部宣布了“紅色警報”狀態(tài),以應對 ChatGPT,但 OpenAI 也不太可能進入科技超級巨頭俱樂部。 直到幾年前,OpenAI 還根本不是一個公司,而是一個致力于學術研究的小型非營利性實驗室。有著崇高的創(chuàng)始原則,比如:保護人類免受無限制的人工智能的危險,仍然存在于其使命和愿景中。之后,OpenAI 經歷了一次內部轉型,使其原來的員工發(fā)生了分裂,并使其更加關注商業(yè)項目而不是純科學。 一些批評者認為,將 ChatGPT 釋放到“野外”本身就很危險,這也是 OpenAI 的原則發(fā)生深刻轉變的一個標志。 在本周對外宣布的與微軟擴大合作關系,其中就包括高達 100 億美元的新資本,可能會導致這家軟件巨頭在未來幾年內獲得 OpenAI 的大部分利潤。這筆交易可能會加深人們的看法,即曾經的理想主義努力現在主要關注的是賺錢。 盡管如此,《財富》雜志看到的文件顯示,OpenAI 的業(yè)務目前是多么的無利可圖。 37歲的聯合創(chuàng)始人兼首席執(zhí)行官奧特曼,就體現了 OpenAI 令人困惑的性質。奧特曼是一位連續(xù)創(chuàng)業(yè)的科技企業(yè)家,更多的是以商業(yè)智慧而非工程成就而聞名,他既是 OpenAI 估值飆升的設計師,也是其首席執(zhí)行官,他公開表示 ChatGPT 離真正的可靠性還有很遠。 同時,他認為這項技術是他更全面的、充滿幻想的公司使命中的一步,即開發(fā)一種被稱為人工通用智能(Artificial General Intelligence,縮寫為AGI,或稱為強人工智能)的計算機超級智能。奧特曼在去年7月發(fā)推文說:“AGI 可能是人類生存的必要品。我們面臨的問題似乎太大,沒有更好的工具我們無法解決?!?/p> 對于一個目的是要賺錢的企業(yè)來說,這是一個不尋常的指導思想,特別是考慮到一些計算機科學家將奧特曼的癡迷視為幻想。加州大學伯克利分校的計算機科學家本·雷希特說:“AGI實在是太傻了。我的意思是,它不是一個(完整的)東西?!?/p> 然而,通過ChatGPT,奧特曼已經將 OpenAI 和更深入的人工智能任務變成了吸引科技界的東西。問題是他與微軟建立的合作關系能否彌補 ChatGPT 的缺陷,并利用其早期的領先優(yōu)勢來改變科技行業(yè)。 谷歌和其他巨頭正在努力開發(fā)屬于他們自己的人工智能平臺;而未來更完善的軟件可能會讓ChatGPT 看起來像小孩子的游戲。OpenAI 可能有一天會發(fā)現:就像網景公司短暫的瀏覽器行業(yè)統(tǒng)治地位一樣,它的突破為自身并不在其中的未來打開了一扇門。 吞噬幾乎所有數據的巨獸今年 1月中旬的一個星期四晚上,在舊金山,奧特曼罕見地公開露面。這位首席執(zhí)行官身穿灰色毛衣、藍色牛仔褲和一雙色彩鮮艷的、鞋帶經過特別染色的運動鞋,走進一個由投資者、技術人員和記者組成的房間,他們都聚集在一起,正在收集關于 ChatGPT 或即將到來的一輪融資的任何信息。 當他的采訪者,專注于風險投資的媒體公司 StrictlyVC 的創(chuàng)始人康妮洛·伊索斯問他關于媒體的強烈反響時,奧特曼回答說:“我不看新聞,我也不怎么做諸如此類的事情?!?/p> 在 Salesforce 大廈46層的活動現場站滿了人。在采訪前舉行的金融技術小組會議上,一位發(fā)言人甚至告訴大家,她知道他們“都在等待山姆·奧特曼?!?/p> 但是,盡管如此嘈雜,還有廣為流傳的關于微軟注資的傳言,奧特曼似乎不遺余力地抑制著人群的興奮。他告訴大家:“這些技術的一個奇怪之處在于,它們令人印象深刻,但并不穩(wěn)定。所以在首次演示中使用這些技術;你就會有這種非常令人印象深刻的感覺,'哇,這太不可思議了,可以投入使用了(類似這樣的反應)’。但是你體驗它一百次,你就會看到它的弱點?!?/p> 這種謹慎似乎是 OpenAI 的官方模式,OpenAI 的總部位于舊金山教會區(qū)(譯注:Mission District,又稱拉丁區(qū),是舊金山城內最古老的區(qū)域)的一個原行李箱工廠。事實上,如果ChatGPT 是人工智能的網景瀏覽器時刻,那么它是一個幾乎未能發(fā)生的時刻,因為OpenAI 在幾個月前差一點就關閉了這個項目。 最初,OpenAI 設想了一個允許用戶以簡單直白的英語(或許多其他語言)與人工智能交談的聊天界面,這是改進其“大型語言模型”(Large Language Models,縮寫為LLM)的一種方式。大多數生成式人工智能系統(tǒng)的核心都是 LLM。 這種模型是采用規(guī)模非常大的神經網絡,并將其應用于大量人類創(chuàng)造的文本,簡而言之,這是一種相當松散的、基于人腦連接的人工智能。 從人類創(chuàng)造的文本庫中,這種語言模型學習到了一張復雜的、基于統(tǒng)計可能性的“圖”。所謂統(tǒng)計可能性,是指任何一組詞在任何給定的上下文語境中出現在一起的可能性。這使得大型語言模型能夠執(zhí)行大量的自然語言處理任務,比如:從翻譯、總結或寫作。 OpenAI 已經創(chuàng)造了世界上最強大的大型語言模型之一。它被稱為 GPT-3,已經吸收了超過1750億個連接,并在大約三分之二的互聯網內容、所有的維基百科和兩個大型書籍數據集上進行了訓練。 但 OpenAI 發(fā)現,要讓 GPT-3 準確地產生用戶想要的東西,可能很困難。一個團隊想到了使用強化學習來完善模型。強化學習是指人工智能系統(tǒng)以追求獎勵最大化為目標,從試驗和錯誤中學習。 這一團隊認為:聊天機器人可能是這種方法的最佳候選者,因為以人類的對話形式提供了持續(xù)反饋,將使人工智能軟件很容易知道它哪里做得很好,又在哪里需要改進。 因此,在2022年初,團隊開始構建后來的 ChatGPT。 當一切就緒時,OpenAI 讓測試者玩 ChatGPT。但根據 OpenAI 聯合創(chuàng)始人、現任總裁格雷格·布洛克曼(Greg Brockman)說:測試者們并沒有像 OpenAI 所希望的那樣接受 Chat GPT;人們并不清楚自己應該和聊天機器人談些什么。 有一段時間,OpenAI 換了個方向,試圖建立可以幫助特定領域專業(yè)人士的專家級聊天機器人。但這一嘗試也遇到了問題,部分原因是 OpenAI 缺乏正確的數據來源來訓練專家級機器人。布羅克曼說,幾乎是在不幸中的萬幸情況下,OpenAI 決定將 ChatGPT 放到外部世界,直接供公眾使用。 布羅克曼說:“我承認,我當時基本上不知道這樣做是否會成功?!?/p> 公司高管們堅持認為,聊天機器人瞬間進入病毒傳播讓 OpenAI 措手不。OpenAI的首席技術官米拉·穆拉提(Mira Murati)說:“這絕對令人驚訝?!?/p> 奧特曼說,在舊金山的風險投資活動中,他“本來以為一切東西都會少一個數量級,比如少一個數量級的媒體炒作?!?nbsp;
ChatGPT 并不是 OpenAI 唯一的被炒作產品和話題,OpenAI 相對較少的300名員工在創(chuàng)造而非簡單分析數據方面,推動了人工智能所能做到的新極限。DALL-E 2 是 OpenAI 的另一項創(chuàng)造,它允許用戶僅僅通過輸入幾個字,就創(chuàng)造出用戶想象得到的任何東西的逼真圖像。 這一人工智能系統(tǒng)現在已經被其他公司所效仿,包括 Midjourney 和一個名為 Stability AI 的開源競爭者。當然所有這些圖像生成器都有缺點,最明顯的是它們傾向于放大它們所訓練的數據中的偏見,產生的圖像可能具有種族主義和性別歧視的味道,當然這并不是主觀惡意導致的。 通過對 GPT LLM 的代碼進行微調,OpenAI 還創(chuàng)建了 Codex,這是一個可以為程序員編寫代碼的系統(tǒng),程序員只需用普通的自然語言指定自己希望用代碼做什么。而更多的創(chuàng)新即將到來。OpenAI 有一個更強大的大型語言模型(LLM)正在進行測試,名為 GPT-4,預計將在今年發(fā)布,甚至可能馬上發(fā)布。 奧特曼還表示,OpenAI 正在開發(fā)一個可以從文本描述中自動生成視頻的系統(tǒng)。同時,在今年1月中旬,OpenAI 表明自己打算發(fā)布 ChatGPT 的商業(yè)版本,宣布了一個等候列表,讓潛在客戶通過一個界面注冊付費使用這款機器人,這將使客戶更容易將聊天機器人整合到自己的網絡產品和服務中。 微軟撿了個便宜持懷疑論的人可能會認為,OpenAI正在進行一輪大規(guī)模的融資,這個背景可能與ChatGPT的發(fā)布時間有關系,而 OpenAI 官方說時間是巧合的。 可以肯定的是,ChatGPT攪動了充滿鯊魚的水域。ChatGPT 在希望搶購 OpenAI 股份的風險投資公司中掀起了一股投喂狂潮,他們的目標就是 OpenAI 高管、員工和創(chuàng)始人目前持有的股權。 風投機構慷慨的報價,與剛剛宣布的微軟新投資同步進行,微軟將向該公司注入高達 100 億美元的新資本。微軟在 2016 年開始與 OpenAI 合作,與這家初創(chuàng)公司建立了戰(zhàn)略伙伴關系,并在三年前宣布向這家公司投資 10 億美元。 據熟悉新投標報價的消息人士稱,這種不尋常的結構給了微軟很大的財務優(yōu)勢。根據《財富》雜志看到的文件,在完成新的投資后,在 OpenAI 的第一批投資者賺回他們的初始資本后,微軟將有權獲得 OpenAI 75%的利潤,直到它賺回自己所投資的130億美元,這個數字包括早先對 OpenAI 的20億美元投資,在《財富》雜志于1月份報道之前,這個數字還沒有對外披露過。 此后,微軟的份額將降至49%,直到這家軟件巨頭賺取 920 億美元的利潤。同時,其他風險投資者和 OpenAI 員工也將有權獲得 OpenAI 49% 的利潤,直到他們賺到大約1500億美元。如果這些上限被觸及,微軟和投資者的股份將歸還給 OpenAI 的非營利基金會。實質上,OpenAI 是在把自己借給微軟,至于借多久,取決于 OpenAI 能以多快的速度賺到錢。 但賺回其投資,更不用說達到這些上限,可能需要相當長的時間?!敦敻弧冯s志看到的文件顯示:到目前為止,OpenAI 的收入相對較少,而且嚴重虧損。文件顯示,去年該公司預計將獲得不到 3000 萬美元的收入。但在計算和數據方面的支出大約為 4.1645 億美元,在員工方面的支出為 8931 萬美元,還有 3875 萬美元的未指明用途的其他運營費用。 總的來說,OpenAI 在 2022 年的凈虧損不包括員工股票期權,預計為 5.445 億美元。而有了 ChatGPT 之后,虧損可能還會飆升。奧特曼在 Twitter 上回答伊隆·馬斯克的問題時說,用戶與 ChatGPT 的每一次互動都會給 OpenAI 帶來 “幾美分”(個位數)的運算成本,而隨著聊天機器人的普及,總計價格每月可能會達到數百萬美元。 OpenAI 預計,隨著 ChatGPT 成為能夠吸引客戶的“汽笛”,其收入將迅速攀升。根據這些文件,2023 年的預期收入為 2 億美元,2024 年則將超過 10 億美元。但這些文件沒有預測 OpenAI 的支出可能如何增長,以及何時能實現盈利。OpenAI 和微軟拒絕對這些數字發(fā)表評論,但兩家公司指向了一個明顯的現實:OpenAI 和微軟都認為,這個前非營利性實驗室現在有了可以出售的東西。 微軟已經從伙伴關系中獲得了回報。微軟已經在自己的 Azure 云中推出了一套基于 OpenAI 的工具和服務,這將使 Azure 客戶能夠使用 OpenAI 的技術,包括 ChantGPT 和 DALL-E。 例如,汽車市場 CarMax 已經推出了在這些 Azure 工具上運行的新服務。
微軟人工智能平臺公司副總裁埃里克·博伊德(Eric Boyd)說,滿足訓練以及運行 OpenAI 的大型語言模型的需求,推動了微軟云服務的創(chuàng)新,從而使所有 Azure 客戶受益。 例如,微軟已經為人工智能建立了自認為是世界上最強大的超級計算機集群,并創(chuàng)造了一些軟件創(chuàng)新,使其更容易在這些機器上訓練和運行大型人工智能模型。 微軟正在逐步將 OpenAI 的技術注入自身旗下的大部分軟件中,微軟已經在搜索引擎 Bing 中發(fā)布了一個圖像創(chuàng)建器,以及新款 Designer 平面設計工具,這兩者都由 DALL-E 驅動;而在 Power Apps 軟件中發(fā)布了一個支持GPT-3的工具,以及一個基于 OpenAI 的 Codex 模型的代碼建議工具 GitHub Copilot。 晨星公司(Morningstar)負責科技股研究的高級股票研究分析師丹·羅曼諾夫(Dan Romanoff)說,即使 OpenAI 不能立即推動 Azure 的收入,與 OpenAI 的關系也是良好的品牌定位和營銷。 他說:“這是很引人注目的。將 OpenAI 開發(fā)的人工智能解決方案放在Azure上,稱之為 Azure 人工智能的能力,這讓他們保持了競爭力。” 微軟在云計算方面對手,比如:谷歌、AWS、IBM、甲骨文、Salesforce和其他公司,都有自己的“認知”服務,但是,與 ChatGPT 的創(chuàng)始人們有聯系也無妨。 對微軟來說,更大的收獲可能是在搜索方面。關注科技行業(yè)的新媒體《The Information》最近報道說:微軟計劃將 ChatGPT 整合到 Bing 中,可能是會允許 ChatGPT 對查詢返回簡單、簡潔的答案,讓人們通過與聊天機器人對話進一步獲取信息,而不是得到傳統(tǒng)的鏈接列表。 谷歌目前在搜索市場上占主導地位,在全球擁有超過 90% 的市場份額。Bing 排在第二位,但完全不是一個量級,大約只有 3% 的份額。在2022年的前九個月,搜索為谷歌帶來了1200 億美元的收入;總體而言,搜索業(yè)務占到了谷歌收入的 60% 左右。 ChatGPT 可能為微軟提供了唯一真正的機會,使其有可能將谷歌從這個寶座上打下來。微軟拒絕對《The Information》的報道發(fā)表評論。 按照微軟的標準,這些好處是很便宜的。其 130 億美元的總投資是一筆巨款,但只占其在過去12個月中所獲得的 850 億美元稅前利潤的 15%,而對于一個能改變模式的技術,擁有其近期控制權來說,這是一個相對便宜的交易。 但就另一方而言,OpenAI 和奧特曼有可能付出不同的代價:微軟的優(yōu)先事項可能會排擠掉他們自己的優(yōu)先事項,使他們更全面的使命面臨風險,并疏遠那些推動其獲得當前成功的科學家。 OpenAI的名人效應2015年7月的一個晚上,時任著名創(chuàng)業(yè)公司孵化器 Y Combinator 負責人的奧特曼在門洛帕克瑰麗酒店(Rosewood Sand Hill)舉辦了一場私人晚宴,這家豪華的牧場式酒店位于門洛帕克谷的風險投資行業(yè)中心,伊隆·馬斯克也在那里。 布羅克曼也在現場,他當時是麻省理工學院的一名輟學生,26歲,曾在支付處理方面的初創(chuàng)公司 Stripe 擔任首席技術官。一些與會者是經驗豐富的人工智能研究人員,有些人幾乎沒有任何機器學習的相關背景。 但他們所有人都相信AGI(Artificial General Intelligence,通用人工智能或強人工智能)是可能的。他們也對此很憂慮。 谷歌剛剛收購了總部位于倫敦的神經網絡創(chuàng)業(yè)公司 DeepMind,這是在奧特曼、馬斯克和其他科技業(yè)內人士看來能率先開發(fā)出 AGI 的最大熱門。如果 DeepMind 獲得成功,谷歌可能會壟斷這項無所不能的技術。瑰麗酒店晚宴的目的是討論組建與之匹敵的實驗室,以確保這種情況不會發(fā)生。 這個新的實驗室旨在成為 DeepMind 和谷歌所不具備的一切,將以非營利組織的形式運作,明確致力于將先進人工智能帶來的利益民主化。它承諾將公布其研究,并開放其所有的技術的源代碼,而且名字里就包含了對透明度的承諾:OpenAI。 這個實驗室獲得了令人印象深刻的捐贈者名單:不僅是馬斯克,還有他在 PayPal 的同事蒂爾和霍夫曼;奧特曼和布羅克曼;Y Combinator 聯合創(chuàng)始人杰西卡·利文斯頓;奧特曼建立的基金會 YC Research;印度IT外包公司印孚瑟斯(譯注:Infosys,其創(chuàng)始人是現任英國首相蘇納克的岳父);以及亞馬遜網絡服務(AWS)。 這些創(chuàng)始捐贈者共同承諾向這家理想主義的新企業(yè)捐贈10億美元。盡管根據稅務記錄,非營利組織只收到了引人注目的承諾數額中的一小部分。 但訓練巨大的神經網絡很快就被證明是昂貴的,計算成本達到數千萬美元,而且人工智能研究人員的薪資也不便宜。伊爾亞?蘇茨克維(Ilya Sutskever)是一位出生在俄羅斯的科學家,他在谷歌工作后來到 OpenAI 擔任首席科學家,根據稅務記錄,他在實驗室的頭幾年年薪為190萬美元。 幾年后,奧特曼和 OpenAI 的其他人得出結論,為了與谷歌、Meta 和其他科技巨頭競爭,這家實驗室無法繼續(xù)作為一個非營利組織運作。奧特曼在2019年告訴《連線》雜志:“我們要成功完成任務所需的資金量,比我原先想象的要巨大得多?!?/p> 設立一個營利性部門可以使 OpenAI 籌集風險資本。但 OpenAI 創(chuàng)建了一個不尋常的結構,將投資者的回報限制在其初始投資的數倍而已。而且,OpenAI 的非營利性董事會由硅谷知名人士組成,將保留對 OpenAI 知識產權的控制權(見下列組圖)。馬斯克是一個沒有留下來的名人:2018年,他離開了董事會,理由是需要經營 SpaceX 和更重要的特斯拉。
大約就在這個時候,微軟首席執(zhí)行官薩蒂亞·納德拉(Satya Nadella)急于證明:他的公司雖然被外界認為在人工智能領域落后于競爭對手,但可以在技術前沿發(fā)揮作用。微軟公司曾試圖聘請一位大名鼎鼎的人工智能科學家,但沒有成功。微軟還在建立一個巨大的、昂貴的專用芯片集群,以推進自己在語言模型方面的努力,這正是 OpenAI 所需要的超級計算能力,而當時微軟正花費巨資購買。 OpenAI 擅長于完成納德拉所希望的那種華麗的人工智能,以展示微軟的人工智能智慧。奧特曼與納德拉進行了接觸,多次飛往西雅圖,向他展示 OpenAI 的人工智能模型。納德拉最終簽署了一項協議,并在2019年7月宣布,使微軟成為 OpenAI 技術商業(yè)化的“首選合作伙伴”,同時向這家人工智能初創(chuàng)公司提供 10 億美元的初始投資。 雖然奧特曼從一開始就參與了 OpenAI,但他直到 2019年5月才成為首席執(zhí)行官,也就是在OpenAI 轉換為營利性企業(yè)之后不久。不過,從研究實驗室到數十億美元的軌跡,反映了奧特曼獨特的籌款能力和以產品為導向的關注力,以及這些商業(yè)本能和他對更大的、科學驅動的創(chuàng)意的承諾之間的密切關系。 這位 OpenAI 的領導者在某種程度上就是硅谷人漫畫形象:年輕、男性、臉色蒼白;眼睛從來不眨,使用流利的極客語言,癡迷于最大化的效率和生產力;是一個致力于“改變世界”的工作狂人。 在2016年《紐約客》的一篇簡介文章中,他說自己并沒有阿斯伯格綜合癥,但他可以理解為什么外界會認為他有。 奧特曼從斯坦福大學的計算機科學學位課程中輟學,共同創(chuàng)辦了 Loopt,這是一家社交媒體公司,同名應用程序會告訴你朋友在哪里。這家公司在 2005 年進入了 Y Combinator的第一批創(chuàng)業(yè)公司;Loopt未能起飛,但奧特曼在出售時賺到的錢,幫助他進入了風險投資領域。 他成立了自己的小型風險投資公司,名為Hydrazine Capital,籌集了約2100萬美元,包括來自彼得·蒂爾的資金。然后,保羅·格雷厄姆和利文斯頓,也就是 Y Combinator 的聯合創(chuàng)始人,把他請來作為格雷厄姆的繼任者來管理YC。 奧特曼是一位企業(yè)家,而不是科學家或人工智能研究人員,他以特被擅長籌集風險投資資金而聞名。他相信偉大的事情來自于巨大的野心和堅定的自信心,他說他渴望通過所謂的深層技術游戲,創(chuàng)造數萬億美元的經濟價值,尤其是在核聚變和量子計算等領域,這些領域的成功幾率不是很高,但回報率可能很大。 曾在 Loopt 與奧特曼共事的資深科技投資者和創(chuàng)業(yè)公司顧問馬克·雅各布斯坦(Mark Jacobstein)說:“山姆·奧特曼相信他在他所做的每一件事上都是最好的。我很確定他相信自己才是整個辦公室里最好的乒乓球運動員,直到他的信念被證明是錯誤的?!?/p> 據幾位現任和前任 OpenAI 內部人士稱,隨著奧特曼的掌權,這家初創(chuàng)公司的優(yōu)先事項開始變化。曾經全面的研究議程縮小了,主要集中在自然語言處理上。公司的首席科學家蘇茨克維和奧特曼為這一轉變辯護說:他們在目前看來最有希望實現 AGI 的研究領域,做出了最大努力。但一些前雇員說,在微軟最初的投資之后,專注于 LLM 的內部壓力大大增加,部分原因是此類模型有直接的商業(yè)應用。 一些人抱怨說,OpenAI 的成立是為了不受企業(yè)的影響,但它很快就變成了一個巨大的技術公司的工具。一位前雇員說:“我們的重點是如何創(chuàng)造產品,而不是試圖回答最有趣的問題。”和許多接受采訪的人一樣,這位員工要求匿名,因為有保密協議,也是為了避免疏遠與 OpenAI 有關的強大人物。 OpenAI 也變得不那么開放了。OpenAI 已經開始從公布所有研究和開源代碼的承諾中抽身,理由是擔心自己的技術可能被濫用。但據前雇員說,商業(yè)邏輯在其中也起了作用。通過且僅僅通過 API 提供其 LLM 服務,OpenAI 保護了自己的知識產權和收入來源。 另一位OpenAI前雇員說:“(奧特曼)和(布羅克曼)對'人工智能安全’有很多口頭承諾,但這似乎只是商業(yè)考慮的假象,而實際的、合法性的人工智能安全問題被忽略了?!?/p> 作為例子,這位前雇員舉出了 OpenAI 在 Midjourney 和 Stability AI 首次推出競爭性產品時,迅速推翻了此前由于擔心被濫用而限制訪問 DALL-E 2 的決定。此前 OpenAI 曾表示,只有在仔細的測試使其對 DALL-E 2 的安全系統(tǒng)更有信心后,才允許更廣泛地使用這一服務。 根據一些前雇員的說法,這些戰(zhàn)略和文化轉變在十幾名 OpenAI 研究人員和其他工作人員,其中許多人從事人工智能安全工作,決定在 2021 年與公司分道揚鑣并成立自己的研究實驗室,名為 Anthropic。 OpenAI 表示,它將繼續(xù)公布遠多于其他人工智能實驗室的研究成果。它還為產品重點的轉變做出辯護。首席技術官穆拉提說:“你不能只呆在實驗室里建立 AGI?!彼f:推出產品是發(fā)現人們想要如何使用和濫用技術的唯一途徑。OpenAI 根本不知道 GPT-3 最受歡迎的應用之一竟然會是編寫軟件代碼,直到他們看到人們確實喜歡用 OpenAI 來編碼。 同樣地,OpenAI 最擔心的是人們會使用 GPT-3 來制造政治上的誤導性消息,但事實證明這種擔心是沒有根據的;相反,她穆拉提表示:最普遍的惡意使用是人們在制造用于廣告的垃圾郵件。 最后,穆拉提說:OpenAI 希望把技術向世界公開使用,“把真正強大的技術對社會的沖擊降到最低。”她認為,如果不給人們一個未來可能出現的情況的預告,先進的人工智能對社會的破壞將更加嚴重。 蘇茨克維承認 OpenAI 與微軟的關系創(chuàng)造了一個新的“期望,即:我們確實需要從我們的技術中做出某種有用的產品”,但他堅持認為 OpenAI 的文化核心沒有改變。他說:能夠獲準進入微軟的數據中心,對 OpenAI 的進步至關重要。 布羅克曼還認為,這種合作關系使 OpenAI 能夠創(chuàng)造收入,且同時保持不那么商業(yè)化的關注力,不然的話 OpenAI 將不得不真正變味。他說:“雇用數千名銷售人員才是可能真正改變這家公司的變化,有一個已經做到這一點的合作伙伴(微軟),實際上是很了不起的?!?/p> 蘇茨克維斷然否認了 OpenAI 已經不再強調安全的含義,“我想說的是事實恰恰相反。在 'Anthropic’分裂出去之前,人工智能的安全是一個專職化的團隊,但現在人工智能安全是每個團隊都有的責任。安全的標準不斷提高,我們正在做的安全工作的數量不斷增加?!?/p> 然而批評者說,OpenAI 以產品為導向的高級人工智能打法是不負責任的,相當于給了人們一把上了膛的槍,理由是這是確定他們是不是真的會互相開槍的最好方法。 紐約大學認知科學榮譽教授、對以深度學習為中心的人工智能打法持懷疑態(tài)度的加里·馬庫斯(Gary Marcus)認為,生成性人工智能構成了“對社會結構的真正且迫切的威脅”。他說,通過將制造虛假信息的成本降低到幾乎為零,像 GPT-3 和 ChatGPT 這樣的系統(tǒng)可能會釋放出錯誤信息的浪潮。 馬庫斯說,我們甚至已經看到了第一批受害者。Stack Overflow 是一個讓程序員提出和回答編程問題的網站,它已經不得不禁止用戶提交由 ChatGPT 回答的答案,因為這個網站被那些看似合理但實質上卻是錯誤的答案淹沒了。同時,科技新聞網站 CNET 開始使用 ChatGPT 生成新聞文章,但后來發(fā)現許多文章由于事實不準確而不得不被糾正。 而對其他人來說,ChatGPT 編寫出準確的代碼才是真正的風險。網絡安全公司Check Point的研究副總裁瑪雅·霍洛維茨(Maya Horowitz)說,她的團隊能夠讓 ChatGPT 編寫網絡攻擊的每個階段,從制作令人信服的釣魚郵件到編寫惡意代碼,再到逃避常見的網絡安全檢查。她警告說:ChatGPT 基本上可以使零編碼技能的人成為網絡犯罪分子。 OpenAI 的首席技術官穆拉提說:“我擔心的是,會有越來越多的攻擊。” 她說,該公司也有這種擔憂,并正在研究如何”調整“其人工智能模型,以便它們不會編寫惡意軟件,但這并沒有簡單的解決辦法。 無數的批評家和教育工作者都譴責學生可以輕易地使用 ChatGPT 作弊。紐約市、巴爾的摩和洛杉磯的學區(qū),都阻止了由學校管理的網絡訪問這款新推出的聊天機器人,澳大利亞的一些大學表示:他們將恢復只部署監(jiān)考老師的紙質考試來評估學生?,F在,OpenAI 正在研究使人工智能生成的文本更容易被發(fā)現的方法,包括可能在 ChatGPT 的輸出中添加數字“水印”。 對于 ChatGPT 最初在2022年的數據訓練和打標簽方式,也存在道德方面的擔憂。作為整個過程的一部分,OpenAI 雇用了一家數據標簽公司,這家公司使用肯尼亞的低工資工人來識別涉及有毒語言和生動的性愛和暴力內容的段落。《時代》雜志的一項調查發(fā)現:其中一些工人報告說因此出現了心理健康問題。OpenAI 在一份聲明中告訴時代周報記者,這種數據標簽的目的是“最大限度地減少培訓數據中的暴力和性愛內容,也是創(chuàng)建出可以檢出有害內容的工具的必要準備步驟?!?/p> OpenAI 的潛在危機免費提供 ChatGPT 使 OpenAI 能夠收集到大量的反饋意見,以幫助改進到未來的版本上。但還遠不能確定 OpenAI 將保持其在語言人工智能領域的主導地位。總部設在倫敦的人工智能公司 Faculty 的創(chuàng)始人兼首席執(zhí)行官馬克·華納(Marc Warner)說:“歷史上看,我們傾向于看到這些非常通用的算法,但它們沒有足夠的護城河,無法讓特定一家公司獲得所有的一般回報。例如,人臉和圖像識別技術最初是由谷歌和英偉達等科技巨頭開發(fā)的,但現在已經無處不在。” 法院和監(jiān)管機構也可能向生成性人工智能所依賴的數據飛輪里插入一根大棒。在加州聯邦法院提起的 90 億美元的集體訴訟,可能會對這個領域產生深遠影響。案件原告指控微軟和 OpenAI 沒有為使用原告的代碼注明來源或者提供財務補償。微軟和 OpenAI 用這些代碼來訓練 GitHub 的編碼助手 Copilot,這違反了開放許可條款。被告的這兩家公司拒絕對訴訟發(fā)表評論。 人工智能專家說:如果法院支持原告,有可能會破壞生成性人工智能的繁榮。大多數生成性的人工智能模型都是在未經許可或補償的情況下從互聯網上搜刮材料訓練出來的。代表這些原告的同一家律師事務所最近對 Midjourney 和 Stability AI 提起了類似的訴訟,因為他們在訓練數據中未經許可使用了有版權的藝術作品。 著名的圖片社 Getty Images 也對 Stability AI 提起了版權侵權訴訟。如果立法者通過規(guī)則,賦予創(chuàng)作者選擇不在人工智能訓練中使用其內容的權利,那么另一個人工智能行業(yè)可能會面臨的問題就要出現,而一些歐盟立法者正在考慮這樣做。 同時,OpenAI 的競爭對手也沒有停滯不前。據《紐約時報》報道,失去在搜索領域主導地位的前景,已經促使谷歌高管們宣布了一個內部的“紅色警報”。據報道,谷歌首席執(zhí)行官桑達爾·皮查伊(Sundar Pichai)已經召開會議,重新定義公司的人工智能戰(zhàn)略,并計劃在年內發(fā)布 20 種新的人工智能產品,以及要展示出具有聊天界面的搜索功能。 谷歌有自己強大的聊天機器人,名為 LaMDA,但一直踟躕不前,因為擔心如果最終被誤用,會造成聲譽損失?!都~約時報》援引谷歌公司的一份內部報告和未透露姓名的內部人士的話說:現在,谷歌計劃根據 ChatGPT “重新調整”自己的風險偏好。據時報報道,谷歌還在開發(fā)一個文本到圖像的生成系統(tǒng),以與 OpenAI 的 DALL-E 和其他公司的產品競爭。 人工智能還是人工智障?當然,目前還不清楚聊天機器人是否會成為搜索的未來。ChatGPT 經常發(fā)明一些“信息”,這是人工智能研究人員稱之為“幻覺”的現象。ChatGPT 不能可靠地引用其信息來源,也不容易給出鏈接。目前的版本還無法訪問實時互聯網,因此不能提供最新的信息。 一些人,比如馬庫斯教授認為幻覺和偏見是所有大型語言模型的根本問題,需要對其設計進行徹底的反思。他說:“這些系統(tǒng)預測句子中的單詞序列,就像類固醇的自動完成機制,但它們實際上沒有機制來跟蹤自身所說的真相,甚至沒有機制來驗證它們所說的是否與自己的訓練數據相一致?!?/p> 其他人,包括 OpenAI 的投資者霍夫曼和維諾德·科斯拉,預測這些問題將在一年內得到解決。穆拉提的態(tài)度更為謹慎。她說:“到目前為止,我們一直在遵循一些研究方向,以解決事實的準確性和解決模型的可靠性等問題。我們還在這些方向上努力?!?/p> 事實上,OpenAI 已經發(fā)表了關于不同版本的 GPT 的研究,被稱為 WebGPT,它有能力通過查詢搜索引擎來回答問題,然后總結自己發(fā)現的信息,包括相關來源的腳注。 然而,WebGPT 并不完美:它傾向于接受用戶問題時附帶的前提,并尋找將之確認的信息,即使用戶給出的前提是錯誤的它仍會如此。例如,當被問及愿望是否能使事情發(fā)生時,WebGPT 回答說:“你可以通過思想的力量使愿望成真,這是真的?!?/p> 在奧特曼罕見地在公開場合對人工智能進行狂想時,他聽起來也像個一廂情愿的人。在舊金山的風險投資活動中,當被問及人工智能的最佳案例時,他滔滔不絕地說:“我認為最佳案例是如此之好,以至于難以想象……案例是如此令人難以置信的好,以至于你聽起來像一個瘋子在談論它?!比缓?,他突然回到了建立 OpenAI 的根基上的烏托邦主題:“我認為最壞的情況是:我們所有人都被關進監(jiān)獄?!?/p> |
|
來自: 呂楊鵬 > 《20230130-20230205》