簡(jiǎn)介AI 以迅速的發(fā)展,不僅僅在研究界帶來(lái)了革新,在生活的方方面面也提供智能化,使我們更便利。在本篇內(nèi)容中,ShowMeAI將介紹 OpenAI 的主要發(fā)展以及它們實(shí)際落地的 AI 產(chǎn)品應(yīng)用。 OpenAI vs DeepMind,兩大人工智能巨頭應(yīng)對(duì)不同挑戰(zhàn)OpenAI 的使命側(cè)重于以安全的方式為全人類實(shí)現(xiàn)人工智能的可用性。OpenAI 的模型為數(shù)據(jù)提取、文本生成、語(yǔ)音識(shí)別、圖像生成或編輯等日常任務(wù)帶來(lái)了高效的解決方案。盡管它們的任務(wù)和目標(biāo)不同,但它們?cè)陂_(kāi)發(fā)大型模型方面有著共同的努力,這些模型在當(dāng)今的大多數(shù)應(yīng)用中都發(fā)揮著關(guān)鍵的作用。 DeepMind 的使命是解決智能問(wèn)題,推動(dòng)科學(xué)發(fā)展并造福人類。因此,它強(qiáng)調(diào)通用智能,即 AI 在任何情況下都能夠自行學(xué)習(xí)。這也解釋了為什么 DeepMind 所有的突破都依賴于深度強(qiáng)化學(xué)習(xí),即 AI 只有一個(gè)目標(biāo)和一組可能的行動(dòng),需要找出實(shí)現(xiàn)該目標(biāo)的最佳方法。 GPT3,超智能化的內(nèi)容生成助手GPT3介紹GPT-3 是一種深度學(xué)習(xí)模型,該模型經(jīng)過(guò)訓(xùn)練后可以預(yù)測(cè)序列中的下一個(gè)標(biāo)記,并能生成流暢逼真的文本,覆蓋文本分析和摘要、文案撰寫、代碼生成等應(yīng)用場(chǎng)景。GPT-3 在發(fā)布后不久就掀起了全球的熱潮,促進(jìn)了大量應(yīng)用程序和初創(chuàng)公司的誕生。下圖為用戶使用 “Grammar Correction” 開(kāi)始編程的操作示例。 現(xiàn)實(shí)生活中的應(yīng)用OpenAI 官方表示,OpenAI API是公司第一個(gè)商業(yè)產(chǎn)品,自推出九個(gè)月以來(lái),超過(guò) 300 個(gè)應(yīng)用在使用 GPT-3,成千上萬(wàn)的開(kāi)發(fā)人員在使用平臺(tái)。目前平均每天生成 45 億個(gè)單詞,且生產(chǎn)流量繼續(xù)擴(kuò)大中。 如果你需要在線的文本解決方案,那可以閱讀更多相關(guān)信息并自己把模型玩起來(lái):https://beta./playground。OpenAI 為所有新帳戶提供 18 美元的信用額度。 CLIP,文本和圖像的天然融合藝術(shù)CLIP介紹CLIP 是 OpenAI 開(kāi)發(fā)的一種大型預(yù)訓(xùn)練語(yǔ)言模型,將輸入的文本映射到一個(gè)連續(xù)的向量空間,并通過(guò)計(jì)算兩個(gè)文本之間的距離來(lái)進(jìn)行文本分類和相似度計(jì)算。與傳統(tǒng)的語(yǔ)言模型不同,CLIP可以通過(guò)學(xué)習(xí)數(shù)據(jù)庫(kù)中的大量文本數(shù)據(jù)來(lái)實(shí)現(xiàn)端到端的文本分類,而不需要任何人工標(biāo)注。因此,它可以用于許多不同的文本分類任務(wù),包括情感分析、知識(shí)圖譜構(gòu)建和圖像標(biāo)注。下圖表明 CLIP 極大地改進(jìn)了圖像分類的結(jié)果! 現(xiàn)實(shí)生活中的應(yīng)用CLIP可以完成零樣本圖像分類、圖像描述、內(nèi)容審核、圖像生成等。值得注意的是,CLIP 是 DALLE 的構(gòu)建塊之一。 DALL·E 2,優(yōu)秀的藝術(shù)家DALL·E 2介紹DALL·E 2 是 OpenAI 公司研發(fā)的一款新的人工智能系統(tǒng),不僅可以根據(jù)文本描述生成對(duì)應(yīng)的逼真圖像,還可以根據(jù)文本提示修改圖像內(nèi)容,以及根據(jù)給定的圖像拓展生成多種主題風(fēng)格一致的“變體”。目前公開(kāi)可用,可以直接訪問(wèn) OpenAI 網(wǎng)站,也可以調(diào)用 API(2022 年 11 月已經(jīng)發(fā)布?。?/span> 現(xiàn)實(shí)生活中的應(yīng)用DALL·E 2 的影響力可與 GPT3 媲美,應(yīng)用場(chǎng)景也非常豐富,包括插圖、圖像攝影、NFT 生成、圖像編輯等。微軟已經(jīng)宣布 DALL·E 2 將為其 Designer App 提供支持;Shutterstock 還宣布與 OpenAI 建立合作關(guān)系,允許用戶在平臺(tái)上使用 DALL·E 2 進(jìn)行創(chuàng)作! Whisper,聽(tīng)懂所有語(yǔ)言的智者Whisper介紹Whisper 是一個(gè)自動(dòng)語(yǔ)音識(shí)別 (ASR) 系統(tǒng)。它使用從網(wǎng)絡(luò)上收集的 680,000 小時(shí)多語(yǔ)言和多任務(wù)監(jiān)督數(shù)據(jù)進(jìn)行訓(xùn)練。使用如此龐大且多樣化的數(shù)據(jù)集可以提高對(duì)口音、背景噪音和技術(shù)語(yǔ)言的魯棒性。此外,它還支持多種語(yǔ)言的轉(zhuǎn)錄,以及將這些語(yǔ)言翻譯成英語(yǔ)。 現(xiàn)實(shí)生活中的應(yīng)用Whisper 是免費(fèi)和可編程的,使用體驗(yàn)令人興奮!這也使其成為現(xiàn)有商業(yè)語(yǔ)音識(shí)別服務(wù)的有力競(jìng)爭(zhēng)者。它也可能直接挑戰(zhàn)了當(dāng)前主流的“基于云的 ASR 服務(wù)”。 由于 Whisper 模型較小,便于本地運(yùn)行的移動(dòng) App 使用,從而可以避免轉(zhuǎn)錄前數(shù)據(jù)上傳云端導(dǎo)致的隱私問(wèn)題(已經(jīng)有人行動(dòng)起來(lái)了 例如下方推文)。 Codex,完美代碼生成助手Codex介紹OpenAI Codex 是一種基于 GPT-3 的自然語(yǔ)言到代碼系統(tǒng),有助于將 自然語(yǔ)言指令轉(zhuǎn)換為十幾種流行的編碼語(yǔ)言。Codex 于去年 8 月通過(guò) OpenAI 的 API 發(fā)布,是 GitHub Copilot 的主要構(gòu)建塊。 其實(shí),可以要求 GPT3 解釋一段簡(jiǎn)單的文本代碼,從代碼到解釋性文本這個(gè)過(guò)程GPT3也可以做得很好,理解和生成代碼的能力已經(jīng)編碼在 GPT3 中。而 Codex 專注于生成可執(zhí)行代碼,使其成為開(kāi)發(fā)人員的絕佳助手。由于它已經(jīng)集成到 Visual Studio 中,根據(jù)經(jīng)驗(yàn),將它無(wú)縫集成到開(kāi)發(fā)周期中。 現(xiàn)實(shí)生活中的應(yīng)用許多應(yīng)用已經(jīng)出現(xiàn),包括各種代碼助手 copilot、pygma 和 replit 等。
下圖為 Replit 依靠 Codex 來(lái)解釋部分代碼。 ChatGPT,令人興奮的AI聊天機(jī)器人ChatGPT介紹ChatGPT 是 OpenAI 于 11 月 30 日推出的一款聊天機(jī)器人,能根據(jù)用戶的提示,在對(duì)話中生成類似人類的文本響應(yīng),完成回答問(wèn)題、提供信息或參與對(duì)話等各種任務(wù)。與許多使用預(yù)定義的響應(yīng)或規(guī)則生成文本的聊天機(jī)器人不同,ChatGPT 經(jīng)過(guò)了訓(xùn)練,可以根據(jù)接收到的輸入生成響應(yīng),從而生成更自然、更多樣化的響應(yīng)。 ChatGPT的亮點(diǎn)主要有哪些?
現(xiàn)實(shí)生活中的應(yīng)用ChatGPT不僅會(huì)聊天,寫得了代碼,修復(fù)得了bug,還能幫你寫工作周報(bào)、寫小說(shuō)、進(jìn)行考試答題,繪畫,看病,甚至你還可以誘騙它規(guī)劃如何毀滅人類,許多人認(rèn)為,ChatGPT不僅僅是一個(gè)聊天機(jī)器人,而可能是現(xiàn)有搜索引擎的顛覆者。 參考資料
|
|
來(lái)自: 天承辦公室 > 《014智能經(jīng)濟(jì)》