剛剛，OpenAI重磅發(fā)布交互界面canvas，讓ChatGPT成為寫作和編程利器

天承辦公室 2024-10-05

展開(kāi)全文

機(jī)器之心報(bào)道

機(jī)器之心編輯部

OpenAI 剛剛?cè)谫Y，就迫不及待開(kāi)始證明自己了。

今日凌晨，OpenAI 宣布推出類似 Anthropic 的 Artifacts 的應(yīng)用 canvas，并稱「這是一種使用 ChatGPT 寫作和編程的新方式」。

在 Claude 中試過(guò) Artifacts 的朋友都知道，這能極大提升 LLM 輸出結(jié)果的表現(xiàn)力，其支持輸出文本文件、代碼、網(wǎng)頁(yè)、SVG 等等。此前風(fēng)靡一時(shí)的「漢語(yǔ)新解」便是基于 Claude 的 Artifacts 功能。但讓 ChatGPT 用戶感到遺憾的是，Artifacts 上線三個(gè)多月了，OpenAI 一直沒(méi)有跟進(jìn)，以至于一些開(kāi)發(fā)者自行開(kāi)發(fā)發(fā)布了自己的開(kāi)源版本。

現(xiàn)在，用戶的呼聲終于獲得了響應(yīng)，于是紛紛點(diǎn)贊。也有人開(kāi)玩笑地表示 OpenAI 這是打不過(guò) Claude 便加入。

已有用戶分享了自己使用 canvas 的驚喜成果，比如用戶 @bilawalsidhu 分享自己讓 ChatGPT 使用 ThreeJS 創(chuàng)建超立方體查看器過(guò)程：

在 canvas 這個(gè)界面，你可以與 ChatGPT 一起完成寫作和編碼項(xiàng)目，而不再局限于簡(jiǎn)單的聊天。canvas 是一種新的交互方式，也是 OpenAI 推出 ChatGPT 以來(lái)的首個(gè)重大視覺(jué)界面更新。

canvas 會(huì)在單獨(dú)的窗口中打開(kāi)，方便用戶與 ChatGPT 一起協(xié)作完成項(xiàng)目。canvas 的 Beta 版本為用戶提供了一種全新的合作方式：你不僅能夠通過(guò)對(duì)話進(jìn)行創(chuàng)作，還能與 ChatGPT 成為并肩作戰(zhàn)的伙伴，一起創(chuàng)造和完善。

canvas 由 GPT-4o 支持，在 Beta 期間可以在模型選擇器中手動(dòng)選擇。不過(guò)，現(xiàn)在 Beta 版本只提供給 ChatGPT Plus 與團(tuán)隊(duì)用戶。企業(yè)和教育用戶將在下周獲得訪問(wèn)權(quán)限。ChatGPT 免費(fèi)用戶需要等到 canvas 正式發(fā)布后才能使用。

我們先一睹 canvas 有哪些驚艷之處。

與 ChatGPT 更好地協(xié)作

和 ChatGPT 聊天對(duì)于我們來(lái)說(shuō)已經(jīng)是十分簡(jiǎn)便的信息獲取方式，這也包括寫作與編碼。不過(guò)當(dāng)你想要及時(shí)對(duì)寫作內(nèi)容或者編碼內(nèi)容進(jìn)行修改時(shí)，對(duì)話方式可能就顯得力不從心了。

canvas 的出現(xiàn)就是為了解決這個(gè)難題。

在這個(gè)新的界面中，你可以通過(guò)高亮的方式，告訴 ChatGPT 具體需要關(guān)注什么，讓它更精準(zhǔn)地理解你的用意。這就類似于編輯，你可以在全部上下文中具體地提出反饋和建議。

此外，你的調(diào)整方式也十分便捷，直接編輯代碼或文本都不成問(wèn)題。你的項(xiàng)目，你做主。canvas 還提供了快捷菜單，可以讓 ChatGPT 幫你調(diào)整文本長(zhǎng)度、調(diào)試代碼，或者快速執(zhí)行其他實(shí)用操作。如果想要之前的版本，一鍵返回即可恢復(fù)。

寫作快捷操作，圖源：https:///index/introducing-canvas/

當(dāng) ChatGPT 發(fā)現(xiàn)某個(gè)場(chǎng)景中 canvas 能幫上忙時(shí)，它會(huì)自動(dòng)打開(kāi)。你也可以在提示中直接加一句「使用 canvas」，這樣 ChatGPT 就會(huì)切換到 canvas 界面，幫助你更方便地處理現(xiàn)有項(xiàng)目。

canvas 的編程能力

代碼是一個(gè)迭代過(guò)程，但是在聊天之中，很難跟蹤代碼的改進(jìn)過(guò)程。canvas 讓我們可以更輕松地跟蹤和理解 ChatGPT 的修改過(guò)程，OpenAI 也承諾「計(jì)劃繼續(xù)提升這類編輯過(guò)程的透明度」。

canvas 目前提供了以下編程快捷操作：

審閱代碼：ChatGPT 可提供改進(jìn)代碼的行內(nèi)建議；
添加日志：插入 print 語(yǔ)句來(lái)幫助用戶進(jìn)行調(diào)試和理解代碼；
添加注釋：為代碼添加注釋，讓其更容易理解；
修復(fù) bug：檢測(cè)和重寫有問(wèn)題的代碼，以修復(fù)錯(cuò)誤；
支持多語(yǔ)言導(dǎo)出：可將用戶的代碼轉(zhuǎn)譯成 JavaScript、TypeScript、Python、Java、C++、PHP 等語(yǔ)言。

將模型訓(xùn)練為協(xié)作伙伴

OpenAI 的研究團(tuán)隊(duì)對(duì) GPT-4o 進(jìn)行了訓(xùn)練，以使其能夠作為創(chuàng)意合作伙伴進(jìn)行協(xié)作。該模型知道何時(shí)打開(kāi) canvas，何時(shí)進(jìn)行目標(biāo)性編輯，以及何時(shí)需要完全重寫。同時(shí)，它還能夠理解更廣泛的上下文，從而提供精準(zhǔn)的反饋和建議。

為了支持這一點(diǎn)，研究團(tuán)隊(duì)開(kāi)發(fā)了以下核心行為：

在寫作和編碼時(shí)觸發(fā) canvas
生成多樣化的內(nèi)容類型
進(jìn)行目標(biāo)性編輯
重寫文檔
提供 inline 評(píng)論

OpenAI 通過(guò) 20 多項(xiàng)自動(dòng)化內(nèi)部評(píng)估來(lái)衡量進(jìn)展，并使用了新穎的合成數(shù)據(jù)生成技術(shù)，例如從 OpenAI 的 o1-preview 中提取輸出，來(lái)對(duì)模型進(jìn)行核心行為的后訓(xùn)練。這種方法能夠快速應(yīng)對(duì)寫作質(zhì)量和新的用戶交互需求，從而無(wú)需依賴人工生成的數(shù)據(jù)。

對(duì)研發(fā)團(tuán)隊(duì)來(lái)說(shuō)，一個(gè)關(guān)鍵挑戰(zhàn)是何時(shí)觸發(fā) canvas。OpenAI 訓(xùn)練模型在像「寫一篇關(guān)于咖啡豆歷史的博客文章」這樣的提示詞下打開(kāi) canvas，同時(shí)避免對(duì)像「幫我做一道新的晚餐食譜」這樣的一般問(wèn)答任務(wù)進(jìn)行過(guò)度觸發(fā)。

在寫作任務(wù)中，他們優(yōu)先改進(jìn)了「正確觸發(fā)」的情況（以犧牲「正確不觸發(fā)」為代價(jià)），達(dá)到了 83%，相較于作為基線的零樣本提示詞式 GPT-4o 有了顯著提升。

值得注意的是，此類基線的質(zhì)量對(duì)特定提示詞非常敏感。不同的提示詞可能導(dǎo)致基線在表現(xiàn)不佳的同時(shí)，呈現(xiàn)不同的錯(cuò)誤分布。

例如，在編碼和寫作任務(wù)中會(huì)出現(xiàn)「均勻地不準(zhǔn)確」情況，導(dǎo)致不同類型的錯(cuò)誤分布和表現(xiàn)不佳的形式。在編碼方面，OpenAI 有意讓模型在觸發(fā)方面偏向保守，以避免干擾高級(jí)用戶的體驗(yàn)。之后，OpenAI 也是承諾將繼續(xù)根據(jù)用戶反饋對(duì)其進(jìn)行優(yōu)化。

針對(duì)寫作和編碼任務(wù)，OpenAI 改進(jìn)了準(zhǔn)確觸發(fā) canvas 決策邊界的能力，分別達(dá)到了 83% 和 94%，相較于作為基線的零樣本提示詞式 GPT-4o 有明顯提升。

第二個(gè)挑戰(zhàn)在于對(duì)模型在觸發(fā) canvas 后的編輯行為進(jìn)行調(diào)優(yōu)，特別是決定何時(shí)進(jìn)行目標(biāo)性編輯，何時(shí)重寫整個(gè)內(nèi)容。

OpenAI 訓(xùn)練模型在用戶通過(guò)界面明確選擇文本時(shí)進(jìn)行目標(biāo)性編輯，否則就更傾向于重寫內(nèi)容。隨著模型的不斷完善，canvas 的編輯行為也在持續(xù)演變。

針對(duì)寫作和編碼任務(wù)，OpenAI 優(yōu)先優(yōu)化了 canvas 的目標(biāo)編輯功能。帶有 canvas 的 GPT-4o 在性能上比基線的提示詞式 GPT-4o 高出 18%。

最后，訓(xùn)練模型生成高質(zhì)量評(píng)論需要經(jīng)過(guò)仔細(xì)的迭代。與前兩個(gè)可以輕松適應(yīng)自動(dòng)化評(píng)估并輔以詳細(xì)人工審查的案例不同，自動(dòng)衡量評(píng)論的質(zhì)量尤其具有挑戰(zhàn)性。

因此，OpenAI 使用人工評(píng)估來(lái)衡量評(píng)論的質(zhì)量和準(zhǔn)確性。他們所整合的 canvas 模型在準(zhǔn)確性上比使用提示詞指令的零樣本 GPT-4o 高出 30%，在質(zhì)量上高出 16%。

這表明合成訓(xùn)練顯著提升了相較于帶有詳細(xì)指令說(shuō)明的零樣本提示詞下的響應(yīng)質(zhì)量和行為表現(xiàn)。

canvas 目前仍處于早期測(cè)試階段，OpenAI 后續(xù)計(jì)劃快速提升其功能。

至于它和 Artifacts 究竟誰(shuí)更能贏得用戶親睞，就讓我們拭目以待吧，相信剛拿了一大筆投資的 OpenAI 也應(yīng)該不會(huì)讓用戶失望。

參考鏈接：

https:///index/introducing-canvas/

https://twitter.com/OpenAI/status/1841887707020329173

https:///2024/10/03/openai-launches-new-canvas-chatgpt-interface-tailored-to-writing-and-coding-projects/

早鳥(niǎo)開(kāi)售 | 「端側(cè) AI 大模型開(kāi)發(fā)與應(yīng)用實(shí)踐」技術(shù)論壇·上海

端側(cè)AI爆發(fā)元年，企業(yè)如何緊抓端側(cè)大模型的機(jī)遇，探索行業(yè)應(yīng)用，實(shí)現(xiàn)業(yè)務(wù)增長(zhǎng)？研發(fā)人員如何提升技能，將大模型應(yīng)用于PC、手機(jī)、家居、智能穿戴、機(jī)器人、教育硬件等終端設(shè)備？

10月26日，論壇匯聚端側(cè)大模型領(lǐng)先技術(shù)及應(yīng)用企業(yè)代表，通過(guò)技術(shù)報(bào)告、應(yīng)用實(shí)踐、實(shí)操演練等環(huán)節(jié)，從理論到實(shí)戰(zhàn)，助您全方位掌握端側(cè)大模型部署應(yīng)用，開(kāi)啟AI技術(shù)升級(jí)之路。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：天承辦公室 > 《022機(jī)器之心》

舉報(bào)/認(rèn)領(lǐng)