12月1日OpenAI官宣了其目前最強(qiáng)的AI對(duì)話系統(tǒng)之后,大家發(fā)現(xiàn)這個(gè)強(qiáng)大的系統(tǒng)能做的事情遠(yuǎn)超過大家的想象。我們也在第一時(shí)間發(fā)布了相關(guān)的博客:https:///blog/1051669904657253 。由于這個(gè)系統(tǒng)實(shí)在是太過強(qiáng)大,大家發(fā)現(xiàn)的能力越來越強(qiáng)。連Musk也在幾個(gè)小時(shí)之前感嘆這個(gè)系統(tǒng)是so much better at bullshit than they are!在這篇博客中,我們將收集關(guān)于這個(gè)系統(tǒng)目前的使用案例,給大家一個(gè)更加全面的展示結(jié)果。
一、官方對(duì)ChatGPT系統(tǒng)的介紹官方博客中介紹到,ChatGPT是基于GPT-3.5(模型card:https:///ai-resources/pretrained-models/gpt-3-5 )微調(diào)的結(jié)果。ChatGPT是InstructGPT的兄弟模型(InstructGPT是官方訓(xùn)練的一個(gè)比GPT-3更好的遵循用戶意圖的語言模型,是基于OpenAI的alignment research技術(shù)研發(fā)的,比GPT-3更強(qiáng)的語言模型)。 ChatGPT的訓(xùn)練使用了基于人類反饋的強(qiáng)化學(xué)習(xí)( Reinforcement Learning from Human Feedback,RLHF)。這點(diǎn)與InstructGPT一樣,但是在數(shù)據(jù)收集方面有差異。OpenAI使用監(jiān)督下的微調(diào)訓(xùn)練了一個(gè)初始模型:人類人工智能trainer提供對(duì)話,他們?cè)趯?duì)話中扮演雙方—用戶和人工智能助理。這可以讓訓(xùn)練者接觸到模型編寫的建議,以幫助他們組成他們的回應(yīng)。 二、ChatGPT的使用案例盡管官方對(duì)于ChatGPT的能力描述很簡單,但是從實(shí)際大家使用的期刊來看,這個(gè)系統(tǒng)可以做的事情遠(yuǎn)超大家想象。這里我們會(huì)列舉目前收集的ChatGPT的使用案例,供大家參考。
|