2022年11月,OpenAI推出了基于GPT-3.5打造的ChatGPT,引燃了大模型浪潮,進(jìn)而引起全球AI競(jìng)賽。海內(nèi)外不少頭部互聯(lián)網(wǎng)公司和人工智能公司基本都對(duì)外發(fā)布了自家的大模型,中國(guó)更是出現(xiàn)了“百模大戰(zhàn)”的局面。根據(jù)AI算法備案中心統(tǒng)計(jì),截至2024年3月28日,國(guó)內(nèi)通過算法備案的大模型數(shù)量達(dá)117個(gè)。其中不乏我們熟悉的百度“文心一言”、阿里巴巴“通義千問”、商湯科技“日日新”,還有我們今天要聊的字節(jié)跳動(dòng)“豆包大模型”(原名:云雀)。揭秘豆包大模型家族架構(gòu)豆包大模型經(jīng)過近一年的迭代和市場(chǎng)驗(yàn)證,今日終于正式開啟對(duì)外服務(wù)。在2024春季火山引擎Force原動(dòng)力大會(huì)上,字節(jié)跳動(dòng)揭開了豆包大模型神秘的面紗,據(jù)介紹,豆包大模型包括通用模型pro、通用模型lite、語(yǔ)音識(shí)別模型、語(yǔ)音合成模型、文生圖模型等九款模型。具體應(yīng)用方面,字節(jié)跳動(dòng)打造了AI對(duì)話助手“豆包”、AI創(chuàng)作工具“即夢(mèng)”、AI應(yīng)用開發(fā)平臺(tái)“扣子”等一系列應(yīng)用,并將大模型接入抖音、飛書、巨量引擎等業(yè)務(wù)板塊,用以提升效率和優(yōu)化產(chǎn)品體驗(yàn)。豆包作為字節(jié)跳動(dòng)重點(diǎn)投入的大模型應(yīng)用,據(jù)字節(jié)跳動(dòng)產(chǎn)品和戰(zhàn)略副總裁朱駿透露,豆包APP在各大安卓應(yīng)用市場(chǎng)和蘋果APP Store的AIGC類應(yīng)用中,下載量排名第一,月活用戶達(dá)2600萬。此前小雷特地體驗(yàn)了以圖片、視頻生成為核心賣點(diǎn)的AI創(chuàng)作工具即夢(mèng),對(duì)豆包大模型的實(shí)力深有體會(huì)。即夢(mèng)雖然在視頻生成方面仍有待優(yōu)化,但圖片生成已經(jīng)達(dá)到了不錯(cuò)的水準(zhǔn),這讓小雷對(duì)豆包充滿期待,究竟被字節(jié)跳動(dòng)寄予厚望的豆包是什么樣的水平,不妨跟著小雷一起看看。
豆包輕體驗(yàn)全應(yīng)用強(qiáng)調(diào)延伸性豆包在移動(dòng)端、PC端都有布置應(yīng)用入口,小雷在體驗(yàn)過程中發(fā)現(xiàn)原來豆包在Windows/Mac桌面客戶端以及瀏覽器插件方面均有布局。為了方便體驗(yàn),小雷選擇了PC網(wǎng)頁(yè)端作為體驗(yàn)對(duì)象。進(jìn)入網(wǎng)頁(yè)端首頁(yè),豆包優(yōu)先向我推薦了三個(gè)不同類型的AI應(yīng)用,分別為AI搜索、PDF問答、圖像生成,這可能是用戶使用頻次最高的應(yīng)用。既然如此,小雷找來了同樣定位智能助手的Kimi,來看看這AI搜索和PDF問答的成色,小雷已經(jīng)在即夢(mèng)上體驗(yàn)過圖像生成,這次就不重復(fù)體驗(yàn)了,兩者都接入了豆包大模型,表現(xiàn)應(yīng)該相差不大。強(qiáng)強(qiáng)對(duì)話之下,相信大家會(huì)對(duì)豆包大模型有更直觀的感受。AI搜索:各有長(zhǎng)短,豆包贏在效率和問題延伸性最近《歌手2024》火遍全網(wǎng),話題性極高的中外歌手比拼引起不少網(wǎng)友熱議,小雷就此問題向豆包、Kimi提問。豆包花費(fèi)數(shù)秒就給出了回答及搜索來源,回答內(nèi)容沒有出現(xiàn)常識(shí)性錯(cuò)誤,選手信息和排名十分清晰,對(duì)調(diào)侃式的互聯(lián)網(wǎng)熱梗也能準(zhǔn)確識(shí)別并作出解釋。延伸性是AI搜索的精髓之一,這點(diǎn)也在回答下方的得到展示。相對(duì)來說,豆包用非常精簡(jiǎn)語(yǔ)句總結(jié)了我們想要知道的答案。Kimi在這塊相對(duì)好些,問題解釋比較詳細(xì),在每個(gè)回答內(nèi)容處標(biāo)注了資料來源,這能為用戶省下不少翻查信息來源的時(shí)間。生成效率方面,Kimi的表現(xiàn)不如豆包,大約用了10s才給出了回答,并且沒有給出該問題的延伸問題,這對(duì)于一個(gè)智能助手來說是個(gè)不小的問題。PDF問答:豆包驚喜,Kimi穩(wěn)定長(zhǎng)文本處理是Kimi的強(qiáng)項(xiàng),在之前的體驗(yàn)中小雷讓其總結(jié)了《過于喧鬧的孤獨(dú)》書籍的PDF文件,字?jǐn)?shù)在10萬左右。這次豆包的處理對(duì)象依舊是它,看看同樣的指令處理同一份PDF文件,豆包又能交出怎樣的答卷。Kimi對(duì)文章主要情節(jié)做了分段處理,每段內(nèi)容提供段落小結(jié),回答的開頭結(jié)尾就文章內(nèi)容和寓意給出了確切的回答;豆包則是以文章的形式進(jìn)行表達(dá),將文章內(nèi)容濃縮簡(jiǎn)短的故事,大意與Kimi基本一致,最后給出自己的理解。有趣的是,豆包還是遵循著延伸性搜索的好習(xí)慣,下方提供了3個(gè)與文章相關(guān)的搜索。 總的來說,兩者在準(zhǔn)確識(shí)別PDF文件內(nèi)容的同時(shí),對(duì)內(nèi)容進(jìn)行了總結(jié),文章關(guān)鍵點(diǎn)基本提及。差別在于大模型的處理邏輯,這導(dǎo)致回答的內(nèi)容形式產(chǎn)生了區(qū)別,沒有優(yōu)劣之分,用戶使用該功能只為獲得準(zhǔn)確的答案。不過受限于資料,小雷沒來得及準(zhǔn)備更大文本量的PDF,因此無法試探豆包長(zhǎng)文本處理能力的極限,感興趣的朋友可以自行實(shí)踐體驗(yàn)。除了常見的AI應(yīng)用外,小雷發(fā)現(xiàn)豆包還隱藏了許多有趣的智能體。有角色扮演、文案助手以及各類測(cè)試等智能體,數(shù)量、品類之多足以覆蓋生活、工作、學(xué)習(xí)、創(chuàng)作等諸多場(chǎng)景。用戶也可以選擇打造專屬于自己的AI智能體,自由設(shè)定頭像、名稱、人設(shè)以及權(quán)限。當(dāng)然,小雷在之前已經(jīng)對(duì)豆包做過深度評(píng)測(cè),從多個(gè)維度試探了豆包在各場(chǎng)景下的實(shí)力,感興趣的朋友可以點(diǎn)擊查閱。此前,小雷在文心一言上創(chuàng)建了內(nèi)置AI聲音的智能體,豆包APP已經(jīng)有類似的應(yīng)用,而豆包網(wǎng)頁(yè)端倒是沒有看到相關(guān)設(shè)定,或許后續(xù)會(huì)結(jié)合豆包大模型家族中的語(yǔ)音合成模型、聲音復(fù)刻模型、語(yǔ)音識(shí)別模型進(jìn)行迭代,讓網(wǎng)頁(yè)端AI智能體更擬人。大模型價(jià)格步入“厘時(shí)代”AIGC應(yīng)用場(chǎng)景加速落地過去一年,豆包大模型已經(jīng)在字節(jié)跳動(dòng)內(nèi)部50多個(gè)業(yè)務(wù)和場(chǎng)景中得到廣泛應(yīng)用,不少用戶使用抖音、飛書時(shí)發(fā)現(xiàn)了豆包的身影。據(jù)了解,豆包大模型自去年8月份上線以來,日均處理1200億Tokens文本,生成3000萬張圖片,而龐大的內(nèi)部使用量正是為了更好的實(shí)現(xiàn)外部服務(wù)。大模型+應(yīng)用產(chǎn)品共同發(fā)布,是大多數(shù)大模型玩家的習(xí)慣,豆包大模型則正好相反,投入使用一年才正式發(fā)布?;蛟S是為了積累更龐大的數(shù)據(jù)使用量,又或者是為了更完美的首秀,總之字節(jié)跳動(dòng)有一套清晰的大模型戰(zhàn)略,并不會(huì)因?yàn)橥饨绫容^就隨意調(diào)整。在本次發(fā)布會(huì)上,字節(jié)跳動(dòng)沒有放出任何榜單分?jǐn)?shù)和參數(shù)規(guī)模,反而著重強(qiáng)調(diào)了豆包大模型加速落地的另一重要因素:價(jià)格。豆包主力模型在企業(yè)市場(chǎng)的定價(jià)只有0.0008元/千Tokens,0.8厘就能處理1500多個(gè)漢字,比行業(yè)便宜99.3%,簡(jiǎn)單換算一下,1元就能處理1250000tokens,價(jià)格遠(yuǎn)低于GPT4、ERINE4.0、Qwen 2.5 Max等其他大模型處理成本。結(jié)合體驗(yàn),小雷感受到了字節(jié)跳動(dòng)的底氣所在,那就是行業(yè)大模型平均線以上的水準(zhǔn)+遠(yuǎn)低于行業(yè)的處理成本。對(duì)于任何一家有意發(fā)展大模型企業(yè)來說,這兩點(diǎn)具備絕佳的吸引力。目前豆包大模型在B端已收獲了不少的合作伙伴,來自汽車、手機(jī)、PC等行業(yè)的眾多企業(yè)均已接入火山引擎的大模型服務(wù),包括吉利汽車、賽力斯、vivo、小米、華碩等。在高性價(jià)比落地價(jià)格的推動(dòng)下,未來接入大模型的企業(yè)會(huì)越來越多。當(dāng)前大模型應(yīng)用發(fā)展仍處于早期階段。QuestMobile數(shù)據(jù)顯示,截至今年3月,基于大模型的AIGC行業(yè)用戶量為7380萬,同比增長(zhǎng)了8倍,僅占移動(dòng)互聯(lián)網(wǎng)用戶量的6%,存在廣闊的增長(zhǎng)空間。字節(jié)跳動(dòng)極具競(jìng)爭(zhēng)力的定價(jià)在沖擊行業(yè)之余,勢(shì)必給AIGC應(yīng)用創(chuàng)造低成本的落地條件。背靠字節(jié)跳動(dòng)的豆包大模型,是時(shí)候讓AIGC應(yīng)用場(chǎng)景落地提提速了。
|