【原】AI價(jià)格屠夫來了！字節(jié)豆包超便宜，體驗(yàn)如何？

雷科技 2024-05-15 發(fā)布于廣東

展開全文

2022年11月，OpenAI推出了基于GPT-3.5打造的ChatGPT，引燃了大模型浪潮，進(jìn)而引起全球AI競(jìng)賽。海內(nèi)外不少頭部互聯(lián)網(wǎng)公司和人工智能公司基本都對(duì)外發(fā)布了自家的大模型，中國(guó)更是出現(xiàn)了“百模大戰(zhàn)”的局面。

根據(jù)AI算法備案中心統(tǒng)計(jì)，截至2024年3月28日，國(guó)內(nèi)通過算法備案的大模型數(shù)量達(dá)117個(gè)。其中不乏我們熟悉的百度“文心一言”、阿里巴巴“通義千問”、商湯科技“日日新”，還有我們今天要聊的字節(jié)跳動(dòng)“豆包大模型”（原名：云雀）。

揭秘豆包大模型家族架構(gòu)

豆包大模型經(jīng)過近一年的迭代和市場(chǎng)驗(yàn)證，今日終于正式開啟對(duì)外服務(wù)。在2024春季火山引擎Force原動(dòng)力大會(huì)上，字節(jié)跳動(dòng)揭開了豆包大模型神秘的面紗，據(jù)介紹，豆包大模型包括通用模型pro、通用模型lite、語(yǔ)音識(shí)別模型、語(yǔ)音合成模型、文生圖模型等九款模型。

圖源：字節(jié)跳動(dòng)

具體應(yīng)用方面，字節(jié)跳動(dòng)打造了AI對(duì)話助手“豆包”、AI創(chuàng)作工具“即夢(mèng)”、AI應(yīng)用開發(fā)平臺(tái)“扣子”等一系列應(yīng)用，并將大模型接入抖音、飛書、巨量引擎等業(yè)務(wù)板塊，用以提升效率和優(yōu)化產(chǎn)品體驗(yàn)。

豆包作為字節(jié)跳動(dòng)重點(diǎn)投入的大模型應(yīng)用，據(jù)字節(jié)跳動(dòng)產(chǎn)品和戰(zhàn)略副總裁朱駿透露，豆包APP在各大安卓應(yīng)用市場(chǎng)和蘋果APP Store的AIGC類應(yīng)用中，下載量排名第一，月活用戶達(dá)2600萬。

此前小雷特地體驗(yàn)了以圖片、視頻生成為核心賣點(diǎn)的AI創(chuàng)作工具即夢(mèng)，對(duì)豆包大模型的實(shí)力深有體會(huì)。即夢(mèng)雖然在視頻生成方面仍有待優(yōu)化，但圖片生成已經(jīng)達(dá)到了不錯(cuò)的水準(zhǔn)，這讓小雷對(duì)豆包充滿期待，究竟被字節(jié)跳動(dòng)寄予厚望的豆包是什么樣的水平，不妨跟著小雷一起看看。

豆包輕體驗(yàn)

全應(yīng)用強(qiáng)調(diào)延伸性

豆包在移動(dòng)端、PC端都有布置應(yīng)用入口，小雷在體驗(yàn)過程中發(fā)現(xiàn)原來豆包在Windows/Mac桌面客戶端以及瀏覽器插件方面均有布局。為了方便體驗(yàn)，小雷選擇了PC網(wǎng)頁(yè)端作為體驗(yàn)對(duì)象。

圖源：豆包

進(jìn)入網(wǎng)頁(yè)端首頁(yè)，豆包優(yōu)先向我推薦了三個(gè)不同類型的AI應(yīng)用，分別為AI搜索、PDF問答、圖像生成，這可能是用戶使用頻次最高的應(yīng)用。既然如此，小雷找來了同樣定位智能助手的Kimi，來看看這AI搜索和PDF問答的成色，小雷已經(jīng)在即夢(mèng)上體驗(yàn)過圖像生成，這次就不重復(fù)體驗(yàn)了，兩者都接入了豆包大模型，表現(xiàn)應(yīng)該相差不大。

強(qiáng)強(qiáng)對(duì)話之下，相信大家會(huì)對(duì)豆包大模型有更直觀的感受。

圖源：豆包

AI搜索：各有長(zhǎng)短，豆包贏在效率和問題延伸性

最近《歌手2024》火遍全網(wǎng)，話題性極高的中外歌手比拼引起不少網(wǎng)友熱議，小雷就此問題向豆包、Kimi提問。

豆包花費(fèi)數(shù)秒就給出了回答及搜索來源，回答內(nèi)容沒有出現(xiàn)常識(shí)性錯(cuò)誤，選手信息和排名十分清晰，對(duì)調(diào)侃式的互聯(lián)網(wǎng)熱梗也能準(zhǔn)確識(shí)別并作出解釋。延伸性是AI搜索的精髓之一，這點(diǎn)也在回答下方的得到展示。

相對(duì)來說，豆包用非常精簡(jiǎn)語(yǔ)句總結(jié)了我們想要知道的答案。

圖源：豆包

Kimi在這塊相對(duì)好些，問題解釋比較詳細(xì)，在每個(gè)回答內(nèi)容處標(biāo)注了資料來源，這能為用戶省下不少翻查信息來源的時(shí)間。生成效率方面，Kimi的表現(xiàn)不如豆包，大約用了10s才給出了回答，并且沒有給出該問題的延伸問題，這對(duì)于一個(gè)智能助手來說是個(gè)不小的問題。

圖源：Kimi

PDF問答：豆包驚喜，Kimi穩(wěn)定

長(zhǎng)文本處理是Kimi的強(qiáng)項(xiàng)，在之前的體驗(yàn)中小雷讓其總結(jié)了《過于喧鬧的孤獨(dú)》書籍的PDF文件，字?jǐn)?shù)在10萬左右。這次豆包的處理對(duì)象依舊是它，看看同樣的指令處理同一份PDF文件，豆包又能交出怎樣的答卷。

圖源：豆包

圖源：Kimi

Kimi對(duì)文章主要情節(jié)做了分段處理，每段內(nèi)容提供段落小結(jié)，回答的開頭結(jié)尾就文章內(nèi)容和寓意給出了確切的回答；豆包則是以文章的形式進(jìn)行表達(dá)，將文章內(nèi)容濃縮簡(jiǎn)短的故事，大意與Kimi基本一致，最后給出自己的理解。有趣的是，豆包還是遵循著延伸性搜索的好習(xí)慣，下方提供了3個(gè)與文章相關(guān)的搜索。

總的來說，兩者在準(zhǔn)確識(shí)別PDF文件內(nèi)容的同時(shí)，對(duì)內(nèi)容進(jìn)行了總結(jié)，文章關(guān)鍵點(diǎn)基本提及。差別在于大模型的處理邏輯，這導(dǎo)致回答的內(nèi)容形式產(chǎn)生了區(qū)別，沒有優(yōu)劣之分，用戶使用該功能只為獲得準(zhǔn)確的答案。不過受限于資料，小雷沒來得及準(zhǔn)備更大文本量的PDF，因此無法試探豆包長(zhǎng)文本處理能力的極限，感興趣的朋友可以自行實(shí)踐體驗(yàn)。

除了常見的AI應(yīng)用外，小雷發(fā)現(xiàn)豆包還隱藏了許多有趣的智能體。有角色扮演、文案助手以及各類測(cè)試等智能體，數(shù)量、品類之多足以覆蓋生活、工作、學(xué)習(xí)、創(chuàng)作等諸多場(chǎng)景。用戶也可以選擇打造專屬于自己的AI智能體，自由設(shè)定頭像、名稱、人設(shè)以及權(quán)限。當(dāng)然，小雷在之前已經(jīng)對(duì)豆包做過深度評(píng)測(cè)，從多個(gè)維度試探了豆包在各場(chǎng)景下的實(shí)力，感興趣的朋友可以點(diǎn)擊查閱。

圖源：豆包

此前，小雷在文心一言上創(chuàng)建了內(nèi)置AI聲音的智能體，豆包APP已經(jīng)有類似的應(yīng)用，而豆包網(wǎng)頁(yè)端倒是沒有看到相關(guān)設(shè)定，或許后續(xù)會(huì)結(jié)合豆包大模型家族中的語(yǔ)音合成模型、聲音復(fù)刻模型、語(yǔ)音識(shí)別模型進(jìn)行迭代，讓網(wǎng)頁(yè)端AI智能體更擬人。

大模型價(jià)格步入“厘時(shí)代”

AIGC應(yīng)用場(chǎng)景加速落地

過去一年，豆包大模型已經(jīng)在字節(jié)跳動(dòng)內(nèi)部50多個(gè)業(yè)務(wù)和場(chǎng)景中得到廣泛應(yīng)用，不少用戶使用抖音、飛書時(shí)發(fā)現(xiàn)了豆包的身影。據(jù)了解，豆包大模型自去年8月份上線以來，日均處理1200億Tokens文本，生成3000萬張圖片，而龐大的內(nèi)部使用量正是為了更好的實(shí)現(xiàn)外部服務(wù)。

大模型+應(yīng)用產(chǎn)品共同發(fā)布，是大多數(shù)大模型玩家的習(xí)慣，豆包大模型則正好相反，投入使用一年才正式發(fā)布?；蛟S是為了積累更龐大的數(shù)據(jù)使用量，又或者是為了更完美的首秀，總之字節(jié)跳動(dòng)有一套清晰的大模型戰(zhàn)略，并不會(huì)因?yàn)橥饨绫容^就隨意調(diào)整。

在本次發(fā)布會(huì)上，字節(jié)跳動(dòng)沒有放出任何榜單分?jǐn)?shù)和參數(shù)規(guī)模，反而著重強(qiáng)調(diào)了豆包大模型加速落地的另一重要因素：價(jià)格。豆包主力模型在企業(yè)市場(chǎng)的定價(jià)只有0.0008元/千Tokens，0.8厘就能處理1500多個(gè)漢字，比行業(yè)便宜99.3%，簡(jiǎn)單換算一下，1元就能處理1250000tokens，價(jià)格遠(yuǎn)低于GPT4、ERINE4.0、Qwen 2.5 Max等其他大模型處理成本。

圖源：字節(jié)跳動(dòng)

結(jié)合體驗(yàn)，小雷感受到了字節(jié)跳動(dòng)的底氣所在，那就是行業(yè)大模型平均線以上的水準(zhǔn)+遠(yuǎn)低于行業(yè)的處理成本。對(duì)于任何一家有意發(fā)展大模型企業(yè)來說，這兩點(diǎn)具備絕佳的吸引力。目前豆包大模型在B端已收獲了不少的合作伙伴，來自汽車、手機(jī)、PC等行業(yè)的眾多企業(yè)均已接入火山引擎的大模型服務(wù)，包括吉利汽車、賽力斯、vivo、小米、華碩等。在高性價(jià)比落地價(jià)格的推動(dòng)下，未來接入大模型的企業(yè)會(huì)越來越多。

當(dāng)前大模型應(yīng)用發(fā)展仍處于早期階段。QuestMobile數(shù)據(jù)顯示，截至今年3月，基于大模型的AIGC行業(yè)用戶量為7380萬，同比增長(zhǎng)了8倍，僅占移動(dòng)互聯(lián)網(wǎng)用戶量的6%，存在廣闊的增長(zhǎng)空間。字節(jié)跳動(dòng)極具競(jìng)爭(zhēng)力的定價(jià)在沖擊行業(yè)之余，勢(shì)必給AIGC應(yīng)用創(chuàng)造低成本的落地條件。

背靠字節(jié)跳動(dòng)的豆包大模型，是時(shí)候讓AIGC應(yīng)用場(chǎng)景落地提提速了。

End