李彥宏:“AI技術(shù)已經(jīng)發(fā)展到一個(gè)臨界點(diǎn),各行各業(yè)都不可避免地被改變?!?/strong>隨著AIGC(生成式AI)引爆新一輪全球科技競(jìng)賽,百度對(duì)話機(jī)器人“文心一言”上線也進(jìn)入倒計(jì)時(shí),3月“交卷”籌備如何備受各界關(guān)注。適逢百度財(cái)報(bào)今日發(fā)布,百度2022年?duì)I收約1237億元,凈利潤(rùn)約207億元,研發(fā)投入達(dá)214億元,約等于把一年賺的錢(qián)全用來(lái)做研發(fā)了;同時(shí),AI產(chǎn)業(yè)化成果初顯,百度智能云已連續(xù)四年居AI公有云市場(chǎng)第一,關(guān)于百度文心一言的多個(gè)動(dòng)向也隨之曝出:已有超400家企業(yè)宣布加入文心一言生態(tài)圈,同時(shí)百度多項(xiàng)主流業(yè)務(wù)將接入文心一言,包括百度搜索,以及基于百度智能云的智能語(yǔ)音助手小度、智能駕駛阿波羅(Apollo)等。 ▲百度2022年的研發(fā)投入及AI新進(jìn)展 作為中國(guó)AI市場(chǎng)長(zhǎng)期增長(zhǎng)的代表,百度正站在浪潮之巔。百度創(chuàng)始人兼董事長(zhǎng)李彥宏在財(cái)報(bào)發(fā)布后的內(nèi)部信中說(shuō):“AI技術(shù)已經(jīng)發(fā)展到一個(gè)臨界點(diǎn),各行各業(yè)都不可避免地被改變,中國(guó)AI市場(chǎng)即將迎來(lái)爆發(fā)性的需求增長(zhǎng)。”實(shí)際上,這一新機(jī)會(huì)引起了全球產(chǎn)業(yè)的沸騰,基于大模型的AIGC成為一片掘金熱土。▲百度創(chuàng)始人兼董事長(zhǎng)李彥宏 美國(guó)硅谷的微軟、谷歌等科技巨頭為此打得不可開(kāi)交;國(guó)內(nèi),百度、科大訊飛、復(fù)旦大學(xué)等大廠和知名學(xué)府紛紛出手,原美團(tuán)“二號(hào)人物”王慧文、出門(mén)問(wèn)問(wèn)創(chuàng)始人李志飛等科技大佬也一頭扎入AIGC創(chuàng)業(yè)大潮……而作為國(guó)內(nèi)在“AI 搜索”首屈一指的互聯(lián)網(wǎng)大廠,百度十年AI理想和窮盡實(shí)驗(yàn),或許正進(jìn)入爆發(fā)前夜。每月投18億做研發(fā) 迎戰(zhàn)全球AIGC競(jìng)賽AI研發(fā)向來(lái)是一項(xiàng)費(fèi)錢(qián)的事業(yè)。盡管2022年業(yè)務(wù)深受疫情影響,百度依然保持了“月投18億做研發(fā)”的記錄。從經(jīng)營(yíng)基本面來(lái)看,根據(jù)財(cái)報(bào),百度本季度營(yíng)收約331億元,高于市場(chǎng)預(yù)期的320億元;歸屬百度的凈利潤(rùn)約54億元,同比增長(zhǎng)32%。▲百度近年?duì)I收及增長(zhǎng)情況 在研發(fā)投入方面,百度保持了多年以來(lái)的高研發(fā)投入,2022年約達(dá)到214億元,相當(dāng)于每月投18億做研發(fā),占百度核心收入22.4%,在全國(guó)科技公司里位于前列。▲百度近年研發(fā)投入情況 持續(xù)的研發(fā)投入,正在轉(zhuǎn)化為產(chǎn)業(yè)化成果。比如承載AI產(chǎn)業(yè)化的百度智能云部門(mén),2022年強(qiáng)化了“云智一體”戰(zhàn)略,已連續(xù)四年居于中國(guó)AI公有云市場(chǎng)第一。而在前沿技術(shù)研發(fā)方面,百度TPG部門(mén)最新的文心(ERNIE)大模型成果,正成為百度應(yīng)對(duì)全球AIGC產(chǎn)業(yè)化浪潮的錨點(diǎn)支撐。在剛剛過(guò)去的2022年Q4,百度在11月的深度學(xué)習(xí)開(kāi)發(fā)者峰會(huì)上全新發(fā)布11個(gè)大模型,包括5個(gè)基礎(chǔ)大模型、1個(gè)任務(wù)大模型、5個(gè)行業(yè)大模型。同時(shí),百度新發(fā)布和升級(jí)基于文心大模型的兩大產(chǎn)品——AI 作畫(huà)產(chǎn)品“文心一格”和產(chǎn)業(yè)級(jí)搜索系統(tǒng)“文心百中”。文心是百度自主研發(fā)的產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)大模型,與當(dāng)下流行的大模型GPT-3.5相似。截至目前,文心已累計(jì)發(fā)布11個(gè)行業(yè)大模型,涵蓋電力、燃?xì)?、金融、航天、傳媒、城市、影視、制造、社科等領(lǐng)域。▲百度文心產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)大模型框架圖 隨著2023年新季度的開(kāi)啟,百度將于3月推出又一個(gè)生成式AI產(chǎn)品“文心一言”,以此續(xù)寫(xiě)迎戰(zhàn)全球AIGC競(jìng)賽的篇章。十年AI理想與研發(fā)長(zhǎng)跑 在中文搜索土壤上開(kāi)花要問(wèn)當(dāng)下什么是AIGC的最佳商業(yè)化應(yīng)用?接入了ChatGPT的微軟新版Bing秒變私人智能助理,谷歌對(duì)標(biāo)產(chǎn)品Bard也進(jìn)入了全公司萬(wàn)人內(nèi)測(cè)階段……憑借“百度一下”被全國(guó)人認(rèn)識(shí)的百度也出手了——在今年1月Create AI開(kāi)發(fā)者大會(huì)前夕,百度宣布將搜索升級(jí)為“生成式搜索”,這意味著百度搜索將提供更好的答案、交互聊天和生成內(nèi)容。躋身全球AIGC產(chǎn)業(yè)化競(jìng)賽舞臺(tái),百度正試圖引領(lǐng)中文搜索體驗(yàn)的代際變革。根據(jù)財(cái)報(bào)可知,作為基本盤(pán),搜索業(yè)務(wù)為百度文心一言的誕生提供了厚實(shí)土壤。2022年Q4,百度搜索規(guī)模同比增長(zhǎng)17%,領(lǐng)跑優(yōu)勢(shì)持續(xù)擴(kuò)大。12月,百度App月活躍用戶達(dá)到6.48億,同比增長(zhǎng)4%。此外,隨著國(guó)內(nèi)市場(chǎng)消費(fèi)需求釋放,百度在線廣告營(yíng)銷業(yè)務(wù)預(yù)計(jì)將迎來(lái)復(fù)蘇。這些增長(zhǎng)都與百度基本盤(pán)搜索業(yè)務(wù)緊密相關(guān),從而為文心一言的落地提供了底盤(pán)基座。▲百度移動(dòng)生態(tài)流量池保持增長(zhǎng) 知名分析機(jī)構(gòu)麥格理預(yù)計(jì),百度2023年廣告及云服務(wù)收入增長(zhǎng)將會(huì)有所回升,受惠于有效的成本控制措施,整體利潤(rùn)率提高,而可見(jiàn)的上行驚喜將會(huì)是公司有機(jī)會(huì)在中國(guó)推出類似ChatGPT的人工智能(AI)聊天機(jī)器人。可以預(yù)測(cè),隨著接入文心一言,百度搜索將擴(kuò)大服務(wù)場(chǎng)景和市場(chǎng)規(guī)模。AIGC有望助百度搶占內(nèi)容生態(tài)高地,比如增加百度平臺(tái)上的高質(zhì)量短視頻供應(yīng),助百家號(hào)發(fā)布者提高轉(zhuǎn)換效率等。實(shí)際上,除了搜索,百度文心一言將通過(guò)智能云提供服務(wù),應(yīng)用于智能駕駛阿波羅(Apollo)、智能語(yǔ)音助手小度等多塊業(yè)務(wù),使得用戶體驗(yàn)實(shí)現(xiàn)跨代進(jìn)化。當(dāng)然,AIGC相關(guān)技術(shù)研發(fā)難度大,即便是微軟新版Bing在近期的測(cè)試中也是“翻車”不斷,百度文心一言做的怎么樣依然是一個(gè)未知答案。攻克技術(shù)缺陷需要時(shí)間,這對(duì)百度來(lái)說(shuō)挑戰(zhàn)和壓力不小。不過(guò),百度文心一言的誕生并非一日之功,超10年在NLP(自然語(yǔ)言處理)領(lǐng)域的積累或許能為其提供堅(jiān)實(shí)支持。早在2010年,百度就創(chuàng)立了自然語(yǔ)言處理部,在語(yǔ)音、圖片等技術(shù)上布局;2019年3月,百度提出知識(shí)增強(qiáng)的語(yǔ)義理解框架文心(ERNIE),在深度學(xué)習(xí)的基礎(chǔ)上融入知識(shí)和持續(xù)學(xué)習(xí),當(dāng)時(shí)一舉登頂全球權(quán)威數(shù)據(jù)集GLUE榜單。2021年9月,百度發(fā)布了全球首個(gè)百億參數(shù)的對(duì)話大模型PLATO-XL,再次刷新了開(kāi)放域?qū)υ捫Ч?022年12月,文心大模型迭代出ERNIE 1.0、ERNIE 2.0、ERNIE-Tiny多個(gè)版本,開(kāi)始加速落地到各個(gè)行業(yè)。十年AI理想與研發(fā)長(zhǎng)跑,在百度中文搜索土壤上開(kāi)花,并開(kāi)始走向千行百業(yè)實(shí)體經(jīng)濟(jì)的結(jié)出果實(shí)。熱戰(zhàn)微軟、谷歌,百度文心一言 打造四大護(hù)城河熱戰(zhàn)微軟、谷歌,國(guó)產(chǎn)大模型將與硅谷科技巨頭進(jìn)行在不同的舞臺(tái)隔空PK。百度創(chuàng)始人兼董事長(zhǎng)李彥宏在近期公開(kāi)發(fā)言中說(shuō):“怎么把這么酷的技術(shù),變成人人需要的好產(chǎn)品,賦能千行百業(yè),讓他們的生產(chǎn)效率大幅度地提升?這一步才是最難的,也是最偉大、最能夠產(chǎn)生影響力的。”根據(jù)官方數(shù)據(jù)可知,目前已有包括互聯(lián)網(wǎng)、媒體、金融、保險(xiǎn)、汽車、企業(yè)軟件等行業(yè)的超400家頭部企業(yè)宣布加入百度文心一言生態(tài)。而文心一言能否為這些行業(yè)伙伴帶來(lái)驚艷的效果?成為當(dāng)下階段百度團(tuán)隊(duì)的主要攻堅(jiān)戰(zhàn)。面向這一攻堅(jiān)戰(zhàn),百度從至少算法、算力、數(shù)據(jù)、應(yīng)用四大方面建立了技術(shù)護(hù)城河。1、四年大模型飛速迭代,飛槳底座匯聚535萬(wàn)開(kāi)發(fā)者無(wú)論是大模型算法還是AI開(kāi)發(fā)框架,百度都走在國(guó)內(nèi)科技大廠的前列。文心一言背后,文心大模型迭代四年至今,已從單一的自然語(yǔ)言理解延伸至多模態(tài),實(shí)現(xiàn)視覺(jué)、文檔、文圖、語(yǔ)音“全能”,具備較強(qiáng)泛化能力和性能。以最新發(fā)布的ERNIE 3.0 Zeus為例,已擁有千億級(jí)參數(shù),據(jù)稱公開(kāi)數(shù)據(jù)集上小樣本學(xué)習(xí)、理解和生成任務(wù)效果皆好于業(yè)界其他模型。支撐文心模型訓(xùn)練的框架是百度飛槳(PaddlePaddle),中國(guó)首個(gè)自主研發(fā)的產(chǎn)業(yè)級(jí)深度學(xué)習(xí)開(kāi)源開(kāi)放平臺(tái)。一方面飛槳技術(shù)不斷迭代,2022年11月剛在MLPerf Training v2.1測(cè)試中奪魁;另一方面生態(tài)不斷壯大,截至2022年11月底,飛槳平臺(tái)上已凝聚535萬(wàn)開(kāi)發(fā)者、創(chuàng)建67萬(wàn)個(gè)AI模型,服務(wù)20萬(wàn)家企事業(yè)單位,位列中國(guó)深度學(xué)習(xí)平臺(tái)市場(chǎng)綜合份額第一。▲飛槳平臺(tái)全景圖 2、三大云中心穩(wěn)定供算力,幾萬(wàn)片自研芯澎湃加速大模型戰(zhàn)場(chǎng)正變得越來(lái)越熱鬧,算力成本隨著飆升。比如GPT-3大模型的單次訓(xùn)練成本上百萬(wàn)美元、總訓(xùn)練成本上千萬(wàn)美元。在算力方面,百度在陽(yáng)泉、徐水、定興三地建立了自用云計(jì)算中心,龐大的超算集群為文心大模型的訓(xùn)練奠定了基礎(chǔ)設(shè)施。百度智能云在成為百度第二增長(zhǎng)曲線的同時(shí),也能為文心大模型應(yīng)用提供高并發(fā)、高彈性、高精度等不同計(jì)算需求。同時(shí),百度自研AI芯片“昆侖”已在多場(chǎng)景實(shí)際部署幾萬(wàn)片,在公司搜索業(yè)務(wù)中也已形成較強(qiáng)工程化實(shí)踐,為文心大模型底層算力鋪上了加速路。▲百度“芯片-框架-大模型-行業(yè)應(yīng)用”的智能化閉環(huán)路徑 3、自有業(yè)務(wù)海量真實(shí)文本,具備先天數(shù)據(jù)優(yōu)勢(shì)眾所周知,擁有千億參數(shù)的大模型是用海量數(shù)據(jù)“喂出來(lái)的”。在數(shù)據(jù)層面,百度以移動(dòng)APP、搜索等業(yè)務(wù)為依托,積累了海量真實(shí)文本和用戶需求數(shù)據(jù)。這些大規(guī)模結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)有望支撐文心一言充分預(yù)訓(xùn)練,形成自身優(yōu)勢(shì)。此外,在安全領(lǐng)域多年的深耕也將為文心一言保駕護(hù)航。4、多款應(yīng)用提供創(chuàng)新土壤,用戶開(kāi)放帶起迭代飛輪正如前文提到的,文心一言能夠落地到百度搜索、小度、阿波羅等多塊自有業(yè)務(wù),這些產(chǎn)品不少已在市場(chǎng)占據(jù)領(lǐng)導(dǎo)地位。隨著文心一言的嵌入,這些產(chǎn)品有望實(shí)現(xiàn)代際變革;產(chǎn)品的迭代也將反推文心一言繼續(xù)進(jìn)化。另外,隨著文心一言的公眾開(kāi)放,真實(shí)的用戶調(diào)用和模型迭代之間的良性循環(huán)建立起來(lái),文心一言大模型的智力有望不斷升級(jí)。此外值得一提的是,文心一言在迎戰(zhàn)國(guó)外AIGC產(chǎn)品的同時(shí),更需要適應(yīng)中國(guó)市場(chǎng)的實(shí)體經(jīng)濟(jì)數(shù)字化轉(zhuǎn)型需求。根據(jù)百度方發(fā)言,文心大模型是本土化的AI模型,具備對(duì)中文、中國(guó)文化的更深理解,這意味著文心一言可能會(huì)更適合中文和中國(guó)市場(chǎng)。結(jié)語(yǔ):巨頭AIGC競(jìng)賽號(hào)角拉響 中國(guó)AI產(chǎn)業(yè)迎來(lái)“小陽(yáng)春”全球AIGC的巨頭戰(zhàn)已經(jīng)打響,在AI和搜索領(lǐng)域深耕多年的百度站在了新的歷史舞臺(tái)上。2019年推出文心大模型,其將于3月推出的文心一言可以說(shuō)是中國(guó)科技力量參戰(zhàn)全球AIGC競(jìng)賽的一大代表。適逢文心一言上線進(jìn)入倒計(jì)時(shí),百度發(fā)布了2022年的財(cái)報(bào)及Q4的業(yè)務(wù)進(jìn)展情況,成為提前了解其“答卷”的參考。百度搜索、智能云、阿波羅、小度等業(yè)務(wù)快速發(fā)展,成為文心一言大模型在實(shí)際落地中不斷迭代的試驗(yàn)田。不久之前,人們似乎還在AI產(chǎn)業(yè)的低谷仰望光明,不知道通用人工智能的曙光何時(shí)出現(xiàn)?,F(xiàn)在,隨著全球AIGC巨頭戰(zhàn)號(hào)角吹響,AI市場(chǎng)又熱了起來(lái),中國(guó)方興未艾的AI產(chǎn)業(yè)有望迎來(lái)一個(gè)“小陽(yáng)春”。
|