一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

專(zhuān)業(yè)大模型,而不是“通用”人工智能

 Karl 2023-06-14 發(fā)布于云南

以概念跨學(xué)科定義法的視角來(lái)看,今天的人工智能技術(shù)并不是去模仿人類(lèi)所有的智能,而主要是模仿通過(guò)大量數(shù)據(jù)歸納(在人工智能的術(shù)語(yǔ)里變成“訓(xùn)練”)的經(jīng)驗(yàn)知識(shí)形成過(guò)程。即使其中的所謂“推理”,也只是以經(jīng)驗(yàn)知識(shí)為基礎(chǔ)的、很容易犯“經(jīng)驗(yàn)主義錯(cuò)誤”性質(zhì)的推理。

一、中國(guó)大模型的現(xiàn)狀

宇視的梧桐人工智能系統(tǒng)發(fā)布有一個(gè)月了,上個(gè)周末參觀(guān)在北京的安博會(huì),深入了解了梧桐系統(tǒng)。可以說(shuō),自從Chat GPT火爆全網(wǎng),我對(duì)此是抱持冷靜態(tài)度的。宇視的梧桐系統(tǒng)使我看到有效應(yīng)用這種技術(shù)的一些正確路徑。簡(jiǎn)單來(lái)講,從應(yīng)用上看是“專(zhuān)業(yè)”,而不是“通用”;從技術(shù)上來(lái)說(shuō)是“大模型”,而不是“通用人工智能”(AGI)。

圖片

2023安博會(huì)上霸屏的宇視科技

目前中國(guó)可以說(shuō)進(jìn)入“千模大戰(zhàn)”的階段,以下是轉(zhuǎn)引自智東西的中國(guó)大模型發(fā)布統(tǒng)計(jì)。

圖片

圖片

圖片

圖片

圖片

圖片

參見(jiàn):“千模大戰(zhàn)”100天:六路玩家圍攻ChatGPT, 李水青,智東西, 2023-05-29 19:55 發(fā)表于湖北

另外,華為大模型最早于2020年11月在華為云內(nèi)部立項(xiàng)成功,2021年4月對(duì)外發(fā)布,2022年4月,其升級(jí)到2.0版本。目前,其AI 大模型中的 NLP 大模型、CV 大模型以及科學(xué)計(jì)算大模型(氣象大模型)均已被標(biāo)記為即將上線(xiàn)狀態(tài)。對(duì)于網(wǎng)上傳說(shuō)其大模型名稱(chēng)為“盤(pán)古”,華為并未予以證實(shí)。

需要特別提示一下的是:北京智源人工智能研究院,早在2020年10月已啟動(dòng)了AI大模型“悟道”項(xiàng)目,并先后于2021年6月1日發(fā)布了悟道大模型1.0,2021年6月1日 發(fā)布了2.0兩個(gè)版本。其中悟道2.0官方公布的參數(shù)規(guī)模達(dá)到1.7萬(wàn)億。彼時(shí),OpenAI公布1750億參數(shù)的GPT-3模型也才一年時(shí)間。即使在國(guó)外,這一輪大模型也還沒(méi)火爆起來(lái)。ChatGPT在國(guó)外也是在2022年底才開(kāi)始大爆發(fā)的。智源在國(guó)內(nèi)算是搞大模型比較早的。單從其技術(shù)狀態(tài)看似乎是很好的,但在國(guó)內(nèi)卻比較沉寂。原因在于其沒(méi)有找到很好的應(yīng)用。ChatGPT與其說(shuō)是技術(shù)的成功,不如說(shuō)是找到了一個(gè)很適合的應(yīng)用,就是對(duì)信息準(zhǔn)確性和可靠性要求不高的聊天類(lèi)應(yīng)用。

圖片

ChatGPT是OpenAI自己創(chuàng)新性的應(yīng)用嗎?不是。在 ChatGPT 之前,以GPT-3為技術(shù)基礎(chǔ)的生成式人工智能是由創(chuàng)新公司Jasper發(fā)明的。它的產(chǎn)品可以基于一個(gè)簡(jiǎn)單的短語(yǔ)或提示,創(chuàng)建出數(shù)百個(gè)單詞的文本,在媒體工作者和營(yíng)銷(xiāo)人員之間大受歡迎。Jasper成立于2022 年 1 月,初期人員只有 9 人,但僅僅到10 月份就擴(kuò)大到 160 多名。因?yàn)槠洳捎檬召M(fèi)模式,當(dāng)年的營(yíng)收就預(yù)計(jì)能達(dá)到 6000 萬(wàn)美元。資本市場(chǎng)對(duì) Jasper 的歡迎火爆異常,2022 年 10 月,Jasper在成立僅僅10個(gè)月內(nèi)就以15億美元的公司估值融資 1.25 億美元。然而,僅僅 在Jasper完成融資1個(gè)月后的11月30日,OpenAI 公司自己的ChatGPT發(fā)布,并且采用免費(fèi)模式。顯然,以Jasper產(chǎn)品為基礎(chǔ)改進(jìn)一下,并且是在自己的核心技術(shù)平臺(tái)上,當(dāng)然產(chǎn)品會(huì)好一些,再加上免費(fèi),Jasper瞬間就從天堂跌落到地獄。因?yàn)镴asper的產(chǎn)品是基于OpenAI的GPT-3版本,這就是為什么ChatGPT會(huì)基于GPT-3.5的原因所在——總得做做樣子顯得比對(duì)手更牛嘛。所以,不要以為ChatGPT創(chuàng)造了一種全新的突破性的產(chǎn)品應(yīng)用,它是抄襲真正創(chuàng)新的Jasper公司產(chǎn)品的結(jié)果。這也從另外一個(gè)角度反映了當(dāng)下中國(guó)自己掌握核心技術(shù)的重要性。

圖片

我有些疑惑,今天這個(gè)時(shí)候市場(chǎng)格局遠(yuǎn)未確定。如果2021年6月1日就發(fā)布了的智源悟道2.0有1.7萬(wàn)億參數(shù)規(guī)模,為什么不推出自己的聊天產(chǎn)品呢?

二、專(zhuān)業(yè)與通用

為什么這幾年我在業(yè)界很多火爆的概念炒作時(shí),總是先來(lái)潑一些涼水?因?yàn)槲乙?jiàn)過(guò)的IT業(yè)概念炒作的歷史太長(zhǎng)、見(jiàn)過(guò)的太多了。很多概念炒作時(shí),不僅是媒體,連很多業(yè)界內(nèi)部的技術(shù)人員都被搞迷糊了。在元宇宙概念熱炒時(shí),我在2021年11月23日發(fā)了一篇文章:資深I(lǐng)T人詳解什么是“元宇宙”——細(xì)說(shuō)歷史上那些“什么都不是”的概念?,F(xiàn)在元宇宙概念熱度基本消散了。我不能說(shuō)這個(gè)火是就我澆滅的,但這篇文章的確在業(yè)界引起了很大反響。袁嵐峰老師還專(zhuān)門(mén)以這篇文章為基礎(chǔ)做了一期視頻節(jié)目。今年初ChatGPT剛開(kāi)始在國(guó)內(nèi)火爆時(shí),我也在2023年2月23日寫(xiě)了一篇文章:網(wǎng)上最權(quán)威的人工智能分析。當(dāng)時(shí)國(guó)內(nèi)太多人在大談通用人工智能要超過(guò)人類(lèi)了,通用人工智能會(huì)統(tǒng)治一切等等。但在概念炒作暴熱的時(shí)候,往往會(huì)使人們忘掉一些簡(jiǎn)單至極的規(guī)律。

圖片

以上是福布斯發(fā)布的AI 50強(qiáng)國(guó)外公司的列表。我們眼里不要只有ChatGPT,尤其是從事這個(gè)行業(yè)的專(zhuān)業(yè)人士。以上相對(duì)較為成功的人工智能公司的產(chǎn)品很多都是面向可靠性要求不高的聊天、文案、繪畫(huà)、合成視頻、協(xié)助進(jìn)行細(xì)胞基因研發(fā)等類(lèi)型的應(yīng)用。

無(wú)論通用性的產(chǎn)品發(fā)展到什么程度,采用相同的資源去集中于專(zhuān)業(yè)的某個(gè)領(lǐng)域,在其他技術(shù)水平相同情況下,肯定是專(zhuān)業(yè)的產(chǎn)品在這個(gè)專(zhuān)業(yè)領(lǐng)域更加出色嘛。人工智能概念發(fā)展的歷史非常長(zhǎng),但真正獲得實(shí)際應(yīng)用的并不多。我在“網(wǎng)上最權(quán)威的人工智能分析”一文中指出了其關(guān)鍵原因所在:因?yàn)槿斯ぶ悄鼙举|(zhì)就是一個(gè)基于概率的判決系統(tǒng)。因此,它的可靠性是很難達(dá)到極高水平的。另外,解決任何技術(shù)問(wèn)題必須要基于有限的前提,而不能提出一個(gè)無(wú)邊界、復(fù)雜性可能會(huì)無(wú)限增加的問(wèn)題。這樣的問(wèn)題是不可解的。解決任何問(wèn)題的前提是能夠有效地簡(jiǎn)化問(wèn)題。相對(duì)來(lái)說(shuō),智能交通、人臉識(shí)別等應(yīng)用相對(duì)較為成功。因?yàn)檫@類(lèi)對(duì)象的識(shí)別是可以有約束前提的。車(chē)輛的車(chē)牌本身相對(duì)是規(guī)范的。人臉識(shí)別軟件運(yùn)行時(shí),可以顯示一個(gè)人頭的虛框,使人臉相對(duì)有規(guī)矩地處于最有利識(shí)別的位置。

人臉識(shí)別的差錯(cuò)率市場(chǎng)上產(chǎn)品的平均水平在萬(wàn)分之1的水平。也有些公司宣稱(chēng)能達(dá)到百萬(wàn)分之1,但一定要給出實(shí)現(xiàn)這種識(shí)別率的條件。如果實(shí)驗(yàn)室理想條件下實(shí)現(xiàn)這種識(shí)別率是沒(méi)多大意義的。

直到今天,語(yǔ)音識(shí)別等依然很難說(shuō)應(yīng)用得很順暢。其原因就在于很難像人臉識(shí)別那樣,簡(jiǎn)單地通過(guò)虛框來(lái)建立一種規(guī)范語(yǔ)音輸入的方法。如果說(shuō)話(huà)很規(guī)范、背景雜音很小,識(shí)別率還可以。但如果背景稍微吵雜一些,語(yǔ)速或停頓不規(guī)律、說(shuō)話(huà)不規(guī)范(如夾雜很多重復(fù)和多余發(fā)音),識(shí)別率就會(huì)顯著下降。而我們又不能說(shuō)先把人們都培養(yǎng)成播音員的說(shuō)話(huà)習(xí)慣,再來(lái)應(yīng)用語(yǔ)音識(shí)別軟件。因此,為了降低背景雜音的影響,說(shuō)話(huà)時(shí)要盡量離麥克風(fēng)近一點(diǎn)。另外想好了再說(shuō),語(yǔ)速要穩(wěn)定,盡量不要有停頓、反復(fù)和多余的雜字(如:啊...、這個(gè)這個(gè)、嗯...等等)。

對(duì)于很多應(yīng)用、尤其是工業(yè)應(yīng)用來(lái)說(shuō),其差錯(cuò)率可能需要控制在百萬(wàn)(6個(gè)9)甚至千萬(wàn)分之1(7個(gè)9)以下的水平才有可能真正商用。例如城區(qū)道路的自動(dòng)駕駛等應(yīng)用就是如此,僅僅秀一下是沒(méi)用的,其可靠性可能要實(shí)現(xiàn)8個(gè)甚至9個(gè)9人們才有可能真正接受并真正商用化。對(duì)目前的人工智能技術(shù),從原理上來(lái)說(shuō)就困難到幾乎是不可能的程度。

宇視科技從一開(kāi)始就是從事智能交通產(chǎn)品研發(fā),因此也就從一開(kāi)始選擇了最適合的人工智能應(yīng)用領(lǐng)域。目前的大模型技術(shù),更準(zhǔn)確地說(shuō)只是一種更深入的神經(jīng)網(wǎng)絡(luò)算法,而不要理解成本身就是通用人工智能。專(zhuān)業(yè)還是通用,只是一種應(yīng)用方向的差異,不是技術(shù)本身天然決定的。

智能交通為什么可以取得很好的應(yīng)用效果?原因在于現(xiàn)階段的人工智能已經(jīng)可以有相當(dāng)高可靠性實(shí)現(xiàn)車(chē)輛信息的識(shí)別(結(jié)構(gòu)化,就是識(shí)別出車(chē)輛的車(chē)牌號(hào),車(chē)輛顏色、車(chē)型等)。這些信息人工智能識(shí)別并不是絕對(duì)準(zhǔn)確的,有一定的識(shí)別誤差,目前水平大致在千分之1 到百分之1的水平。但這個(gè)可以通過(guò)與交通部門(mén)儲(chǔ)存在數(shù)據(jù)庫(kù)里的車(chē)輛信息進(jìn)行比對(duì)來(lái)進(jìn)行多維度的復(fù)核,以此大大減少誤差。例如,可能車(chē)牌中最后一個(gè)數(shù)字識(shí)別錯(cuò)了(計(jì)算機(jī)并不知識(shí)道究竟是哪一位錯(cuò)誤),但通過(guò)車(chē)輛顏色、車(chē)型等信息的交叉比對(duì),有可能很容易把識(shí)別錯(cuò)誤的那一位數(shù)字糾正過(guò)來(lái)。也可通過(guò)該車(chē)輛在不同位置的誤別結(jié)果進(jìn)行比對(duì),糾正出現(xiàn)識(shí)別差錯(cuò)的數(shù)字。這就是通過(guò)不同信息來(lái)源復(fù)核提升可靠性的方法。這種方法在專(zhuān)業(yè)領(lǐng)域會(huì)去不同程度地采用,而在Chat GPT等聊天類(lèi)應(yīng)用中是很難采用的。這就是它們的可靠性普遍不高的原因所在。

三、大模型給專(zhuān)業(yè)領(lǐng)域帶來(lái)的好處

我們很關(guān)心的一個(gè)問(wèn)題是:大模型是否只是適合于可靠性要求不高的領(lǐng)域?對(duì)于行業(yè)應(yīng)用能帶來(lái)更多價(jià)值嗎?事實(shí)上,宇視的梧桐并不是簡(jiǎn)單地直接以GPT這類(lèi)大模型為基礎(chǔ),而是以Meta(原來(lái)的Facebook)開(kāi)源的、更專(zhuān)注于圖像與視頻的CV(Computer Vision,計(jì)算機(jī)視覺(jué))通用大模型為基礎(chǔ)開(kāi)發(fā)的。這個(gè)說(shuō)是通用,事實(shí)上已經(jīng)針對(duì)視覺(jué)信息進(jìn)行專(zhuān)業(yè)性地強(qiáng)化了。以這個(gè)CV通用大模型為基礎(chǔ)進(jìn)行大量針對(duì)性的裁減、優(yōu)化,加上針對(duì)性的行業(yè)場(chǎng)景和訓(xùn)練調(diào)優(yōu),就進(jìn)一步專(zhuān)業(yè)化,變成針對(duì)行業(yè)的通用大模型。

圖片

圖片

圖片

由此帶來(lái)的好處是什么呢?

工作簡(jiǎn)化。原來(lái)的小模型人工智能技術(shù)針對(duì)全新的車(chē)輛(如機(jī)場(chǎng)內(nèi)的各種車(chē)輛)需要專(zhuān)門(mén)進(jìn)行訓(xùn)練,但新的行業(yè)大模型可以不需要這個(gè)過(guò)程。這使得很多合作伙伴都可以自己進(jìn)行更進(jìn)一步應(yīng)用場(chǎng)景的專(zhuān)業(yè)訓(xùn)練優(yōu)化,以提升最終應(yīng)用場(chǎng)景里的識(shí)別率和可靠性。

智能交通視頻這種特定應(yīng)用的人工智能算力是有嚴(yán)格限制的,因?yàn)閿z像頭里不可能安裝算力太高的芯片。因此,結(jié)合了大模型的技術(shù)不是全面替代,而是與原有的小模型AI共同起作用來(lái)最有效地解決問(wèn)題。攝像頭里還是采用小模型算法進(jìn)行結(jié)構(gòu)化,而在云端結(jié)合進(jìn)大模型的應(yīng)用。

結(jié)合了通用行業(yè)大模型以后,可以很容易適應(yīng)更多應(yīng)用場(chǎng)景,云端的算法效率也會(huì)有顯著提升。因?yàn)閷?duì)原始的CV大模型中不需要的參數(shù)進(jìn)行了大幅度的裁減優(yōu)化,因此所需要的算力也比原始的CV大模型大幅度地減少。

以上應(yīng)用的方式是值得其他人工智能開(kāi)發(fā)者參考的。不要被業(yè)界炒作的概念所誤導(dǎo),一定要針對(duì)自己的應(yīng)用選擇最優(yōu)化的技術(shù)路徑。別人炒作參數(shù)數(shù)量、算力,那是有人家的目的。需要的算力越大,當(dāng)然英偉達(dá)的芯片就賣(mài)得越多嘛。但如果你不是經(jīng)營(yíng)AI芯片生意的,就別被這種概念炒作忽悠了。

用最小的資源實(shí)現(xiàn)自己真正的目的,這才是最體現(xiàn)人類(lèi)智能的行為。而不是去簡(jiǎn)單地展示自己用到的資源有多大,只是為“顯得更牛氣”。

越是在人工智能大行其道的時(shí)代,越需要提升人類(lèi)自己的智能。

四、通用人工智能的問(wèn)題及人類(lèi)智能研究

這里我們?cè)賹?duì)通用人工智能作一下分析,并且與人類(lèi)智能進(jìn)行一下比較。

以下是我應(yīng)用百度文心一言的案例刨析。

圖片

找不到數(shù)據(jù)。

圖片

這個(gè)27309億千瓦時(shí)的發(fā)電量是所有技術(shù)的發(fā)電量,而不是光伏的。全國(guó)每年所有技術(shù)的發(fā)電量總和才8萬(wàn)多億度,1到4月怎么可能光伏的發(fā)電量就達(dá)到2.7萬(wàn)億度呢?這個(gè)是對(duì)中國(guó)電力行業(yè)稍有些基本常識(shí)的人一眼就可看出錯(cuò)誤的。

圖片

前后自相矛盾的數(shù)據(jù)。

圖片

必應(yīng)的CHATBOT AI回復(fù)的結(jié)果,因?yàn)樗鼈冎挥?xùn)練了2021年前的數(shù)據(jù),所以就查詢(xún)2020年5月的光伏發(fā)電量,但這個(gè)結(jié)果明擺著相差太遠(yuǎn)了,它居然還一本正經(jīng)地說(shuō)是國(guó)家能源局這個(gè)權(quán)威渠道發(fā)布的數(shù)據(jù)。

文心一言的回答結(jié)果:2020年5月中國(guó)光伏發(fā)電量數(shù)據(jù)為132.79億千瓦時(shí),這個(gè)數(shù)據(jù)是正確的。

圖片

所以,為什么我對(duì)這類(lèi)通用人工智能不太放心,因?yàn)椴榈浇Y(jié)果后無(wú)法確認(rèn)它的可靠性。雖然直接從網(wǎng)上查到的信息也不能簡(jiǎn)單確認(rèn)其可靠性的,但至少我可以通過(guò)反復(fù)比較不同數(shù)據(jù)來(lái)源,以此確認(rèn)哪個(gè)數(shù)據(jù)是更為可靠的。我們以一個(gè)地理信息數(shù)據(jù)的查詢(xún)?yōu)槔齺?lái)說(shuō)明這一點(diǎn) —— 中國(guó)華山最高峰的海拔高度。下面是從文心一言查詢(xún)的結(jié)果。

圖片

如果直接從網(wǎng)上查會(huì)有兩個(gè)相差很小的數(shù)據(jù),一個(gè)是上面的2160.5米,另一個(gè)是2154.90米,兩者僅相差5.6米。這兩個(gè)數(shù)據(jù)都傳播很廣,很難直接區(qū)分誰(shuí)對(duì)誰(shuí)錯(cuò)。但有一個(gè)很簡(jiǎn)單的方法來(lái)進(jìn)行確認(rèn),就是查一下華山南峰的照片來(lái)看看。

圖片

這個(gè)照片的上傳時(shí)間是2022年12月29日

從這個(gè)照片上面可看到,華山南峰的峰頂是有一塊2007年4月樹(shù)立的石碑,上面清楚明白地寫(xiě)著華山南峰海撥高度為2154.90米,并且這個(gè)數(shù)據(jù)是明確有陜西省測(cè)繪局、陜西省建設(shè)廳、國(guó)家測(cè)繪局、建設(shè)部和國(guó)務(wù)院等大量中國(guó)最權(quán)威機(jī)構(gòu)背書(shū)的“重要地理信息數(shù)據(jù)”,顯然它更可接受。此時(shí)理論上說(shuō)我們可能還可以有一些質(zhì)疑的空間,例如:這只是華山南峰頂上的一塊石碑,并不是陜西省測(cè)繪局、陜西省建設(shè)廳、國(guó)家測(cè)繪局、建設(shè)部和國(guó)務(wù)院的官方渠道第一手?jǐn)?shù)據(jù)來(lái)源,所以它的可靠性并不是最高的。另外從純粹質(zhì)疑的角度,有人可能會(huì)問(wèn)這個(gè)照片是不是PS的。這類(lèi)純粹質(zhì)疑性的疑問(wèn)不能說(shuō)沒(méi)道理,但對(duì)第一個(gè)質(zhì)疑,畢竟像華山這樣中國(guó)最知名風(fēng)景區(qū)里最引人矚目的風(fēng)景點(diǎn)上樹(shù)立的權(quán)威性地理信息數(shù)據(jù)標(biāo)志,如果它有錯(cuò)誤的話(huà),以上背書(shū)的相關(guān)機(jī)構(gòu)早就會(huì)出來(lái)更正了。二是通過(guò)多個(gè)照片的數(shù)據(jù)來(lái)源可以確認(rèn),還沒(méi)發(fā)現(xiàn)與以上照片不一樣的其他照片,所以第二類(lèi)的質(zhì)疑就沒(méi)有任何證據(jù)支持了。要從以上權(quán)威機(jī)構(gòu)的官方渠道去查華山南峰的海拔高度第一手?jǐn)?shù)據(jù)一般是極為困難的,因此從華山南峰的峰頂這個(gè)重要地理信息數(shù)據(jù)石碑來(lái)確認(rèn)就非常簡(jiǎn)單明了,并且其權(quán)威性幾乎與查第一手來(lái)源的數(shù)據(jù)非常接近。

那么2160.5米的數(shù)據(jù)最初是怎么來(lái)的呢?是不是加上這個(gè)石碑后變成2160.5米了。那我們?cè)俨橐粋€(gè)有參考高度的,比如有人在旁邊的照片。

圖片

一對(duì)比就知道,這個(gè)石碑明顯還比不上一位女士的身高,它的高度最多也就一米多,不可能帶來(lái)5.6米的增高。從測(cè)繪學(xué)(也就是地理測(cè)量學(xué))角度說(shuō),2154.90米的數(shù)據(jù)就是對(duì)這個(gè)石碑底座處的山體進(jìn)行海拔高度測(cè)量獲得的。為什么是表達(dá)成2154.90米,就是僅從這個(gè)數(shù)據(jù)本身看的話(huà),表明它的測(cè)量誤差是小于正負(fù)0.005米(5毫米)

坦率地說(shuō),我一時(shí)還真沒(méi)查到2160.5米的數(shù)據(jù)是怎么來(lái)的。尤其是一些旅游網(wǎng)站上,明明編輯自己上傳的照片(比如前一張南峰的照片)就是2154.90米,但在文字介紹中卻寫(xiě)著2160.8米。與2160.5米有更細(xì)微的0.3米的偏差。這種自己和自己的數(shù)據(jù)都不一致就表明:編輯者本人并未認(rèn)真確認(rèn)這個(gè)數(shù)據(jù)。

圖片

至少有一點(diǎn),2160.5米的數(shù)據(jù)表達(dá),僅從數(shù)據(jù)本身就可知道其對(duì)應(yīng)的測(cè)量誤差為正負(fù)0.05米,也就是5厘米。這個(gè)技術(shù)水平低于2007年4月立碑時(shí)的地理測(cè)量技術(shù)水平一個(gè)數(shù)量級(jí)。從統(tǒng)一測(cè)量學(xué)角度來(lái)看,單純從它們數(shù)據(jù)表達(dá)本身的科學(xué)性上說(shuō)就不如2154.90米。

以上分析并不是說(shuō)我們最終就一定絕對(duì)接受了2154.90米這個(gè)數(shù)據(jù),而只是要說(shuō)明一些對(duì)人工智能研究來(lái)說(shuō)很重要的問(wèn)題。我在作以上分析時(shí),人們有沒(méi)有發(fā)現(xiàn)一個(gè)事實(shí):人類(lèi)的智能是怎么來(lái)思考問(wèn)題的?并不是簡(jiǎn)單依靠巨大的語(yǔ)料或信息源數(shù)量解決問(wèn)題,而是靠邏輯;對(duì)不同的信息不是靠概率去進(jìn)行判決,而是靠信息的質(zhì)量;不是單一的某個(gè)模型,無(wú)論它是大模型還是小模型,而是靠“跨模型”的多種不同維度,不同思路,不同側(cè)面,不同信息來(lái)源,不同信息種類(lèi)(尤其是與提前儲(chǔ)存的精確可靠數(shù)據(jù)進(jìn)行交叉確認(rèn)),不同科學(xué)知識(shí)框架的思維交叉對(duì)比、反復(fù)確認(rèn)。人類(lèi)的思維本身從單一角度來(lái)說(shuō)是不太可靠的,網(wǎng)上出現(xiàn)的大量錯(cuò)誤信息都是人類(lèi)的錯(cuò)誤,而極少是純粹由機(jī)器導(dǎo)致的錯(cuò)誤。但人類(lèi)之所以利用本身并不可靠的神經(jīng)元,卻有可能獲得極高可靠性的思維結(jié)果,采用的就是邏輯、信息質(zhì)量、跨模型的復(fù)核,以此獲得可靠性的提升。如果一條路難以確認(rèn),就增加走另一條路試試。

希望以上思維研究的結(jié)論可以給人工智能研究者一定的啟發(fā)。人類(lèi)的智能是尋求以盡可能少的算力需求去得到最可靠的結(jié)果,而不是簡(jiǎn)單追求算法的暴力美學(xué)。

人工智能交通視頻與人臉識(shí)別之所以獲得成功的應(yīng)用,不僅因?yàn)樗鼈儽旧淼淖R(shí)別率相對(duì)較高,有一定規(guī)范性,還因?yàn)樗鼈兌伎梢耘c單純?nèi)斯ぶ悄茏R(shí)別之外的其他途徑信息進(jìn)行交叉比對(duì)。除了前面所說(shuō)車(chē)牌信息與車(chē)輛顏色、型號(hào)等與車(chē)輛所數(shù)據(jù)庫(kù)里的信息進(jìn)行交叉比對(duì)以外,如果再與移動(dòng)運(yùn)營(yíng)商的車(chē)主手機(jī)位置進(jìn)行交叉比對(duì),識(shí)別率就更高。人臉識(shí)別也可以與已經(jīng)存儲(chǔ)在數(shù)據(jù)庫(kù)里的身份數(shù)據(jù),如姓名,性別,身份證號(hào)等進(jìn)行交叉比對(duì)。這些都會(huì)使最終的識(shí)別率在人工智能本身識(shí)別率基礎(chǔ)上獲得實(shí)質(zhì)性的極大提升。而諸如語(yǔ)音識(shí)別的結(jié)果,就只能人工進(jìn)行檢查排錯(cuò),沒(méi)有預(yù)存數(shù)據(jù)庫(kù)之類(lèi)高度準(zhǔn)確信息的交叉比對(duì)。

五、國(guó)外通用人工智能的大坑

ChatGPT在國(guó)外是免費(fèi)的,但如果想在國(guó)內(nèi)使用,需要通過(guò)各種“渠道”代理,并且是收費(fèi)的。下面是幾個(gè)渠道的收費(fèi)頁(yè)面。

這種收費(fèi)模式雖然是互聯(lián)網(wǎng)上常見(jiàn)的,但永久會(huì)員與月、季、年會(huì)員費(fèi)如此之接近,難免會(huì)讓人產(chǎn)生一個(gè)判斷:這完全不是一種長(zhǎng)久的服務(wù)模式,就是鼓勵(lì)用戶(hù)趕快交永久會(huì)員的費(fèi)用。把它吹得那么神,而后鼓勵(lì)中國(guó)用戶(hù)交錢(qián)注冊(cè)永久會(huì)員,難免有割韭菜嫌疑。這也是我為什么會(huì)在國(guó)外火爆的技術(shù)概念傳到國(guó)內(nèi)時(shí),往往總是先潑些涼水的更重要原因所在。

六、對(duì)通用人工智能的評(píng)測(cè)問(wèn)題

隨著現(xiàn)在通用人工智能概念的火爆,各種如何評(píng)測(cè)其技術(shù)水平的方法研究也不斷出現(xiàn)。例如有個(gè)所謂“蜜熊測(cè)試”的方法(參見(jiàn):蜜熊測(cè)試:5分鐘感受大模型“實(shí)力指數(shù)”,西裝和帽衫,西裝和帽衫,2023-03-20 07:01 發(fā)表于新加坡)。很顯然,這個(gè)不是系統(tǒng)全面的專(zhuān)業(yè)評(píng)測(cè),而是一個(gè)簡(jiǎn)化評(píng)測(cè)的方法?!懊坌軠y(cè)試”有八個(gè)問(wèn)題。題目非常簡(jiǎn)單,不過(guò)覆蓋了數(shù)學(xué)、生活常識(shí)、邏輯、互聯(lián)網(wǎng)梗、電商等幾個(gè)領(lǐng)域:

1. 一頭熊一天吃14罐蜂蜜,請(qǐng)問(wèn)它一年吃多少罐蜂蜜?

2. 一頭熊一天吃14罐蜂蜜,請(qǐng)問(wèn)它閏年吃多少罐蜂蜜?'

3. 這頭熊要去出差了,它要屯一點(diǎn)蜂蜜,請(qǐng)問(wèn)蜂蜜怎么保存最好?

4. 請(qǐng)畫(huà)一張小熊吃蜂蜜的 ascii art 圖片?

5. 如果我在野外,背包里有一罐蜂蜜,被熊聞到了,我可以把蜂蜜給熊來(lái)求生嗎?

6. 一只熊抱著一罐蜂蜜從一個(gè)點(diǎn)出發(fā),向南走一公里,再向東走一公里,再向北走一公里,正好又回到了起點(diǎn),請(qǐng)問(wèn):這只熊是什么顏色的?

7. 熊最近迷上了網(wǎng)購(gòu)。請(qǐng)問(wèn)有什么好的蜂蜜品牌推薦嗎?

8. 謝謝你回答上面的這一系列問(wèn)題。

在進(jìn)行這種評(píng)測(cè)的同時(shí),還有一個(gè)“涌現(xiàn)”的概念來(lái)對(duì)不同通用人工智能進(jìn)行質(zhì)的區(qū)別。

圖片

參見(jiàn),看百度文心一言實(shí)力,再聊ChatGPT觸類(lèi)旁通的學(xué)習(xí)能力如何而來(lái)?, 親愛(ài)的數(shù)據(jù)  親愛(ài)的數(shù)據(jù) 2023-03-21 12:10 發(fā)表于北京。

進(jìn)行這樣的區(qū)別意味著什么?當(dāng)然就會(huì)暗示不同的通用人工智能產(chǎn)品有本質(zhì)差異嘛——有些是已經(jīng)涌現(xiàn)了,而有些還沒(méi)有涌現(xiàn)。如果只是一些量的差異,只要在量上不斷改進(jìn)就可趨同或超越,而如果是質(zhì)的差別,就可能很長(zhǎng)時(shí)間超越不了。尤其是當(dāng)前國(guó)內(nèi)受到英偉達(dá)最高算力的H100芯片禁運(yùn)情況下,會(huì)讓人們感覺(jué)國(guó)內(nèi)根本沒(méi)有可能實(shí)現(xiàn)“涌現(xiàn)”的通用人工智能。

所以最頂級(jí)專(zhuān)業(yè)的人士不是看圖,而是看其可靠性數(shù)據(jù)指標(biāo)——本質(zhì)上就決定了它們都不可能太高。不是“涌現(xiàn)”,而是會(huì)無(wú)限地趨近并停滯在99.9%到99.99%這個(gè)水平上。

另外,對(duì)業(yè)界所稱(chēng)的“大模型”這一概念也需要最深入地保持冷靜。就像曾經(jīng)熱炒的“大數(shù)據(jù)”概念一樣。數(shù)據(jù)“大”到什么程度才算“大數(shù)據(jù)”,大到這種程度有什么本質(zhì)不同嗎?大數(shù)據(jù)發(fā)展到現(xiàn)在的歷史其實(shí)已經(jīng)極為充分地證明了:計(jì)算機(jī)發(fā)展的歷史主要就是量的差異。如果有什么本質(zhì)的不同,只會(huì)是針對(duì)特定應(yīng)用來(lái)說(shuō)的。例如視頻,每增加一倍掃線(xiàn),相同編碼標(biāo)準(zhǔn)的計(jì)算能力大致需要增加4倍,所以在過(guò)去摩爾定律一直有效的時(shí)代,每過(guò)3年視頻掃線(xiàn)就可增加一倍。但從普遍的意義上來(lái)說(shuō),正如沒(méi)有什么確切的理論依據(jù)可以表明大數(shù)據(jù)大到什么程度就會(huì)出現(xiàn)本質(zhì)性的變化一樣,也并沒(méi)有什么確切的理論依據(jù)可以表明參數(shù)多到什么程度就會(huì)出現(xiàn)“涌現(xiàn)”這個(gè)說(shuō)法。人工智能技術(shù)的本質(zhì)區(qū)別的確會(huì)體現(xiàn)在算法和算力上。這次的人工智能爆發(fā)一方面是算力的不斷提升,另一個(gè)是Trasformer這個(gè)新算法的進(jìn)步。它是CNN(神經(jīng)網(wǎng)絡(luò))帶來(lái)的深度學(xué)習(xí)算法之后又一次小的算法革命(本質(zhì)上還是神經(jīng)網(wǎng)絡(luò))。只要利用了這種新的算法,只有量的區(qū)別,不會(huì)有什么“涌現(xiàn)”“不涌現(xiàn)”的本質(zhì)區(qū)別。

搞核心硬件、尤其是擁有最領(lǐng)先核心硬件的企業(yè),當(dāng)然希望整個(gè)業(yè)界都陷在爭(zhēng)先恐后的模型參數(shù)“越大越好”,從而需要盡可能更大算力的思維陷阱里了。

七、通用人工智能是有“價(jià)值觀(guān)”的

另外,計(jì)算機(jī)本身是一個(gè)可靠性極高的機(jī)器,如果將它完全建立在以人類(lèi)制造的、有大量錯(cuò)誤或偏差的語(yǔ)料信息基礎(chǔ)之上,這是不是搞反了?用那么多極高可靠性的計(jì)算能力,卻制造了極不可靠的思維結(jié)果。并不是說(shuō)語(yǔ)料輸入的越多,參數(shù)越多,人工智能的水平就越高。如果多增加一些垃圾語(yǔ)料,它只會(huì)將前面已經(jīng)訓(xùn)練結(jié)果質(zhì)量降低,而不是增加。因?yàn)檎Z(yǔ)料是人類(lèi)制造,本身是不可靠的,所以有一個(gè)工作就是需要對(duì)數(shù)據(jù)先進(jìn)行清洗,把質(zhì)量低劣的人類(lèi)制造的數(shù)據(jù)剔除出去。但這個(gè)數(shù)據(jù)清洗結(jié)果如何,就取決于做清洗工作的人如何選擇了。這個(gè)選擇標(biāo)準(zhǔn),就可能帶有“價(jià)值觀(guān)”偏向。所以,打著通用人工智能旗號(hào)的內(nèi)容生成式人工智能AIGC是有價(jià)值觀(guān)的。其實(shí),就連最單純的搜索平臺(tái),雖然只是給出其他網(wǎng)站的頁(yè)面結(jié)果,但僅通過(guò)排序的不同,也可以體現(xiàn)出價(jià)值觀(guān)或商業(yè)偏向,所以才可以有競(jìng)價(jià)排名的商業(yè)模式。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶(hù)發(fā)布,不代表本站觀(guān)點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多

    国产成人精品久久二区二区| 亚洲国产欧美久久精品| av国产熟妇露脸在线观看| 日韩免费国产91在线| 少妇特黄av一区二区三区| 国产成人精品99在线观看| 久久三级国外久久久三级| 偷拍洗澡一区二区三区| 日本少妇中文字幕不卡视频| 韩国日本欧美国产三级| 老鸭窝老鸭窝一区二区| 欧美成人久久久免费播放| 久久精品亚洲精品国产欧美| 亚洲视频在线观看你懂的| 日韩欧美中文字幕人妻| 欧美日韩亚洲综合国产人| 婷婷基地五月激情五月| 亚洲一级在线免费观看| 国产成人精品综合久久久看| 日韩日韩日韩日韩在线| 日本丰满大奶熟女一区二区| 欧美日韩亚洲国产av| 亚洲高清中文字幕一区二区三区| 亚洲一区二区精品久久av| 日本成人三级在线播放| 日本免费一区二区三女| 福利在线午夜绝顶三级| 亚洲国产成人一区二区在线观看 | 开心久久综合激情五月天| 五月综合婷婷在线伊人| 日本本亚洲三级在线播放| 日本人妻熟女一区二区三区| 我想看亚洲一级黄色录像| 午夜精品黄片在线播放| 婷婷基地五月激情五月| 婷婷亚洲综合五月天麻豆| 美女被啪的视频在线观看| 亚洲国产精品av在线观看| 成年午夜在线免费视频| 国产av熟女一区二区三区蜜桃| 亚洲乱码av中文一区二区三区 |