大家好,這是《Kimi使用,從入門到精通》系列文章的第一篇。 最近,經(jīng)常有小伙伴后臺(tái)咨詢:Kimi怎么用?水平如何?如何寫提示詞?怎么優(yōu)化提示詞?有哪些創(chuàng)新玩法?如何本地化部署? 我想,不如干脆給大家寫一個(gè)系列文章《Kimi使用,從入門到精通》。 萬丈高樓平地起,為了照顧剛來的同學(xué),我們先從常識(shí)講起。 第一篇,用12個(gè)問題帶大家系統(tǒng)了解AI。 1、什么是AI? AI,是Artificial Intelligence的縮寫,翻譯過來就是??智能。 它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門技術(shù)科學(xué),是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量。 說人話就是,AI研究怎么讓機(jī)器表現(xiàn)出智能,模仿人類甚至超越人類。 2、為什么要搞AI? AI是新的革命性技術(shù),業(yè)內(nèi)普遍把它看作是第四次工業(yè)革命的關(guān)鍵技術(shù)。 前三次革命的主角分別是:蒸汽機(jī)、電和計(jì)算機(jī)。 今天,你會(huì)問自己“為什么我們需要電和計(jì)算機(jī)”這個(gè)問題嗎? AI的目標(biāo)是模擬、延伸和擴(kuò)展人類智能,并最終解放全人類。這個(gè)過程,不以任何個(gè)人意志為轉(zhuǎn)移。 3、發(fā)展歷程是怎樣的? AI這個(gè)詞,并非這兩年興起。很多人對(duì)它的關(guān)鍵印象,可能都來自影視劇里的人物。 比如《2001太空漫游》里的“HAL 9000計(jì)算機(jī)”,《終結(jié)者》中的天網(wǎng)以及T-800、T-1000機(jī)器人,《生化危機(jī)》里的紅后,《黑客帝國(guó)》里的殺毒程序“特工斯密斯”。在這些電影中,人工智能無一例外都扮演了反派。 T-800,來自《終結(jié)者1》 使得到現(xiàn)在,依然有不少人在擔(dān)心,AI會(huì)不會(huì)干掉人類?硅基“生命”會(huì)不會(huì)取代碳基生物? 真實(shí)的AI產(chǎn)業(yè)發(fā)展,遠(yuǎn)比電影無趣得多。AI行業(yè)經(jīng)歷了相當(dāng)長(zhǎng)時(shí)間的沉寂,在上世紀(jì)70~80年代經(jīng)歷了兩次“AI寒冬”,直到2022年Midjourney和ChatGPT-3.5出現(xiàn)后,AI才從理論進(jìn)入應(yīng)用,開始走進(jìn)公眾視野。 我總結(jié)了下,AI發(fā)展路徑共有5個(gè)階段:理論→計(jì)算機(jī)(算?、數(shù)據(jù)和算法)→深度學(xué)習(xí)→GenAI→AGI。 當(dāng)前,我們正處于GenAI的時(shí)代。從GenAI到AGI,可能很長(zhǎng),也可能很快。 4、有哪些重要節(jié)點(diǎn)? 20世紀(jì)50年代,“圖靈測(cè)試”、“神經(jīng)網(wǎng)絡(luò)”、“人工智能”概念提出,這是理論階段。 20世紀(jì)70年代~21世紀(jì),從PC到移動(dòng)互聯(lián)網(wǎng),算力、數(shù)據(jù)和算法不斷豐富,為AI誕生打下基礎(chǔ)。 2015年,AlphaGo首次擊敗人類圍棋職業(yè)選手,標(biāo)志著深度學(xué)習(xí)取得了巨大突破,推動(dòng)了自然語言處理(NLP)、機(jī)器視覺(CV)、語音識(shí)別(ASR)等領(lǐng)域的快速發(fā)展,如Siri、天貓精靈、小愛同學(xué)等ANI(弱人工智能)開始出現(xiàn)。 2015年12月11日,人工智能研究組織OpenAI在美國(guó)成立。 2017年Transformer架構(gòu)、2020年Diffusion模型相繼提出,為大模型帶來了底層技術(shù)邏輯,生成式人工智能(GenAI)迅速涌現(xiàn),標(biāo)志事件是2022年11月30日OpenAI推出聊天機(jī)器人ChatGPT-3.5。 2023年3月14日,OpenAI發(fā)布GPT-4。ChatGPT成全球用戶最快破億的應(yīng)用,用時(shí)不到2個(gè)月。 5、為什么要強(qiáng)調(diào)GenAI? AI的終極目標(biāo),是建立通用人工智能(AGI),讓AI可以執(zhí)行人類交代的任何任務(wù)。 而想要實(shí)現(xiàn)AGI,生成式人工智能(GenAI)是不可或缺的一步。 GenAI是先行者,是通往AGI的重要實(shí)驗(yàn)平臺(tái),可以借此探索和驗(yàn)證通向AGI的關(guān)鍵技術(shù)和理念。 6、GenAI的底層技術(shù) 2017年,谷歌八子發(fā)表論文《Attention Is All You Need》,提出了基于multi-head(多頭)自注意力機(jī)制的深度學(xué)習(xí)架構(gòu)Transformer,為大語言模型奠定了基礎(chǔ)。 2020年,Denoising Diffusion Probabilistic Models (DDPM擴(kuò)散模型)提出,為文生圖模型提供了方向,生成的效果越來越逼真。 Transformer架構(gòu)+Diffusion模型,他們共同奠定了如今的GenAI浪潮。 7、AGI是什么?什么又是ANI? AGI的定義,Artificial General Intelligence(通用人工智能),大家都比較統(tǒng)一。 但AGI是什么?行業(yè)內(nèi)還未明確。OpenAI的首席科學(xué)官Ilya表示他沒有見到AGI,OpenAI也沒有見到。黃仁勛則表示會(huì)在10年內(nèi)見到AGI。 一般認(rèn)為,滿足AGI需要符合這幾個(gè)特征:自動(dòng)化、自適應(yīng)、多模態(tài)、高級(jí)推理。 理論上,AGI能夠執(zhí)行人類可以執(zhí)行的任何任務(wù),并比人類表現(xiàn)得更好。 最理想的AI模型:可以輸入任何形式、任何場(chǎng)景的訓(xùn)練數(shù)據(jù),可以學(xué)習(xí)到幾乎“所有”的能力,可以做任何需要做的決策。 與之相對(duì)應(yīng)的,則是ANI(弱人工智能),只能解決某項(xiàng)特定任務(wù)。比如AlphaGo只能下圍棋,它是ANI。 ANI,如今已在我們的很多領(lǐng)域進(jìn)行了應(yīng)用。比如蘋果的Siri、抖音的算法推薦、特斯拉的FSD智駕、高德地圖的紅綠燈預(yù)測(cè)等。 8、GenAI、大模型、AIGC,他們之間是什么關(guān)系? GenAI,也就是生成式人工智能(Generative Artificial Intelligence),是當(dāng)前主流的AI技術(shù),能夠使用生成式模型,生成文本、圖像、音頻、視頻和其他數(shù)據(jù)。 大語言模型,即Large Language Model(LLM),是一種基于機(jī)器學(xué)習(xí)和自然語言處理技術(shù)(NLP)的語言模型,它通過對(duì)大量的文本數(shù)據(jù)進(jìn)行訓(xùn)練,來學(xué)習(xí)人類語言的理解和生成能力。 傳統(tǒng)LLM對(duì)自然語言的處理,是用RNN和CNN。Transformer架構(gòu)提出后,業(yè)內(nèi)便全部轉(zhuǎn)為了Transformer架構(gòu)。 大模型,是GenAI的一種具體實(shí)現(xiàn)形式,主要針對(duì)自然語言處理領(lǐng)域,比如文本方面。 GenAI除了文本生成外,還包括圖像生成、音頻生成和視頻生成等。 AIGC,即Artificial Intelligence-Generated Content,是GenAI生成的具體內(nèi)容,是結(jié)果。 9、GenAI有哪些形式? 目前,GenAI主要有這幾種形式: 1)文生文,text to text,典型應(yīng)用如GPT、Kimi、通義千問等; 2)文生?頻,text-to-audio,如AI音樂Suno、SkyMusic、訊飛聽見等; 3)文生圖/圖?圖,text-to-image,如Midjourney、Dalle3、美圖MiracleVision等; 4)圖?視頻/文生視頻/文生圖再生視頻,text-to-video,如Sora、PixVerse、Dreamina等。 10、GenAI有什么優(yōu)缺點(diǎn)? 優(yōu)點(diǎn): 1)能用自然語言與機(jī)器交互。說大白話就是,電腦能直接聽懂你說的話(支持文字、語音、圖片多模態(tài)),而不需要通過編程語言或特定按鈕來交互。 2)學(xué)習(xí)力驚人。各家大模型基本都訓(xùn)練了上千億甚至上萬億的參數(shù),已學(xué)習(xí)了全球互聯(lián)網(wǎng)上的海量語料。 3)有一定的記憶力。主流的大模型均支持10輪以上的連續(xù)性對(duì)話,能結(jié)合用戶問題的上下文進(jìn)行回答。 4)有一定的推理能力。只能是“一定”,強(qiáng)推理能力目前還做不到。 5)多模態(tài)。各家大模型,正在逐步支持文本、視覺、語音甚至視頻等多感官的交互。 缺點(diǎn): 1)內(nèi)容是生成的,不是標(biāo)準(zhǔn)答案。在面對(duì)開放性問題時(shí),大模型的回答沒有問題;但涉及垂直行業(yè)或唯一結(jié)果指向的問題時(shí),AI會(huì)胡編亂造。 2)幻覺問題。由于AI的回答是生成的,導(dǎo)致幻覺問題經(jīng)常發(fā)生,容易一本正經(jīng)的胡說八道。 3)對(duì)齊。需要提問的人自己也是專業(yè)的,這樣才能鑒別AI回答的真?zhèn)闻c靠譜程度。 4)對(duì)算力依賴。大模型就不說了,燒的是平臺(tái)的算力。但是對(duì)于一些需要本地化部署的圖片、視頻AI,個(gè)人DIY依然很耗算力,經(jīng)常需要1張H100顯卡(售價(jià)25萬元rmb)才能入門。 5)黑箱操作。大模型基本都是“黑箱”操作,開箱即食,其決策過程難以解釋,無法滿足透明度和可追溯的應(yīng)用場(chǎng)景(如法律、醫(yī)療決策)。 11、當(dāng)前的GenAI能做什么? 目前的AI,還無法做到通用解決,但已經(jīng)能夠在我們工作的具體環(huán)節(jié)進(jìn)行替代或輔助工作,而且效率驚人。 需要我們學(xué)會(huì)使用不同的AI工具,來解決工作中的各項(xiàng)具體問題。 12、主流GenAI應(yīng)用有哪些? 針對(duì)國(guó)內(nèi)外網(wǎng),下面是經(jīng)沃垠AI親自使用后,重點(diǎn)推薦的一些AI應(yīng)用。加粗的,為重點(diǎn)推薦。 好了,今天的Kimi系列文(一)就到這里了。下一章,我將用26個(gè)問題給大家系統(tǒng)梳理Kimi。 這是一個(gè)連續(xù)性的Kimi系列文,寫到哪里還得靠各位看官的支持,懇請(qǐng)大力點(diǎn)贊和轉(zhuǎn)發(fā)我們的文章,感謝~ |
|