時間和成本是人們在嘗試學習數(shù)據(jù)科學,人工智能或機器學習時面臨的重大阻礙。自學是一門需要自律和付出才能掌握的藝術(shù)。如果處理得當,你能靈活地將學習與工作相結(jié)合。然而,人工智能或機器學習的開始階段非常艱難,但是請相信我這樣的擔心是值得的。自學時取得良好進展的關(guān)鍵是按照自己的節(jié)奏學習。在這篇文章中,我將分享一個期望學習數(shù)據(jù)科學,人工智能和機器學習,以及在學習其他新事物方面取得良好的進步的人可以遵循的道路。我還將分享我個人使用的資源鏈接,并毫無疑問地推薦這些材料。雖然聽起來很煩人,但是在這個領(lǐng)域中數(shù)學非常重要。我可以肯定地說,任何閱讀這篇文章的人都具有高中數(shù)學的一些基礎(chǔ)知識或中級知識。這是一個好的開始,但在數(shù)據(jù)科學,人工智能和機器學習領(lǐng)域,這些還遠遠不夠。你需要進一步深入研究,并學習一些統(tǒng)計,代數(shù)和其他領(lǐng)域的概念。我會整理一個主題和資源列表,以幫助你學習數(shù)據(jù)科學中的數(shù)學,但是Ibrahim Sharaf ElDen在這篇文章中已經(jīng)完美地做到了。 https:///mathematics-for-data-science-e53939ee8306?gi=e0a64546b594 作為初學者,不要直接開始學習編寫用于機器學習的代碼,而應(yīng)該先學一般的編程核心概念。了解編程的全部內(nèi)容,了解現(xiàn)有代碼的類型以及如何正確編寫代碼。這一點非常重要,因為你將在從事該領(lǐng)域的其余時光中受用于這些基本概念?;c時間在這步當中,而不要急于學習高級的東西,了解此步驟中的大多數(shù)內(nèi)容將決定你在行業(yè)中的表現(xiàn)。你可以在在里找到非常好的介紹編程和計算機科學的視頻。這個視頻將帶你全面了解編程和計算機科學的所有重要概念?;c時間,并確保你了解當中的每一點。https://www./watch?v=zOjov-2OZ0E如今,數(shù)據(jù)科學家,人工智能和機器學習工程師使用多種語言來完成工作,其中最常用的語言是Python,R,Java,Julia和SQL。也可以使用許多其他語言,但出于多種原因,我列出的語言是最常用的語言:如果你有足夠的學習時間并能堅持,那么它們很容易學會并且可以快速用于開發(fā); 它們使你可以用更少的代碼做更多的事情; 它們有一個良好而穩(wěn)固的技術(shù)社區(qū),可以在遇到任何問題時為你提供幫助和支持; 他們擁有你作為數(shù)據(jù)科學家,人工智能或機器學習工程師所需的幾乎所有庫和軟件包; 它們是開源的,可以免費使用。 學習一種以上的語言絕對是沒有錯的,事實上,了解一種以上的語言是有好處的。但你必須花時間,并避免同時學習多種語言,因為這可能會使你感到困惑,并使你暫時迷失方向?;〞r間,一次學習一種語言,并確保僅學習職業(yè)所需的部分。我建議你先學習Python,因為它是一種相對容易理解的語言。我還建議你在學習用于數(shù)據(jù)科學和人工智能 / 機器學習的Python之前先學習一般的Python。https://www./watch?v=r-uOLxNrNk8https://www./watch?v=rfscVS0vtbw&t=5s數(shù)據(jù)不是天上掉下來的,有時根本沒有數(shù)據(jù)供你使用,但是無論如何,你都必須找到一種獲取可以使用的數(shù)據(jù)的方法。與你合作的組織可能有一個很好的數(shù)據(jù)收集系統(tǒng),如果有的話,那么這對你來說是一個加分。否則,你必須找到一種獲取數(shù)據(jù)的方法,不僅可以獲取任何數(shù)據(jù),還能獲取可以用來實現(xiàn)目標的高質(zhì)量數(shù)據(jù)。獲取數(shù)據(jù)并不直接意味著挖掘數(shù)據(jù),它是數(shù)據(jù)挖掘下的一個過程。你可以在互聯(lián)網(wǎng)上的許多地方獲得免費和開源的數(shù)據(jù),有時你可能不得不從網(wǎng)站上抓取數(shù)據(jù)。網(wǎng)絡(luò)抓取非常重要,我懇請每個人都學習它,因為在你作為數(shù)據(jù)科學家,人工智能或機器學習工程師的職業(yè)生涯中可能會需要它。這是有關(guān)網(wǎng)絡(luò)抓取的好教程。https://www./watch?v=0_VZ7NpVw1Y數(shù)據(jù)也可能保存在數(shù)據(jù)庫中,因此作為數(shù)據(jù)科學家,人工智能或機器學習工程師,你必須了解一些數(shù)據(jù)庫管理知識,以便能夠連接到數(shù)據(jù)庫并直接進行工作。在此階段,SQL知識非常重要。你可以在此處學習相關(guān)知識。https://www./watch?v=sTiWTx0ifaM&t=15s這通常稱為數(shù)據(jù)整理。此過程涉及清洗你擁有的數(shù)據(jù),這可以通過對你擁有的數(shù)據(jù)執(zhí)行一些探索性數(shù)據(jù)分析并刪除數(shù)據(jù)中不需要的部分來完成。該過程還涉及將你擁有的數(shù)據(jù)構(gòu)造為可以使用的形式。這個階段是從事數(shù)據(jù)科學,人工智能或機器學習項目中最疲憊的部分。在學習過程中,你使用的大多數(shù)示例數(shù)據(jù)都已經(jīng)做過預處理,但是現(xiàn)實世界中的數(shù)據(jù)可能沒有經(jīng)過任何處理階段。作為一個渴望在此領(lǐng)域做得很好的人,你應(yīng)該找到一些現(xiàn)實世界的數(shù)據(jù)并加以處理。雖然在幾乎任何地方都能找到真實世界的數(shù)據(jù),但Kaggle是全球公司獲取真實世界數(shù)據(jù)的絕佳場所。數(shù)據(jù)整理或處理是一項非常艱巨的任務(wù),但如果你具備始終如一的奉獻精神和堅持力,這對你而言就可能是一件非常有趣的事情了。你可以在此處找到劍橋的教授關(guān)于數(shù)據(jù)整理的精彩演講:https://www./watch?v=sz_dsktIjt4作為數(shù)據(jù)科學家,人工智能或機器學習工程師,也不一定意味著你所在的公司或團隊中的每個人都將能夠理解你所在領(lǐng)域的技術(shù)或原始格式的數(shù)據(jù)。這就是為什么需要學習數(shù)據(jù)可視化。數(shù)據(jù)可視化基本上是指以圖形形式顯示數(shù)據(jù)的過程,以便使任何人,無論他們具不具備相關(guān)背景,都可以理解數(shù)據(jù)的含義。有許多種可視化數(shù)據(jù)的方法。作為程序員,編寫代碼來進行數(shù)據(jù)可視化應(yīng)該是我們的首選方法,因為這是快速且無成本的??梢允褂盟玫木幊陶Z言附帶的開源庫來編寫代碼進行數(shù)據(jù)可視化。Matplotlib,Seaborn和Bokeh都是我們可以用來可視化數(shù)據(jù)的Python庫。你可以在此處找到有關(guān)使用Matplotlib進行數(shù)據(jù)可視化的視頻教程:https://www./watch?v=yZTBMMdPOww 可視化數(shù)據(jù)的另一種方法是使用諸如Tableau之類的閉源工具,它們可用于進行更優(yōu)雅和復雜的可視化,但它是付費的。Tableau是最常見的工具,它是我個人經(jīng)常使用的工具。我會建議所有人學習使用Tableau。你可以在此處找到有關(guān)使用Tableau的很好的教程:https://www./watch?v=aHaOIvR00So 人工智能和機器學習更像是數(shù)據(jù)科學的子集,因為它們也是由數(shù)據(jù)驅(qū)動的。它們指的是訓練機器或其他無生命物體所涉及的過程,即通過向它們提供經(jīng)過良好處理的數(shù)據(jù)來使其表現(xiàn)得像人。通過逐步指導機器,就可以教機器去做人類可以做的許多事情。在這種情況下,可以將機器想象為完全沒有知識,但逐漸學會識別物體,說話,從錯誤中學習并變得更好的嬰兒。我們也可以用相同的方式教機器來完成這些事情中的大多數(shù)。人工智能和機器學習基本上是通過使用許多數(shù)學算法來賦予機器生命的過程。人工智能和機器學習的全部潛力仍然未知,因為它還是在不斷進步的領(lǐng)域之一。但是目前,人工智能和機器學習已廣泛用于認知任務(wù),例如對象檢測和識別,面部識別,語音識別和自然語言處理,欺詐和垃圾郵件檢測等。我將繼續(xù)深入探討人工智能和機器學習,但現(xiàn)在,我希望你在這里了解人工智能和機器學習的一般應(yīng)用:https://www./watch?v=5hNK7-N23eUhttps://www./watch?v=GwIo3gDZCVQ&t=5s 在這些視頻的結(jié)尾,你應(yīng)該已經(jīng)學習了有關(guān)機器學習的初學者和中級知識,了解了許多可用的機器學習算法,它們的作用以及如何使用它們?,F(xiàn)在,你應(yīng)該已經(jīng)準備好構(gòu)建第一個簡單的機器學習模型了。你可以在Victor Roman的這篇文章的幫助下進行操作:https:///machine-learning-general-process-8f1b510bd8af學會讓在網(wǎng)絡(luò)上部署你的機器學習模型 通過部署你用機器學習構(gòu)建的模型,你就可以將其提供給網(wǎng)絡(luò)上的每個人。為此,需要對Web開發(fā)有很好的了解,因為你需要創(chuàng)建一個網(wǎng)頁或一組網(wǎng)頁來容納模型。你網(wǎng)站的前端還需要與包含模型的后端進行通信。為此,你還需要知道如何構(gòu)建和集成API,以處理這些通信。如果你打算通過管道或Docker容器在云服務(wù)器上部署機器學習模型,則可能需要對云計算和DevOP有很好的了解。部署機器學習模型的方法有很多,但首先,我建議你學習如何使用Python網(wǎng)絡(luò)框架Flask部署機器學習模型。https://www./watch?v=UbCWoMf80PY自學是驚人的,但是沒有什么比直接向行內(nèi)專業(yè)人士請教更好。這是因為你可以學到具有實際意義的概念和其他只有實踐經(jīng)驗才能學到的東西。擁有一名導師有很多好處,但并不是每個導師都能對你的職業(yè)生涯或整個人生產(chǎn)生影響。這就是為什么擁有一個良好的導師很重要。可以在數(shù)據(jù)科學,人工智能和機器學習方面從初學者到專家水平進行培訓,在該平臺上,你將被指派一名私人導師,他將親自和專業(yè)地協(xié)助你在所選領(lǐng)域的發(fā)展。它也是你能找到的的最實惠的網(wǎng)課培訓和指導平臺。但請注意,僅參加課程并從在線資源中學習不會使你成為數(shù)據(jù)科學家,人工智能或機器學習工程師。你必須獲得在這些領(lǐng)域提供認證的機構(gòu)的證書,并且某些工作職位還需要你具有一定的學歷?;ㄐr間學習,獲得認證或?qū)W位,你將準備好上岸。https:///the-self-learning-path-to-becoming-a-data-scientist-ai-or-ml-engineer-9ab3a97ca63518個行業(yè),106個中國大數(shù)據(jù)應(yīng)用最佳實踐案例: (1)《贏在大數(shù)據(jù):中國大數(shù)據(jù)發(fā)展藍皮書》; 免費試讀:https://item.jd.com/12058569.html (2)《贏在大數(shù)據(jù):金融/電信/媒體/醫(yī)療/旅游/數(shù)據(jù)市場行業(yè)大數(shù)據(jù)應(yīng)用典型案例》;
免費試讀:https://item.jd.com/12160046.html (3)《贏在大數(shù)據(jù):營銷/房地產(chǎn)/汽車/交通/體育/環(huán)境行業(yè)大數(shù)據(jù)應(yīng)用典型案例》; 免費試讀:https://item.jd.com/12160064.html (4)《贏在大數(shù)據(jù):政府/工業(yè)/農(nóng)業(yè)/安全/教育/人才行業(yè)大數(shù)據(jù)應(yīng)用典型案例》。 免費試讀:https://item.jd.com/12058567.html
|