貢獻人:馬燕鵬 如果喜歡這里的內(nèi)容,你能夠給我最大的幫助就是轉發(fā),告訴你的朋友,鼓勵他們一起來學習。
If you like the content here, the greatest help you can give me is forwarding, so tell your friends and encourage them to learn together. 今天在 Github 上找 NLP 的數(shù)據(jù)集,發(fā)現(xiàn)了這本小冊子。它假定你對機器學習幾乎一無所知。它的目標是給你實際實現(xiàn)能夠從數(shù)據(jù)中學習的程序所需的概念,直覺和工具。這本書分為兩個部分。 第一部分,機器學習的基礎知識,涵蓋以下主題: 什么是機器學習?它被試圖用來解決什么問題?機器學習系統(tǒng)的主要類別和基本概念是什么? 典型的機器學習項目中的主要步驟。 通過擬合數(shù)據(jù)來學習模型。 優(yōu)化成本函數(shù)(cost function)。 處理,清洗和準備數(shù)據(jù)。 選擇和設計特征。 使用交叉驗證選擇一個模型并調整超參數(shù)。 機器學習的主要挑戰(zhàn),特別是欠擬合和過擬合(偏差和方差權衡)。 對訓練數(shù)據(jù)進行降維以對抗 the curse of dimensionality(維度詛咒) 最常見的學習算法:線性和多項式回歸, Logistic 回歸,k-最近鄰,支持向量機,決策樹,隨機森林和集成方法。
第二部分,神經(jīng)網(wǎng)絡和深度學習,包括以下主題: 什么是神經(jīng)網(wǎng)絡?它們有啥優(yōu)勢? 使用 TensorFlow 構建和訓練神經(jīng)網(wǎng)絡。 最重要的神經(jīng)網(wǎng)絡架構:前饋神經(jīng)網(wǎng)絡,卷積網(wǎng)絡,遞歸網(wǎng)絡,長期短期記憶網(wǎng)絡(LSTM)和自動編碼器。 訓練深度神經(jīng)網(wǎng)絡的技巧。 對于大數(shù)據(jù)集縮放神經(jīng)網(wǎng)絡。 強化學習。
第一部分主要基于 scikit-learn ,而第二部分則使用 TensorFlow 。 Scikit-learn 非常易于使用,并且實現(xiàn)了許多有效的機器學習算法,因此它為學習機器學習提供了一個很好的切入點。 TensorFlow 是使用數(shù)據(jù)流圖進行分布式數(shù)值計算的更復雜的庫。它通過在潛在的數(shù)千個多 GPU 服務器上分布式計算,可以高效地訓練和運行非常大的神經(jīng)網(wǎng)絡。TensorFlow 是被 Google 創(chuàng)造的,支持其大型機器學習應用程序。于 2015年11月開源。
目錄結構第一部分 機器學習基礎一、機器學習概覽 二、一個完整的機器學習項目 三、分類 四、訓練模型 五、支持向量機 六、決策樹 七、集成學習和隨機森林 八、降維
第二部分 神經(jīng)網(wǎng)絡與深度學習附錄
下載《Sklearn 與 TensorFlow 機器學習實用指南》電子書
|