https://m.toutiao.com/is/Jo6h3oG/ 機(jī)器學(xué)習(xí)是一門多學(xué)科交叉專業(yè),涵蓋概率論知識(shí),統(tǒng)計(jì)學(xué)知識(shí),近似理論知識(shí)和復(fù)雜算法知識(shí)。簡(jiǎn)單來說,機(jī)器學(xué)習(xí)涉及面很廣,數(shù)學(xué)知識(shí)和算法都非常重要,要學(xué)會(huì)機(jī)器學(xué)習(xí),必須要掌握數(shù)學(xué),那么有哪些數(shù)學(xué)技能是必須具備的呢?今天就來給大家說說。 在了解機(jī)器學(xué)習(xí)所需的4種數(shù)學(xué)技能之前,讓我們首先描述一下機(jī)器學(xué)習(xí)過程。機(jī)器學(xué)習(xí)過程包括4個(gè)主要階段: 1.問題框架:即你所要解決的問題類型,例如,將電子郵件分類為垃圾郵件或非垃圾郵件的模型,將腫瘤細(xì)胞分類為惡性腫瘤或良性腫瘤的模型,通過將電話分為不同類別來改善客戶體驗(yàn)的模型,以及預(yù)測(cè)貸款是否會(huì)在貸款期限后沖銷,基于不同特征或預(yù)測(cè)因子預(yù)測(cè)房?jī)r(jià)的模型,等等。 2.數(shù)據(jù)分析:即處理可用于構(gòu)建模型的數(shù)據(jù)。它包括特征的數(shù)據(jù)可視化、缺失數(shù)據(jù)的處理、分類數(shù)據(jù)的處理、分類標(biāo)簽的編碼、特征的規(guī)范化和標(biāo)準(zhǔn)化、特征工程、降維、數(shù)據(jù)劃分到訓(xùn)練集、驗(yàn)證集和測(cè)試集等。 3.構(gòu)建模型:在這里你可以選擇要使用的模型,例如線性回歸、邏輯回歸、KNN、支持向量機(jī)、K-均值、蒙特卡羅模擬、時(shí)間序列分析等。數(shù)據(jù)集必須分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。超參數(shù)調(diào)整用于對(duì)模型進(jìn)行微調(diào),以防止過擬合。執(zhí)行交叉驗(yàn)證以確保模型在驗(yàn)證集上表現(xiàn)良好。對(duì)模型參數(shù)進(jìn)行微調(diào)后,將模型應(yīng)用于測(cè)試數(shù)據(jù)集。該模型在測(cè)試數(shù)據(jù)集上的性能與使用該模型對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè)時(shí)預(yù)期的性能大致相等。 4.應(yīng)用:在這一階段,最終的機(jī)器學(xué)習(xí)模型投入生產(chǎn),以開始改善客戶體驗(yàn)或提高生產(chǎn)率,或決定銀行是否應(yīng)批準(zhǔn)向借款人提供信貸等。在生產(chǎn)環(huán)境中對(duì)模型進(jìn)行評(píng)估,以評(píng)估其性能。這可以通過使用A/B測(cè)試等方法將機(jī)器學(xué)習(xí)解決方案的性能與基線或控制解決方案進(jìn)行比較來實(shí)現(xiàn)。從實(shí)驗(yàn)?zāi)P娃D(zhuǎn)換到生產(chǎn)線上的實(shí)際性能時(shí)遇到的任何錯(cuò)誤都必須加以分析。這樣就可以用來微調(diào)原始模型。 構(gòu)建機(jī)器學(xué)習(xí)模型所需的大部分?jǐn)?shù)學(xué)技能都用于第2、3和4階段,即數(shù)據(jù)分析、模型構(gòu)建和應(yīng)用。 一.統(tǒng)計(jì)與概率統(tǒng)計(jì)與概率用于特征可視化、數(shù)據(jù)預(yù)處理、特征轉(zhuǎn)換、數(shù)據(jù)插補(bǔ)、降維、特征工程、模型評(píng)估等。以下就是需要我們熟悉并掌握的內(nèi)容:
二.多元微積分大多數(shù)機(jī)器學(xué)習(xí)模型是建立在一個(gè)數(shù)據(jù)集有幾個(gè)特點(diǎn)或預(yù)測(cè)。因此,熟悉多變量微積分對(duì)于建立機(jī)器學(xué)習(xí)模型是非常重要的。以下是我們需要熟悉的知識(shí)點(diǎn):
三.線性代數(shù)線性代數(shù)是機(jī)器學(xué)習(xí)中最重要的數(shù)學(xué)技能。數(shù)據(jù)集表示為矩陣。線性代數(shù)用于數(shù)據(jù)預(yù)處理、數(shù)據(jù)轉(zhuǎn)換和模型評(píng)估。以下是我們需要熟悉的知識(shí)點(diǎn):
四.最優(yōu)方法大多數(shù)機(jī)器學(xué)習(xí)算法都是通過最小化目標(biāo)函數(shù)來進(jìn)行預(yù)測(cè)建模,從而學(xué)習(xí)必須應(yīng)用于測(cè)試數(shù)據(jù)的權(quán)重,以獲得預(yù)測(cè)的標(biāo)簽。以下是我們需要熟悉的知識(shí)點(diǎn):
以上為機(jī)器學(xué)習(xí)入門必須要掌握的基礎(chǔ)技能,如果你覺得機(jī)器學(xué)習(xí)內(nèi)容很多,知識(shí)點(diǎn)很亂,無法速成,不妨按照上面列出的知識(shí)點(diǎn)來進(jìn)行學(xué)習(xí)規(guī)劃,雖然不是很全,但足以支撐你在機(jī)器學(xué)習(xí)建模的過程中靈活使用。
|
|