一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

機(jī)器學(xué)習(xí)入門:4大基礎(chǔ)數(shù)學(xué)技能一覽

 山峰云繞 2021-02-19

https://m.toutiao.com/is/Jo6h3oG/ 



機(jī)器學(xué)習(xí)是一門多學(xué)科交叉專業(yè),涵蓋概率論知識(shí),統(tǒng)計(jì)學(xué)知識(shí),近似理論知識(shí)和復(fù)雜算法知識(shí)。簡(jiǎn)單來說,機(jī)器學(xué)習(xí)涉及面很廣,數(shù)學(xué)知識(shí)和算法都非常重要,要學(xué)會(huì)機(jī)器學(xué)習(xí),必須要掌握數(shù)學(xué),那么有哪些數(shù)學(xué)技能是必須具備的呢?今天就來給大家說說。

在了解機(jī)器學(xué)習(xí)所需的4種數(shù)學(xué)技能之前,讓我們首先描述一下機(jī)器學(xué)習(xí)過程。機(jī)器學(xué)習(xí)過程包括4個(gè)主要階段:

1.問題框架:即你所要解決的問題類型,例如,將電子郵件分類為垃圾郵件或非垃圾郵件的模型,將腫瘤細(xì)胞分類為惡性腫瘤或良性腫瘤的模型,通過將電話分為不同類別來改善客戶體驗(yàn)的模型,以及預(yù)測(cè)貸款是否會(huì)在貸款期限后沖銷,基于不同特征或預(yù)測(cè)因子預(yù)測(cè)房?jī)r(jià)的模型,等等。

2.數(shù)據(jù)分析:即處理可用于構(gòu)建模型的數(shù)據(jù)。它包括特征的數(shù)據(jù)可視化、缺失數(shù)據(jù)的處理、分類數(shù)據(jù)的處理、分類標(biāo)簽的編碼、特征的規(guī)范化和標(biāo)準(zhǔn)化、特征工程、降維、數(shù)據(jù)劃分到訓(xùn)練集、驗(yàn)證集和測(cè)試集等。

3.構(gòu)建模型:在這里你可以選擇要使用的模型,例如線性回歸、邏輯回歸、KNN、支持向量機(jī)、K-均值、蒙特卡羅模擬、時(shí)間序列分析等。數(shù)據(jù)集必須分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。超參數(shù)調(diào)整用于對(duì)模型進(jìn)行微調(diào),以防止過擬合。執(zhí)行交叉驗(yàn)證以確保模型在驗(yàn)證集上表現(xiàn)良好。對(duì)模型參數(shù)進(jìn)行微調(diào)后,將模型應(yīng)用于測(cè)試數(shù)據(jù)集。該模型在測(cè)試數(shù)據(jù)集上的性能與使用該模型對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè)時(shí)預(yù)期的性能大致相等。

4.應(yīng)用:在這一階段,最終的機(jī)器學(xué)習(xí)模型投入生產(chǎn),以開始改善客戶體驗(yàn)或提高生產(chǎn)率,或決定銀行是否應(yīng)批準(zhǔn)向借款人提供信貸等。在生產(chǎn)環(huán)境中對(duì)模型進(jìn)行評(píng)估,以評(píng)估其性能。這可以通過使用A/B測(cè)試等方法將機(jī)器學(xué)習(xí)解決方案的性能與基線或控制解決方案進(jìn)行比較來實(shí)現(xiàn)。從實(shí)驗(yàn)?zāi)P娃D(zhuǎn)換到生產(chǎn)線上的實(shí)際性能時(shí)遇到的任何錯(cuò)誤都必須加以分析。這樣就可以用來微調(diào)原始模型。

構(gòu)建機(jī)器學(xué)習(xí)模型所需的大部分?jǐn)?shù)學(xué)技能都用于第2、3和4階段,即數(shù)據(jù)分析、模型構(gòu)建和應(yīng)用。

一.統(tǒng)計(jì)與概率

統(tǒng)計(jì)與概率用于特征可視化、數(shù)據(jù)預(yù)處理、特征轉(zhuǎn)換、數(shù)據(jù)插補(bǔ)、降維、特征工程、模型評(píng)估等。以下就是需要我們熟悉并掌握的內(nèi)容:

  • 平均值
  • 中心值
  • 模式
  • 標(biāo)準(zhǔn)差/方差
  • 相關(guān)系數(shù)與協(xié)方差矩陣
  • 概率分布(二項(xiàng)式、泊松分布、正態(tài)分布)
  • p值
  • 貝葉斯定理(精度、召回、正預(yù)測(cè)值、負(fù)預(yù)測(cè)值、混淆矩陣、ROC曲線)
  • A/B測(cè)試
  • 蒙特卡羅模擬

二.多元微積分

大多數(shù)機(jī)器學(xué)習(xí)模型是建立在一個(gè)數(shù)據(jù)集有幾個(gè)特點(diǎn)或預(yù)測(cè)。因此,熟悉多變量微積分對(duì)于建立機(jī)器學(xué)習(xí)模型是非常重要的。以下是我們需要熟悉的知識(shí)點(diǎn):

  • 多變量函數(shù)
  • 導(dǎo)數(shù)和梯度
  • 階躍函數(shù)、Sigmoid函數(shù)、Logit函數(shù)、ReLU(校正線性單元)函數(shù)
  • 成本函數(shù)
  • 函數(shù)的繪制
  • 函數(shù)的最小值和最大值

三.線性代數(shù)

線性代數(shù)是機(jī)器學(xué)習(xí)中最重要的數(shù)學(xué)技能。數(shù)據(jù)集表示為矩陣。線性代數(shù)用于數(shù)據(jù)預(yù)處理、數(shù)據(jù)轉(zhuǎn)換和模型評(píng)估。以下是我們需要熟悉的知識(shí)點(diǎn):

  • 向量
  • 矩陣
  • 矩陣的轉(zhuǎn)置
  • 矩陣的逆
  • 矩陣的行列式
  • 點(diǎn)積
  • 特征值
  • 特征向量

四.最優(yōu)方法

大多數(shù)機(jī)器學(xué)習(xí)算法都是通過最小化目標(biāo)函數(shù)來進(jìn)行預(yù)測(cè)建模,從而學(xué)習(xí)必須應(yīng)用于測(cè)試數(shù)據(jù)的權(quán)重,以獲得預(yù)測(cè)的標(biāo)簽。以下是我們需要熟悉的知識(shí)點(diǎn):

  • 成本函數(shù)/目標(biāo)函數(shù)
  • 似然函數(shù)
  • 誤差函數(shù)
  • 梯度下降算法及其變體(如隨機(jī)梯度下降算法)

以上為機(jī)器學(xué)習(xí)入門必須要掌握的基礎(chǔ)技能,如果你覺得機(jī)器學(xué)習(xí)內(nèi)容很多,知識(shí)點(diǎn)很亂,無法速成,不妨按照上面列出的知識(shí)點(diǎn)來進(jìn)行學(xué)習(xí)規(guī)劃,雖然不是很全,但足以支撐你在機(jī)器學(xué)習(xí)建模的過程中靈活使用。

注:本文屬于轉(zhuǎn)載翻譯文章

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多

    中文字幕乱码一区二区三区四区| 深夜福利亚洲高清性感| 欧美成人免费视频午夜色| 久久精品久久久精品久久| 日韩综合国产欧美一区| 69老司机精品视频在线观看| 国产户外勾引精品露出一区 | 国产日韩欧美在线亚洲| 视频在线免费观看你懂的 | 国产一区欧美一区日本道| 免费在线成人午夜视频| 日韩视频在线观看成人| 一区二区不卡免费观看免费| 日本最新不卡免费一区二区| 亚洲欧美日本成人在线| 国产一区二区三区不卡| av免费视屏在线观看| 中文字幕亚洲精品人妻| 日韩欧美国产三级在线观看| 中文字幕久热精品视频在线| 精品人妻av区波多野结依| 俄罗斯胖女人性生活视频| 日本中文字幕在线精品| 高清一区二区三区不卡免费| 亚洲精品小视频在线观看| 免费观看在线午夜视频| 国产欧美另类激情久久久| 最近最新中文字幕免费| 男人大臿蕉香蕉大视频| 欧美精品在线观看国产| 91日韩欧美国产视频| 国产精品亚洲一区二区| 开心激情网 激情五月天| 国产欧美日韩一级小黄片| 99秋霞在线观看视频| 丰满少妇被猛烈插入在线观看| 国产欧美一区二区久久| 五月婷日韩中文字幕四虎| 99免费人成看国产片| 日韩在线视频精品视频| 日韩午夜老司机免费视频|