一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

簡要介紹十大機器學習算法

 微微一笑很逗人 2023-03-19 發(fā)布于陜西

文章來源于計算機視覺與機器學習,版權(quán)歸作者所有。

機器學習是該行業(yè)的一個創(chuàng)新且重要的領(lǐng)域。我們?yōu)闄C器學習程序選擇的算法類型,取決于我們想要實現(xiàn)的目標。
現(xiàn)在,機器學習有很多算法??赡軐τ诔鯇W者來說,是相當不堪重負的。今天,我們將簡要介紹 10 種最流行的機器學習算法,這樣你就可以適應(yīng)這個激動人心的機器學習世界了!
1. 線性回歸
線性回歸(Linear Regression)可能是最流行的機器學習算法。線性回歸就是要找一條直線,并且讓這條直線盡可能地擬合散點圖中的數(shù)據(jù)點。它試圖通過將直線方程與該數(shù)據(jù)擬合來表示自變量(x 值)和數(shù)值結(jié)果(y 值)。然后就可以用這條線來預測未來的值!
這種算法最常用的技術(shù)是最小二乘法(Least of squares)。這個方法計算出最佳擬合線,以使得與直線上每個數(shù)據(jù)點的垂直距離最小??偩嚯x是所有數(shù)據(jù)點的垂直距離(綠線)的平方和。其思想是通過最小化這個平方誤差或距離來擬合模型。
圖片
例如,簡單線性回歸,它有一個自變量(x 軸)和一個因變量(y 軸)
2. 邏輯回歸
邏輯回歸(Logistic regression)與線性回歸類似,但它是用于輸出為二進制的情況(即,當結(jié)果只能有兩個可能的值)。對最終輸出的預測是一個非線性的 S 型函數(shù),稱為 logistic function, g()。
這個邏輯函數(shù)將中間結(jié)果值映射到結(jié)果變量 Y,其值范圍從 0 到 1。然后,這些值可以解釋為 Y 出現(xiàn)的概率。S 型邏輯函數(shù)的性質(zhì)使得邏輯回歸更適合用于分類任務(wù)。
圖片
邏輯回歸曲線圖,顯示了通過考試的概率與學習時間的關(guān)系。
3. 決策樹
決策樹(Decision Trees)可用于回歸和分類任務(wù)。
在這一算法中,訓練模型通過學習樹表示(Tree representation)的決策規(guī)則來學習預測目標變量的值。樹是由具有相應(yīng)屬性的節(jié)點組成的。
在每個節(jié)點上,我們根據(jù)可用的特征詢問有關(guān)數(shù)據(jù)的問題。左右分支代表可能的答案。最終節(jié)點(即葉節(jié)點)對應(yīng)于一個預測值。
每個特征的重要性是通過自頂向下方法確定的。節(jié)點越高,其屬性就越重要。
圖片
決定是否在餐廳等候的決策樹示例。
4. 樸素貝葉斯
樸素貝葉斯(Naive Bayes)是基于貝葉斯定理。它測量每個類的概率,每個類的條件概率給出 x 的值。這個算法用于分類問題,得到一個二進制“是 / 非”的結(jié)果??纯聪旅娴姆匠淌健?/section>
圖片
樸素貝葉斯分類器是一種流行的統(tǒng)計技術(shù),可用于過濾垃圾郵件!
5. 支持向量機(SVM)
支持向量機(Support Vector Machine,SVM)是一種用于分類問題的監(jiān)督算法。支持向量機試圖在數(shù)據(jù)點之間繪制兩條線,它們之間的邊距最大。為此,我們將數(shù)據(jù)項繪制為 n 維空間中的點,其中,n 是輸入特征的數(shù)量。在此基礎(chǔ)上,支持向量機找到一個最優(yōu)邊界,稱為超平面(Hyperplane),它通過類標簽將可能的輸出進行最佳分離。
超平面與最近的類點之間的距離稱為邊距。最優(yōu)超平面具有最大的邊界,可以對點進行分類,從而使最近的數(shù)據(jù)點與這兩個類之間的距離最大化。
圖片
例如,H1 沒有將這兩個類分開。但 H2 有,不過只有很小的邊距。而 H3 以最大的邊距將它們分開了。
6. K- 最近鄰算法(KNN)
K- 最近鄰算法(K-Nearest Neighbors,KNN)非常簡單。KNN 通過在整個訓練集中搜索 K 個最相似的實例,即 K 個鄰居,并為所有這些 K 個實例分配一個公共輸出變量,來對對象進行分類。
K 的選擇很關(guān)鍵:較小的值可能會得到大量的噪聲和不準確的結(jié)果,而較大的值是不可行的。它最常用于分類,但也適用于回歸問題。
用于評估實例之間相似性的距離可以是歐幾里得距離(Euclidean distance)、曼哈頓距離(Manhattan distance)或明氏距離(Minkowski distance)。歐幾里得距離是兩點之間的普通直線距離。它實際上是點坐標之差平方和的平方根。
圖片
KNN 分類示例
7. K- 均值
K- 均值(K-means)是通過對數(shù)據(jù)集進行分類來聚類的。例如,這個算法可用于根據(jù)購買歷史將用戶分組。它在數(shù)據(jù)集中找到 K 個聚類。K- 均值用于無監(jiān)督學習,因此,我們只需使用訓練數(shù)據(jù) X,以及我們想要識別的聚類數(shù)量 K。
該算法根據(jù)每個數(shù)據(jù)點的特征,將每個數(shù)據(jù)點迭代地分配給 K 個組中的一個組。它為每個 K- 聚類(稱為質(zhì)心)選擇 K 個點?;谙嗨贫龋瑢⑿碌臄?shù)據(jù)點添加到具有最近質(zhì)心的聚類中。這個過程一直持續(xù)到質(zhì)心停止變化為止。
圖片
8. 隨機森林
隨機森林(Random Forest)是一種非常流行的集成機器學習算法。這個算法的基本思想是,許多人的意見要比個人的意見更準確。在隨機森林中,我們使用決策樹集成(參見決策樹)。
為了對新對象進行分類,我們從每個決策樹中進行投票,并結(jié)合結(jié)果,然后根據(jù)多數(shù)投票做出最終決定。
圖片
(a)在訓練過程中,每個決策樹都是基于訓練集的引導樣本來構(gòu)建的。
(b)在分類過程中,輸入實例的決定是根據(jù)多數(shù)投票做出的。
9. 降維
由于我們今天能夠捕獲的數(shù)據(jù)量之大,機器學習問題變得更加復雜。這就意味著訓練極其緩慢,而且很難找到一個好的解決方案。這一問題,通常被稱為“維數(shù)災(zāi)難”(Curse of dimensionality)。
降維(Dimensionality reduction)試圖在不丟失最重要信息的情況下,通過將特定的特征組合成更高層次的特征來解決這個問題。主成分分析(Principal Component Analysis,PCA)是最流行的降維技術(shù)。
主成分分析通過將數(shù)據(jù)集壓縮到低維線或超平面 / 子空間來降低數(shù)據(jù)集的維數(shù)。這盡可能地保留了原始數(shù)據(jù)的顯著特征。
圖片
可以通過將所有數(shù)據(jù)點近似到一條直線來實現(xiàn)降維的示例。
10. 人工神經(jīng)網(wǎng)絡(luò)(ANN)
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)可以處理大型復雜的機器學習任務(wù)。神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一組帶有權(quán)值的邊和節(jié)點組成的相互連接的層,稱為神經(jīng)元。在輸入層和輸出層之間,我們可以插入多個隱藏層。人工神經(jīng)網(wǎng)絡(luò)使用了兩個隱藏層。除此之外,還需要處理深度學習。
人工神經(jīng)網(wǎng)絡(luò)的工作原理與大腦的結(jié)構(gòu)類似。一組神經(jīng)元被賦予一個隨機權(quán)重,以確定神經(jīng)元如何處理輸入數(shù)據(jù)。通過對輸入數(shù)據(jù)訓練神經(jīng)網(wǎng)絡(luò)來學習輸入和輸出之間的關(guān)系。在訓練階段,系統(tǒng)可以訪問正確的答案。
如果網(wǎng)絡(luò)不能準確識別輸入,系統(tǒng)就會調(diào)整權(quán)重。經(jīng)過充分的訓練后,它將始終如一地識別出正確的模式。
圖片
每個圓形節(jié)點表示一個人工神經(jīng)元,箭頭表示從一個人工神經(jīng)元的輸出到另一個人工神經(jīng)元的輸入的連接。
接下來是什么?現(xiàn)在,你已經(jīng)了解了最流行的機器學習算法的基礎(chǔ)介紹。你已經(jīng)準備好學習更為復雜的概念,甚至可以通過深入的動手實踐來實現(xiàn)它們。如果你想了解如何實現(xiàn)這些算法,可以參考 Educative 出品的 Grokking Data Science 課程,該課程將這些激動人心的理論應(yīng)用于清晰、真實的應(yīng)用程序。
祝你學習愉快!
作者介紹:
Fahim ul Haq,曾在 Facebook、Microsoft 工作。Educative.io 聯(lián)合創(chuàng)始人。Educative 旨在幫助學生使用交互式課程來學習編程知識。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    黑丝国产精品一区二区| 国产欧美另类激情久久久| 国产av精品高清一区二区三区| 国产美女网红精品演绎| 日本av一区二区不卡| 国产99久久精品果冻传媒| 高跟丝袜av在线一区二区三区| 国产老女人性生活视频| 一区二区三区18禁看| 亚洲欧美日韩在线看片| 中文字幕中文字幕一区二区| 东京不热免费观看日本| 国产日韩久久精品一区| 国产精品福利一级久久| 欧美日韩一区二区午夜| 欧美日韩精品视频在线| 美女极度色诱视频在线观看| 午夜亚洲少妇福利诱惑| 精品国产91亚洲一区二区三区| 国产精品一区二区三区黄色片| 欧美一级日韩中文字幕| 国产精品日韩精品一区| 国产精品日韩精品最新| 亚洲男人的天堂久久a| 字幕日本欧美一区二区| 欧美激情一区二区亚洲专区| 欧美又大又黄刺激视频| 日韩欧美国产三级在线观看| 国产欧美日韩综合精品二区| 国产美女精品午夜福利视频 | 欧美激情区一区二区三区| 欧美日韩亚洲巨色人妻| 99视频精品免费视频播放| 91欧美视频在线观看免费 | 97人摸人人澡人人人超碰| 少妇高潮呻吟浪语91| 亚洲熟妇熟女久久精品| 色婷婷亚洲精品综合网| 国产欧美性成人精品午夜| 伊人网免费在线观看高清版| 欧美日韩国产精品黄片|