在進(jìn)行數(shù)據(jù)分析之前,我們要知道數(shù)據(jù)分成主要的兩種類型:連續(xù)性和分類變量。所以如果要進(jìn)行數(shù)據(jù)分析的話,對(duì)于不同的數(shù)據(jù)類型會(huì)有不同的處理方式。對(duì)于解釋過去而言,我們只要是看單個(gè)或者多個(gè)數(shù)據(jù)之間的變化。 這個(gè)網(wǎng)站對(duì)于單個(gè)的數(shù)據(jù)類型,提供了不同的數(shù)據(jù)需要做的基本的分析和基本的可視化建議。例如在連續(xù)性變量里面我們需要查看數(shù)據(jù)的最大值/最小值等;也可以通過直方圖和箱式圖來展示。同時(shí)我們可以點(diǎn)擊任何一個(gè)部分,這樣網(wǎng)站就會(huì)對(duì)這個(gè)類型進(jìn)行簡(jiǎn)單的解釋。例如連續(xù)性變量里面就包括基本概念的介紹以及可視化的介紹。 對(duì)于解釋過去而言,主要是為了反應(yīng)我們收集的數(shù)據(jù)是什么樣子的。例如我們收集了一些患者的數(shù)據(jù)其中包括患者的性別以及血小板計(jì)數(shù)的值,由于性別是分類變量,血小板計(jì)數(shù)是連續(xù)性變量,那么我們首先可以看的就是各自單獨(dú)的數(shù)據(jù)類型是什么樣子的,然后可以看兩者之間的關(guān)系的話是什么樣子的。具體的方法里面都有介紹。 這種主要還是來尋找一個(gè)合適的模型來預(yù)測(cè)未來事件的發(fā)生。這類的分析主要還是偏向于不同的算法了。算法不同,有時(shí)候結(jié)果就不同。同樣的參數(shù)不同結(jié)果可能也不一樣,現(xiàn)在一些biomarker的研究以及機(jī)器人學(xué)習(xí)都是這個(gè)方面。 |
|