1. 溫故知坑實(shí)踐是學(xué)習(xí)知識的最好途徑。之前我講的內(nèi)容都非常非?;A(chǔ),包括:
通過不斷的踩坑,走彎路,我們可以在勤奮的基礎(chǔ)上,找一些快速的方法。我們已經(jīng)不能再像上大學(xué)時候一樣了,先啃完一本書,學(xué)好各種基礎(chǔ)知識,然后開始應(yīng)用。工作之繁忙,生活之瑣碎,各種被電子產(chǎn)品占據(jù)走的時間。已經(jīng)很難找出一整塊的時間去學(xué)習(xí)了。 換句話說,沒有目的性的理論學(xué)習(xí)就是耍流氓。怎么講這么多數(shù)據(jù)類型,格式,可是我用不著呀?因此,我們調(diào)整策略,按照完成project為主線來解說在完成數(shù)據(jù)分析的過程中,我們需要用的R語言知識。 2. 一個超級簡單的project流程以我之前處理的GEO數(shù)據(jù)為藍(lán)本,我們詳細(xì)的介紹每一個數(shù)據(jù)處理過程,所需要的知識(不僅僅是R語言代碼,還有各種背景知識)。 步驟基本上是:導(dǎo)入數(shù)據(jù)--整理為可以進(jìn)行分析的形式--差異分析(火山圖等)--GO/KEGG注釋(各種好看的圖)。其中每一個步驟都可以說是好幾把辛酸淚。但素!為了降低炸毛的風(fēng)險,我自己捏造了一段非常非常小的數(shù)據(jù)用來做示例。想要跟著我步驟的小伙伴,需要這小小數(shù)據(jù),你們可以想辦法找到我。 so,今天我們來講,導(dǎo)入數(shù)據(jù)!(1)首先自然是要有數(shù)據(jù)數(shù)據(jù)的來源:A. 自己課題組的各種測序結(jié)果,在經(jīng)過linux的上游分析之后,得到一個表達(dá)量和分組的表格(我們也稱之為表達(dá)矩陣),經(jīng)過精心整理之后,它大概需要變成這樣: B. 從公共數(shù)據(jù)庫下載:例如GEO、TCGA數(shù)據(jù)庫(知識點(diǎn):自行去了解這兩個數(shù)據(jù)庫),那根據(jù)數(shù)據(jù)庫的不同,下載的數(shù)據(jù)也是有所不同的。GEO數(shù)據(jù)可以直接通過R語言下載,可以說是非常方便了! (2)載入數(shù)據(jù)方式R語言載入數(shù)據(jù)的方式如下:
看到這么多會直接炸毛,這么多!沒關(guān)系,我們又沒有期末考,掌握自己所需要的就可以了。 最最最常見的數(shù)據(jù)就是txt,xls,csv(有點(diǎn)像xls)。 (3)讀取Excel文件step 1-2 新建proj,管理文件,雙擊打開我在桌面上新建一個文件夾,叫做“train”。 step 3 將Excel另存為csv文件,而后載入## 方法一:另存為csv文件之后,以下代碼均可以讀取數(shù)據(jù) step 4 我偏不另存為,我就要讀Excel好的,妥妥的滿足你!雖然我不會,但是我去話了小潔大佬,她支的招就是,使用R包 tidyverse 詳情請看:如何實(shí)現(xiàn)Excel和R語言雙劍合璧
不想看幫助文檔學(xué)代碼的我,發(fā)現(xiàn)了一個小妙招: ## 根據(jù)R語言的提示,然后就妥妥的學(xué)會啦 最終三種方式載入的數(shù)據(jù)都是一樣的漂亮~ 至于txt文檔怎么載入,我想你用到的時候,定會查到的!3. 還是溫故知新的!其實(shí)寫這篇推文呢,我才是最大的收獲者,為了寫得簡潔明了,我回去自己看了一下書,然后又請教了小潔,真是妥妥的--溫故知不足,求索方知新。大家加油吧! 再說一遍~需要數(shù)據(jù)的同學(xué)要么找到我,要么你自己手打咯~~反正也不多嘛~ |
|