一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

菜鳥第一步,跪在數(shù)據(jù)處:R語言讀取數(shù)據(jù)

 生物_醫(yī)藥_科研 2019-01-20

1. 溫故知坑

實(shí)踐是學(xué)習(xí)知識的最好途徑。之前我講的內(nèi)容都非常非?;A(chǔ),包括:

(1)什么是R語言?R語言和Rstudio軟件的安裝,Rstudio的界面介紹;
(2)R語言的基本邏輯,基本數(shù)據(jù)類型;
(3)ggplot基礎(chǔ)繪圖;
(4)學(xué)習(xí)R語言的思路(整理,總結(jié)問題)。

通過不斷的踩坑,走彎路,我們可以在勤奮的基礎(chǔ)上,找一些快速的方法。我們已經(jīng)不能再像上大學(xué)時候一樣了,先啃完一本書,學(xué)好各種基礎(chǔ)知識,然后開始應(yīng)用。工作之繁忙,生活之瑣碎,各種被電子產(chǎn)品占據(jù)走的時間。已經(jīng)很難找出一整塊的時間去學(xué)習(xí)了。

換句話說,沒有目的性的理論學(xué)習(xí)就是耍流氓。怎么講這么多數(shù)據(jù)類型,格式,可是我用不著呀?因此,我們調(diào)整策略,按照完成project為主線來解說在完成數(shù)據(jù)分析的過程中,我們需要用的R語言知識。

2. 一個超級簡單的project流程

以我之前處理的GEO數(shù)據(jù)為藍(lán)本,我們詳細(xì)的介紹每一個數(shù)據(jù)處理過程,所需要的知識(不僅僅是R語言代碼,還有各種背景知識)。

步驟基本上是:導(dǎo)入數(shù)據(jù)--整理為可以進(jìn)行分析的形式--差異分析(火山圖等)--GO/KEGG注釋(各種好看的圖)。其中每一個步驟都可以說是好幾把辛酸淚。

但素!為了降低炸毛的風(fēng)險,我自己捏造了一段非常非常小的數(shù)據(jù)用來做示例。想要跟著我步驟的小伙伴,需要這小小數(shù)據(jù),你們可以想辦法找到我。

so,今天我們來講,導(dǎo)入數(shù)據(jù)!

(1)首先自然是要有數(shù)據(jù)

數(shù)據(jù)的來源:A. 自己課題組的各種測序結(jié)果,在經(jīng)過linux的上游分析之后,得到一個表達(dá)量和分組的表格(我們也稱之為表達(dá)矩陣),經(jīng)過精心整理之后,它大概需要變成這樣:

B. 從公共數(shù)據(jù)庫下載:例如GEO、TCGA數(shù)據(jù)庫(知識點(diǎn):自行去了解這兩個數(shù)據(jù)庫),那根據(jù)數(shù)據(jù)庫的不同,下載的數(shù)據(jù)也是有所不同的。GEO數(shù)據(jù)可以直接通過R語言下載,可以說是非常方便了!

(2)載入數(shù)據(jù)方式

R語言載入數(shù)據(jù)的方式如下:

R語言數(shù)據(jù)的輸入:
(1)手打;(2)文本文件txt;(3)Excel;(4)Acess;(5)其他統(tǒng)計(jì)軟件出來的數(shù)據(jù),例如SPSS,SAS;(6)XML數(shù)據(jù);(7)網(wǎng)頁抓??;(8)Stata;(9)netCDF;(10)HDF5;(11)通過數(shù)據(jù)庫接口下載;(12)通過Stat/Transfer導(dǎo)入數(shù)據(jù) 。

看到這么多會直接炸毛,這么多!沒關(guān)系,我們又沒有期末考,掌握自己所需要的就可以了。

最最最常見的數(shù)據(jù)就是txt,xls,csv(有點(diǎn)像xls)。

(3)讀取Excel文件

step 1-2  新建proj,管理文件,雙擊打開

我在桌面上新建一個文件夾,叫做“train”。


step 3 將Excel另存為csv文件,而后載入
## 方法一:另存為csv文件之后,以下代碼均可以讀取數(shù)據(jù)
data_1<>'train.csv',header = T,sep = ',')
data_2<>'train.csv',header = T,sep = ',')

## 知識點(diǎn),header= T,sep=',' 是什么意思?
## header= T,字面上的意思就是:有抬頭,本文件的抬頭(即列名)就是:
> colnames(data_1)
[1'ensembl_id' 'control_1' 'control_2' 'control_3' 'experiment_1' 'experiment_2'
[7'experiment_3'

## 那什么是sep=',' 你試試看不要這么參數(shù)?試試嘛!
step 4 我偏不另存為,我就要讀Excel

好的,妥妥的滿足你!雖然我不會,但是我去話了小潔大佬,她支的招就是,使用R包  tidyverse

詳情請看:如何實(shí)現(xiàn)Excel和R語言雙劍合璧

# 方法二:我偏不另存為,那就試試tidyverse包
install.packages('tidyverse')
library(tidyverse)  

# 調(diào)出幫助文檔,學(xué)習(xí)如何使用該包
?tidyverse

不想看幫助文檔學(xué)代碼的我,發(fā)現(xiàn)了一個小妙招:


## 根據(jù)R語言的提示,然后就妥妥的學(xué)會啦

data_3<>'train.xlsx')

最終三種方式載入的數(shù)據(jù)都是一樣的漂亮~


至于txt文檔怎么載入,我想你用到的時候,定會查到的!

3. 還是溫故知新的!

其實(shí)寫這篇推文呢,我才是最大的收獲者,為了寫得簡潔明了,我回去自己看了一下書,然后又請教了小潔,真是妥妥的--溫故知不足,求索方知新。大家加油吧!

再說一遍~需要數(shù)據(jù)的同學(xué)要么找到我,要么你自己手打咯~~反正也不多嘛~


    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    日韩精品人妻少妇一区二区| 亚洲欧美黑人一区二区| 东北女人的逼操的舒服吗| 日韩精品一区二区三区四区| 伊人色综合久久伊人婷婷| 国产精品一区二区视频成人| 午夜资源在线观看免费高清| 粉嫩国产一区二区三区在线| 大香蕉伊人精品在线观看| 日韩中文字幕欧美亚洲| 亚洲精品小视频在线观看| 国产一区二区三区成人精品| 日本高清一道一二三区四五区| 日本一级特黄大片国产| 午夜视频成人在线观看| 深夜福利欲求不满的人妻| 日本乱论一区二区三区| 在线观看视频日韩成人| 免费一区二区三区少妇| 亚洲一区精品二人人爽久久| 中文文精品字幕一区二区| 好吊妞视频免费在线观看| 少妇熟女精品一区二区三区| 日本在线 一区 二区| 亚洲熟女诱惑一区二区| 五月天六月激情联盟网| 国产自拍欧美日韩在线观看| 最好看的人妻中文字幕| 亚洲熟妇av一区二区三区色堂 | 东京热加勒比一区二区三区| 亚洲日本韩国一区二区三区| 精品综合欧美一区二区三区| 国产小青蛙全集免费看| 中文字幕高清不卡一区| 亚洲综合精品天堂夜夜| 亚洲男人的天堂久久a| 欧美亚洲91在线视频| 夜夜嗨激情五月天精品| 老熟妇2久久国内精品| 亚洲熟女一区二区三四区| 欧美色婷婷综合狠狠爱|