一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

芯片探針I(yè)D的基因注釋以前很麻煩

 健明 2021-07-14

最近在答疑群里收到一個(gè)很經(jīng)典的提問(wèn),就是:

  • 請(qǐng)問(wèn)各位老師,GPL570芯片中應(yīng)該有部分基因是LncRNA,能否通過(guò)基因重注釋的方式把有意義的LncRNA篩選出來(lái)呢?R語(yǔ)言能否實(shí)現(xiàn)呢?

而且學(xué)生特別的好學(xué),已經(jīng)懂得去搜索我們已有的1.3萬(wàn)篇教程,找到了芯片探針序列重新注釋的流程,但是我昨天就說(shuō)到過(guò):芯片探針序列的基因注釋已經(jīng)無(wú)需你自己親自做了, 肯定是學(xué)員沒(méi)有追我們的公眾號(hào)最新教程,不過(guò)這個(gè)不能怪他。這個(gè)是公眾號(hào)的弊端,太多冗余信息讓大家分心,與我們真正的知識(shí)分享初衷背道而馳了。

所以呢,其實(shí)使用我們的包,安裝方法說(shuō)到過(guò):芯片探針序列的基因注釋已經(jīng)無(wú)需你自己親自做了, ,使用起來(lái)也非常簡(jiǎn)單:

library(AnnoProbe)
ids=idmap('GPL570',type = 'soft')
head(ids)

僅僅是一句話(huà),就拿到了這個(gè)平臺(tái)的探針的注釋信息,如下:

但是呢,我們還是探索一下,因?yàn)檫@個(gè)是下載的GPL的soft文件里面的注釋信息,所以可以看到是有一些探針居然是對(duì)應(yīng)多個(gè)基因,其實(shí)是因?yàn)檫@些基因本身坐標(biāo)就是有overlap,所以呢, 探索的代碼就會(huì)稍微復(fù)雜一點(diǎn)。

ids=ids[nchar(ids[,2])>1,]
ids1=ids[grepl('///',ids[,2]),]
ids2=ids[!grepl('///',ids[,2]),]
# 我覺(jué)得下面的函數(shù)寫(xiě)的很差,運(yùn)行太慢
tmp = do.call(rbind,apply(ids1,1,function(x){
  x[1];x[2]
  data.frame(ID=x[1],symbol=strsplit(x[2],' /// ')[[1]])
})
)
ids=rbind(ids2,tmp)
anno=annoGene(ids$symbol,"SYMBOL")
ids=merge(ids,anno,by.x = 'symbol',by.y='SYMBOL',all.x = T)
sort(table(ids$biotypes))

可以看到,五萬(wàn)多個(gè)探針里面,真正的蛋白編碼基因的探針只有4萬(wàn),剩余的一萬(wàn)多都是可以進(jìn)行探索的。

但是呢,這個(gè)并不是最佳的選擇,因?yàn)槲覀儾](méi)有對(duì)這個(gè)GPL平臺(tái)的探針的堿基序列進(jìn)行參考基因組比對(duì)后,自己重新注釋?zhuān)€是使用的GPL里面的soft文件的信息。

我們看看其它芯片文獻(xiàn)里面的GPL570探針I(yè)D的基因注釋信息

比如Published: 12 March 2019的文章:Identification of Key Long Non-Coding RNAs in the Pathology of Alzheimer’s Disease and their Functions Based on Genome-Wide Associations Study, Microarray, and RNA-seq Data

Briefly, we first downloaded the reference sequences of these potentially AD-related lncRNAs in FASTA format from NONCODE database . 
Second, probe sets of the microarrays were aligned to the lncRNA sequences using SeqMap tool, and the lncRNA-specific probe sets were obtained which contain at least four probes uniquely mapped to the lncRNA sequences without mismatch. 

或者

Briefly, probe sets of HG-U133_Plus_2.0 array were aligned to the human genome (GRCh38) and lncRNA gene sequence from GENCODE (release 23using SeqMap tool with no mismatch [49]. 
Then lncRNA-specific probes were obtained by mapping the genomic locations of probes to the genomic locations of lncRNAs. 
Finally, expression data of 2332 lncRNA were obtained for further analysis.

又或者

we obtained 3215 probes (probe sets) covering 2330 lncRNAs for Affymetrix HG-U133_Plus_2.0 array and 855 probes (probe sets) covering 663 lncRNAs for Affymetrix HG-U133A array, respectively. The expression data of multiple probes (probe sets) mapping to the same lncRNA were integrated by using the arithmetic mean to represent the expression level of single lncRNA.

total of 598 probes corresponding to 452 lncRNAs were obtained for the HG-U133A microarray, while 5,654 probes were matching with 3,793 lncRNAs in the HG-U133 Plus 2.0 microarray. 

又或者

Briefly, the probe sets of Affymetrix HG‐U133 Plus 2.0 were retrieved from the Affymetrix website (http://www.affymetrix.com). We then re‐mapped those probes to the chromosomal positions of the ncRNAs derived from GENCODE (release 24, GRCh38) with no mismatch 14. A total of 2380 probes and 2118 corresponding ncRNA genes were obtained. When multiple probes mapped to the same ncRNA, we used the arithmetic mean of the probe intensities.

參考文獻(xiàn):

  • https://www.ncbi.nlm./pmc/articles/PMC5341997/

  • https://www.ncbi.nlm./pubmed/26183581

  • https://www.ncbi.nlm./pubmed/26362431

  • https://www.ncbi.nlm./pubmed/27105492

  • https://onlinelibrary./doi/full/10.1002/cam4.1047

  • http://dx./10.4048/jbc.2018.21.e39

既然每個(gè)文獻(xiàn)都不一樣

而且大部分人是沒(méi)辦法自主注釋的,所以我們理論上應(yīng)該是有一個(gè)平臺(tái)代替大家做全部的芯片探針的堿基序列的重新注釋。

我們前面提到的:芯片探針序列的基因注釋已經(jīng)無(wú)需你自己親自做了 里面的AnnoProbe包已經(jīng)在幫大家一個(gè)個(gè)的注釋啦。

敬請(qǐng)期待全部GPL的重新注釋。



    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多

    91精品欧美综合在ⅹ| 国产又粗又猛又爽又黄的文字| 精品人妻精品一区二区三区| 中文字幕人妻日本一区二区 | 精品日韩中文字幕视频在线| 欧美韩日在线观看一区| 亚洲国产性生活高潮免费视频| 欧美日韩成人在线一区| 日韩亚洲激情在线观看| 亚洲国产性生活高潮免费视频| 日本人妻精品有码字幕| 日韩免费国产91在线| 国产香蕉国产精品偷在线观看| 日本深夜福利在线播放| 午夜资源在线观看免费高清| 麻豆看片麻豆免费视频| 91播色在线免费播放| 亚洲中文字幕高清乱码毛片| 亚洲精品小视频在线观看| 日本欧美一区二区三区高清| 欧美一区二区三区视频区| 久久综合亚洲精品蜜桃| 亚洲欧美日韩中文字幕二欧美| 又黄又硬又爽又色的视频 | 国产盗摄精品一区二区视频| 三级高清有码在线观看| 粉嫩内射av一区二区| 成人免费视频免费观看| 中国一区二区三区不卡| 成人区人妻精品一区二区三区| 热久久这里只有精品视频| 一本色道久久综合狠狠躁| 日韩美女偷拍视频久久| 国产毛片对白精品看片| 欧洲日本亚洲一区二区| 国产老熟女超碰一区二区三区| 中国美女草逼一级黄片视频| 国产又粗又猛又爽色噜噜| 国产精品福利一级久久| 日韩一区二区三区在线日| 风韵人妻丰满熟妇老熟女av|