一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

一步一步教你使用 NCBI 查找DNA、mRNA、cDNA、Protein、promoter、引物設(shè)...

 叢610 2017-02-23
前言

很多研究僧在詢問如何查詢基因序列、如何進(jìn)行引物設(shè)計(jì)、如何使用BLAST 進(jìn)行序列比對(duì)……,這些問題在 NCBI 上都可以方便的找到答案。

交流經(jīng)驗(yàn)的時(shí)間到啦!

接下來本文將按以下幾個(gè)部分說一下 NCBI 的使用:

Part 1:如何查找基因序列、mRNA、Promoter

Part 2:如何查找連續(xù)的 mRNA、cDNA、蛋白序列

Part 3: 運(yùn)用 STS 查找已經(jīng)公布的引物序列

Part 4:如何運(yùn)用 BLAST進(jìn)行序列比對(duì)、檢驗(yàn)引物特異性




1、利用Map viewer 查找基因序列、mRNA 序列、啟動(dòng)子(Promoter

下面以人的 IL6(白細(xì)胞介素 6)為例講述一下具體的操作步驟

1 打開Map viewer 頁面, 網(wǎng)址為: http://www.ncbi.nlm./mapview/index.html search 的下拉菜單里選擇物種,for 后面填寫你的目的基因。操作完畢如圖所示:


2點(diǎn)擊“GO”出現(xiàn)如下頁面:



3 在步驟二圖示的右下角有一個(gè)Quick Filter,下面是讓你選擇的幾個(gè)復(fù)選框, Gene前面的小方框里打勾,然后點(diǎn)擊Filter. 出現(xiàn)下圖:


說明一下:1、染色體的紅色區(qū)域即為你的目的基因所處位置。2、下面參考序列給出了三個(gè),是不同的部門做出來的,經(jīng)我驗(yàn)證,序列有微小的差異,但總體來說基本相同。盡管你分別點(diǎn)擊后,序列代碼、序列代碼等有所差異,但堿基基本一致,不影響大家研究分析序列?,F(xiàn)在普遍采用的是最上面的那個(gè)序列,這一條是世界范圍的生物科學(xué)家用計(jì)算機(jī)合成的一個(gè)序列。我也推薦大家使用這個(gè)序列。


4點(diǎn)擊上述三條序列第一條序列(即 reference)對(duì)應(yīng)的'Genes seq',出現(xiàn)新的頁面,頁面下方為:


5點(diǎn)擊上圖出現(xiàn)的“Download/View Sequence/Evidence ”,即下載查看序列等功能,結(jié)果如圖所示:


先對(duì)上面這張圖做點(diǎn)簡要的說明,在 Sequence Format(序列輸出格式)后面是一個(gè)下拉式選擇菜單,默認(rèn)的為 FASTA 格式,還有一個(gè)是 GenBank 格式。我推薦大家選擇 GenBnak格式,因?yàn)檫@個(gè)格式提供了很多該基因的信息,而 FASTA格式只有基因序列。


6 Sequence Format 后選擇 GenBank,然后點(diǎn)擊下面的 Display,目的基因的相關(guān)信息和序列就出現(xiàn)在眼前了。點(diǎn)擊后如圖所示(網(wǎng)頁較大,只抓取一小部分以作示范)


在上述打開的網(wǎng)頁中,你可以看到基因長度,基因序列,以及這個(gè)基因是如何被報(bào)道出來的等各種信息。 你會(huì)看到:  mRNA  join(3598..3678,3841..4031,5090..5203,5911..6057, 7803..8394) 這代表了從基因的 3598位開始就是轉(zhuǎn)錄區(qū)了, 即我們常說的 mRNA 片斷, 由于內(nèi)含子的存在,所以 mRNA DNA 序列上分成了幾段。 CDS join(3660..3678,3841..4031,5090..5203,5911..6057, 7803..7970) CDS 代表編碼序列,即蛋白編碼區(qū)是從 3660 開始的(ATG ,由于剪接作用所以 CDS 區(qū)也是不連續(xù)的。


說到這里,可能很多朋友都已經(jīng)明白了 promoter 即啟動(dòng)子區(qū)域在哪里了。但我還是再嘮叨幾句:轉(zhuǎn)錄起始位點(diǎn)前面是基因的調(diào)控區(qū),啟動(dòng)子區(qū)沒有明顯的位置定義,大家也只是猜測它的大體位置,如果你要研究 promoter 區(qū)的話,建議你選擇轉(zhuǎn)錄起始位點(diǎn)前的 2000個(gè)堿基進(jìn)行研究,一般默認(rèn)的是這樣。當(dāng)然你如果覺得長度太長不好研究的話,也可以只研究-1000 0這一千個(gè)堿基,因?yàn)橐话闱闆r下,啟動(dòng)子區(qū)的變異都在這個(gè)區(qū)域內(nèi)。


這樣大家就可以找到自己的目的基因序列和啟動(dòng)子了,這種方法可能使用的人不是很多,但我個(gè)人比較喜歡,因?yàn)樗畲蟮膬?yōu)點(diǎn)是可以找到啟動(dòng)子區(qū)域和其他調(diào)控區(qū)域。希望大家可以發(fā)帖交流,讓我們把 NCBI 用的更好!






2、如何查找連續(xù)的mRNA、cDNA、蛋白序列(依然以人類的 IL6 為例)

1進(jìn)入NCBI 主頁:http://www.ncbi.nlm./ search 后面選擇 Gene,在 for 后面填寫需要查找的基因的名字。如圖所示:



出現(xiàn)了很多基因序列,在每個(gè)序列的右邊還有“Order cDNA clone 的鏈接,這些序列中有些序列是跟你的目的基因同名的,有些是別名(Other Aliases)與你的目的基因一致,根據(jù)每個(gè)序列的介紹認(rèn)真選擇你的目的基因。上圖中我需要的 IL6 是標(biāo)號(hào)為2的序列。


2.1 查找 cDNA 序列

2.1.1  點(diǎn)擊Order cDNA clone, 出現(xiàn)目的頁面如圖所示:



2.1.2  點(diǎn)擊Clone Sequence 后面的鏈接即可得到cDNA 序列。點(diǎn)擊后如圖所示(只抓取其中一部分)



2.2  查找 mRNA、蛋白序列

回到步驟 1 點(diǎn)擊“Go”之后出現(xiàn)的頁面,點(diǎn)擊目的基因的名字,出現(xiàn)以下頁面 (只抓取相關(guān)部分)



頁面的下半部分,即可以獲取 mRNA和蛋白序列的部分:



找到“NCBI Reference Sequences (RefSeq)”,它分為幾個(gè)板塊,第一個(gè)“mRNA and Protein ”區(qū)可以讓我們找到連續(xù)的編碼 mRNA 序列和蛋白序列。在 mRNA and Protein下面有兩個(gè)序列代碼(中間劃有一個(gè)箭頭) ,這代表了 mRNA序列和蛋白序列。分別點(diǎn)擊就可以得到相應(yīng)的序列頁面。點(diǎn)擊后如圖所示,mRNA 序列:


NCBI Reference Sequences (RefSeq)的第二個(gè)板塊是 Reference assembly,它下面顯示的是 Genomic ,點(diǎn)擊 Genomic 下面Reference assembly 對(duì)應(yīng)的 Genbank FASTA 即可出現(xiàn)編碼的 DNA 序列(注意:只是編碼序列,其中包括內(nèi)含子,但一般沒有 5‘非編碼區(qū)) 。一步就不做貼圖演示了吧,


這樣我們就可以找到基因的 cDNA 序列、連續(xù)的編碼 mRNA 序列、蛋白序列以及含有內(nèi)含子的編碼DNA 序列了。相信這些操作對(duì)很多戰(zhàn)友還是有用的。


友情提示:在 NCBI 里打開的每一個(gè)頁面都會(huì)給我們提供大量的信息,大家不妨好好看看,可能會(huì)有令我們驚喜的收獲!






3、運(yùn)用STS 查找已經(jīng)公布的引物序列

STS,序列標(biāo)簽位點(diǎn)(Sequence Tagged Site):一段短的DNA 序列(200500 個(gè)堿基對(duì)),這種序列在染色體上只出現(xiàn)一次,其位置和堿基順序都是已知的。在PCR 反應(yīng)中可以檢測處STS 來,STS 適宜于作為人類基因組的一種地標(biāo),據(jù)此可以判定DNA 的方向和特定序列的相對(duì)位置。以上內(nèi)容基本是STS 的定義,要活學(xué)活用,下面就介紹一下用STS 數(shù)據(jù)庫查找引物的一點(diǎn)經(jīng)驗(yàn)。

還是使用人的IL6 基因?yàn)槔?/span>

1 打開 NCBI 主頁,在 Search 后面的下拉菜單選擇 UniSTS,在 FOR 后面填寫目的基因。

操作完畢如圖所示


點(diǎn)擊GO以后出現(xiàn)以下頁面



這是你會(huì)發(fā)現(xiàn) NCBI 又提供了很多序列,下面我們還是要初步篩選我們需要的序列。


2根據(jù)物種、目的引物所在染色體的位置等選擇相應(yīng)序列(可能不只一個(gè)) ,點(diǎn)擊。 下面以點(diǎn)擊第一個(gè)進(jìn)入的畫面為例。  



你會(huì)發(fā)現(xiàn)這個(gè)頁面直接就給出了引物序列,PCR之后的片段長度也是給了的(247bp 。下面還有很多相關(guān)的信息……


3點(diǎn)擊GeneBank Accession 后面的代碼,進(jìn)入下一個(gè)頁面。



前后引物都呈現(xiàn)在眼前了,還有反應(yīng)體系和反應(yīng)條件!其中 Primer A 是前引物序列,Primer B 則是后引物序列,并且給出了他們?cè)?/span> DNA 序列中的位置。有興趣的朋友可以在序列中找一下,是可以找到的, 不過要注意,PCR 是雙鏈擴(kuò)增,在序列中可以直接找到的是 Primer A 的原序列 Primer B的互補(bǔ)序列。


在步驟二里面我只點(diǎn)開了一個(gè)序列,繼續(xù)打開其他的可能還會(huì)有對(duì)自己有用的引物,不過這要你自己慢慢發(fā)掘了。


這種尋找引物的方法有點(diǎn)投機(jī)取巧的味道,實(shí)用程度不是很高,但如果這里面恰好有你想 P 的片段的話,恭喜你,這些引物都是很成熟的引物,可以直接拿過來使用了。


如果這兩種方法都不能找到你需要的引物的話, 那就自己設(shè)計(jì)吧, 建議使用 Primer 5 Oligo。



4、如何運(yùn)用 BLAST 進(jìn)行序列比對(duì)、檢驗(yàn)引物特異性

提到序列比對(duì),絕大多數(shù)戰(zhàn)友都會(huì)想到 BLAST,但 BLAST 的使用確實(shí)又是一個(gè)很大的難題, 因?yàn)樗墓δ鼙容^強(qiáng)悍, 里面涉及到的知識(shí)比較多, 而且比對(duì)結(jié)束后輸出的結(jié)果參數(shù) (指標(biāo))又很多。如果把 BLAST 的使用詳細(xì)的都講出來,我想我發(fā)帖發(fā)到明天也發(fā)不完,更何況我自己也不是完全懂得 BLAST 的使用。 所以我在這里也就“畫龍點(diǎn)睛”——以比對(duì)核酸序列為例來給大家介紹一下 BLAST 的使用, 也算是 BLAST 的入門課程吧。 請(qǐng)看帖的戰(zhàn)友好好體會(huì),如果你用心看,在看帖完畢之后 BLAST 的基本使用(包括其他序列的比對(duì))應(yīng)該沒有問題了。

1打開BLAST 頁面,http://www.ncbi.nlm./BLAST/ 打開后如圖所示:



對(duì)上面這個(gè)頁面進(jìn)行一下必要的介紹:

BLAST 的這個(gè)頁面主體部分(左面)包括了三部分:BLAST Assembled Genomes、Basic BLASTSpecialized BLAST。相信大家可以看懂這三個(gè)短語的意思,我就不多說了;我要說的是,可以認(rèn)為這是三種序列比對(duì)的方法,或者說是 BLAST 的三條途徑。

第一部分 BLAST Assembled Genomes 就是讓你選擇你要比對(duì)的物種,點(diǎn)擊相應(yīng)物種之后即可進(jìn)入比對(duì)頁面。

第二部分 Basic BLAST 包含了 5 個(gè)常用的 BLAST,每一個(gè)都附有簡短的介紹。

第三部分 Specialized BLAST 是一些特殊目的的 BLAST,如 IgBLASTSNP 等等,這個(gè)時(shí)候你就需要在 Specialized BLAST部分做出適當(dāng)?shù)倪x擇了。


總之, 這是一個(gè)導(dǎo)航頁面, 它的目的是讓你根據(jù)自己的比對(duì)目的選擇相應(yīng)的 BLAST 途徑。

下面以最基本的核酸序列比對(duì)來談一下 BLAST的使用, 期間也會(huì)捎帶著說一下其他序列比對(duì)的方法。


2 點(diǎn)擊Basic BLAST部分的nucleotide blast 鏈接到一個(gè)新的頁面。打開后如圖所示:


介紹一下上述頁面:

Enter Query Sequence 部分是讓我們輸入序列的,你可以直接把序列粘貼進(jìn)去,也可以上傳序列,還可以選擇你要比對(duì)的序列的范圍(留空就代表要比對(duì)你要輸入的整個(gè)序列) 。Job Title 部分還可以為本次工作命一個(gè)名字。


Choose Search Set 部分是讓我們選擇要與目的序列比對(duì)的物種或序列種類(genome DNAmRNA 等等) 。如果是人或老鼠的話,就可以直接選擇了如果是其他物種就要選擇“others”了,這時(shí)候網(wǎng)頁會(huì)主動(dòng)跳出一個(gè)下拉對(duì)話框和一個(gè)輸入式對(duì)話框,你可以分別選擇和輸入要跟你的序列比對(duì)的序列種類和物種。下面的 Entrez Query 可以對(duì)比對(duì)結(jié)果進(jìn)行適當(dāng)?shù)南拗啤?/span>


Program Selection 部分其實(shí)是讓我們選擇本次比對(duì)的精確度,種內(nèi)種間等等。


BLAST 按鈕下面有一個(gè)“Algorithm parameters ,這是參數(shù)設(shè)置選項(xiàng),一般用戶使用不到此項(xiàng),所以它比較隱蔽,點(diǎn)擊,原網(wǎng)頁下方即可增加了 Algorithm parameters 的內(nèi)容。大部分戰(zhàn)友都用不到更改這里面的選項(xiàng),我也不多說了,有興趣的朋友可以自己研究一下。


3依次填寫上述網(wǎng)頁必須部分,點(diǎn)擊 BLAST 按鈕后,出現(xiàn)如下界面(只截取其中一部分)



出現(xiàn)的這個(gè)結(jié)果頁面信息含量非常大,如果我們用心觀察,還是可以發(fā)現(xiàn)其中的一些主要指標(biāo)的。列舉上圖也是為了給大家展示一下這些評(píng)價(jià)標(biāo)準(zhǔn)。其中 Description 部分推薦大家詳細(xì)看一下,另外說一下“E value 這個(gè)指標(biāo)與其他指標(biāo)不同,它的數(shù)值越小相似程度越高,其他幾個(gè)(如 Totle score)都是數(shù)值越高相似度越高。


在這個(gè)圖示的表格下方就是具體的相似性的核酸序列了,還配合著各種參數(shù)的得分。





    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多

    久久国产青偷人人妻潘金莲| 免费观看在线午夜视频| 在线免费国产一区二区三区| 91精品蜜臀一区二区三区| 欧美一区二区三区喷汁尤物| 亚洲一区二区福利在线| 日本免费一区二区三女| 国产欧美日韩一级小黄片| 中文字幕日韩一区二区不卡| 欧美不雅视频午夜福利| 风韵人妻丰满熟妇老熟女av| 日本在线 一区 二区| 午夜精品在线视频一区| 在线观看日韩欧美综合黄片| 91亚洲人人在字幕国产| 人妻久久这里只有精品| 久热香蕉精品视频在线播放| 高潮日韩福利在线观看| 在线日韩欧美国产自拍| 国产精品亚洲一区二区| 黄色国产自拍在线观看| 久久国产青偷人人妻潘金莲| 成年男女午夜久久久精品| 久久大香蕉一区二区三区| 免费在线播放一区二区| 国产高清视频一区不卡| 日本91在线观看视频| 成人午夜爽爽爽免费视频| 欧美性猛交内射老熟妇| 久久精品视频就在久久| 人妻人妻人人妻人人澡| 日韩中文字幕人妻精品| 亚洲中文字幕一区三区| 中文字幕人妻av不卡| 国产精品超碰在线观看| 国产成人亚洲欧美二区综| 欧美尤物在线观看西比尔| 国产又粗又猛又长又大| 中国一区二区三区不卡| 老鸭窝精彩从这里蔓延| 色综合久久六月婷婷中文字幕|