一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

生物信息分析中的reads是什么

 昵稱46988079 2020-01-12

由于受目前測序水平的限制,基因組測序時需要先將基因組打斷成DNA片段,然后再建庫測序。reads(讀長)指的是測序儀單次測序所得到的堿基序列,也就是一連串的ATCGGGTA之類的,它不是基因組中的組成。不同的測序儀器,reads長度不一樣。對整個基因組進行測序,就會產生成百上千萬的reads。



測序得到的原始圖像數(shù)據(jù)經 base calling 轉化為序列數(shù)據(jù),我們稱之為 raw dataraw reads ,結果以 fastq 文件格式存儲, fastq 文件為用戶得到的最原始文件,里面存儲 reads 的序列以及 reads 的測序質量。在 fastq 格式文件中每個 read 由四行描述:
  • @read ID

  • TGGCGGAGGGATTTGAACCC

  • +

  • bbbbbbbbabbbbbbbbbbb

  • Single-end(SE)測序:1個fastq文件

  • Pair-end(PE)測序:2個fastq文件分別存放read1和read2的數(shù)據(jù)

每個序列共有4行,第1行和第3行是序列名稱(有的 fq 文件為了節(jié)省存儲空間會省略第三行“+”后面的序列名稱);第2行是序列;第4行是序列的測序質量,每個字符對應第2行每個堿基,第4行每個字符對應的 ASCII 值減去64,即為該堿基的測序質量值,比如 h 對應的 ASCII 值為104,那么其對應的堿基質量值是40。
堿基質量值范圍為0到40。下表為 Solexa 測序錯誤率與測序質量值簡明對應關系,具體計算公式如下:

Q = -10 log10P

Solexa測序錯誤率與測序質量值簡明對應關系:


高通量測序時,在芯片上的每個反應,會讀出一條序列,是比較短的,叫read,它們是原始數(shù)據(jù);

有很多reads通過片段重疊,能夠組裝成一個更大的片段,稱為contig;

多個contigs通過片段重疊,組成一個更長的scaffold;

一個contig被組成出來之后,鑒定發(fā)現(xiàn)它是編碼蛋白質的基因,就叫singleton;
多個contigs組裝成scaffold之后,鑒定發(fā)現(xiàn)它編碼蛋白質的基因,叫unigene.

    本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內容,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    麻豆精品视频一二三区| 爱在午夜降临前在线观看| 成人午夜免费观看视频| 国产女同精品一区二区| 在线视频免费看你懂的| 久七久精品视频黄色的| 国产一区二区三区草莓av| 精品少妇一区二区三区四区| 久久这里只精品免费福利| 不卡一区二区在线视频| 精品熟女少妇av免费久久野外| 亚洲精品中文字幕一二三| 国产精品香蕉免费手机视频| 激情五月激情婷婷丁香| 日韩成人中文字幕在线一区| 日本熟妇熟女久久综合| 国产日韩欧美综合视频| 国产午夜精品亚洲精品国产| 黑色丝袜脚足国产一区二区| 国产色一区二区三区精品视频| 免费观看一区二区三区黄片| 麻豆视传媒短视频免费观看| 激情综合网俺也狠狠地| 粗暴蹂躏中文一区二区三区| 欧美色欧美亚洲日在线| 亚洲欧美日韩在线看片| 91在线播放在线播放观看| 中文字幕在线五月婷婷| 国产精品日韩欧美第一页| av在线免费播放一区二区| 无套内射美女视频免费在线观看| 欧美日韩国产综合在线| 欧美日韩亚洲国产精品| 日韩国产欧美中文字幕| 亚洲精品中文字幕在线视频| 福利在线午夜绝顶三级| 91福利免费一区二区三区| 亚洲国产黄色精品在线观看| 欧美日韩高清不卡在线播放| 国产欧美日韩精品自拍| 五月婷婷欧美中文字幕 |