pair_end.md

在次世代定序(NGS)中,根據每個 DNA 片段的定序方式,可以分為兩種主要模式:單端定序(Single-End, SE)與雙端定序(Paired-End, PE)。以下詳細說明兩者的差異與應用情境。


一、定序方式說明

單端定序(Single-End, SE)

  • 只對 DNA 片段的一端進行定序

  • 每個片段對應一筆讀段(read)資料

  • FASTQ 檔案為單一檔案(如 sample.fastq.gz

雙端定序(Paired-End, PE)

  • 同時對 DNA 片段的兩端進行定序,產生一對 reads:Read 1 與 Read 2

  • 兩端定序方向相反(forward/reverse),通常可涵蓋整個 DNA 片段

  • FASTQ 通常為兩個配對檔案(如 sample_R1.fastq.gzsample_R2.fastq.gz

  • 當 read pair 在定序後對齊至參考基因組時,能夠根據兩端的相對位置和距離(insert size)來增加定位準確度

  • 可幫助:

    • 偵測結構變異(如插入、缺失、轉位)

    • 精準辨識重複序列區域(例如基因家族)

    • 改善短序列對齊的可信度

    • 輔助基因組組裝(de novo assembly)


二、比較表

項目
單端定序(SE)
雙端定序(PE)

定序方向

一端

兩端(方向相反)

檔案數量

1 個 FASTQ

2 個 FASTQ(Read1 / Read2)

資訊量

較少

較多

對齊準確度

較低

較高,有助於解決重複區域與結構變異

插入片段長度資訊

無法估算

可根據兩端距離估算 insert size

適用情境

表現量分析、快速掃描

基因組重組、變異分析、結構變異偵測等


三、選擇依據

  • 若資源有限、研究需求較簡單(如 RNA 表現分析):可選擇單端定序

  • 若需高準確性或探討結構資訊(如變異偵測、組裝):建議選擇雙端定序


Paired-End 定序提供更高的準確性與資訊量,是目前主流的定序策略之一。雖然其成本與資料處理較為複雜,但其在研究基因組結構與功能上的貢獻非常顯著,尤其適用於複雜樣本分析與臨床應用場景。

Last updated