pair_end.md
在次世代定序(NGS)中,根據每個 DNA 片段的定序方式,可以分為兩種主要模式:單端定序(Single-End, SE)與雙端定序(Paired-End, PE)。以下詳細說明兩者的差異與應用情境。
一、定序方式說明
單端定序(Single-End, SE)
只對 DNA 片段的一端進行定序
每個片段對應一筆讀段(read)資料
FASTQ 檔案為單一檔案(如
sample.fastq.gz
)
雙端定序(Paired-End, PE)
同時對 DNA 片段的兩端進行定序,產生一對 reads:Read 1 與 Read 2
兩端定序方向相反(forward/reverse),通常可涵蓋整個 DNA 片段
FASTQ 通常為兩個配對檔案(如
sample_R1.fastq.gz
與sample_R2.fastq.gz
)當 read pair 在定序後對齊至參考基因組時,能夠根據兩端的相對位置和距離(insert size)來增加定位準確度
可幫助:
偵測結構變異(如插入、缺失、轉位)
精準辨識重複序列區域(例如基因家族)
改善短序列對齊的可信度
輔助基因組組裝(de novo assembly)
二、比較表
定序方向
一端
兩端(方向相反)
檔案數量
1 個 FASTQ
2 個 FASTQ(Read1 / Read2)
資訊量
較少
較多
對齊準確度
較低
較高,有助於解決重複區域與結構變異
插入片段長度資訊
無法估算
可根據兩端距離估算 insert size
適用情境
表現量分析、快速掃描
基因組重組、變異分析、結構變異偵測等
三、選擇依據
若資源有限、研究需求較簡單(如 RNA 表現分析):可選擇單端定序
若需高準確性或探討結構資訊(如變異偵測、組裝):建議選擇雙端定序
Paired-End 定序提供更高的準確性與資訊量,是目前主流的定序策略之一。雖然其成本與資料處理較為複雜,但其在研究基因組結構與功能上的貢獻非常顯著,尤其適用於複雜樣本分析與臨床應用場景。
Last updated