2.Bioinformatics_Tools
次世代定序(Next-Generation Sequencing, NGS)產生大量高通量序列資料,需依賴一系列生物資訊工具進行前處理、比對、變異分析與功能註解。以下介紹常見工具及其應用階段。
一、常見分析流程概覽
資料品質檢查(QC)
FastQC:檢視 read 品質、GC 分布、adapter contamination 等
MultiQC:整合多個樣本 QC 報告
序列修剪與過濾
Trimmomatic / Cutadapt / fastp:去除低品質序列與接頭污染
比對至參考基因組
BWA / Bowtie2:短讀序列比對(DNA-seq)
STAR / HISAT2:轉錄體資料比對(RNA-seq)
SAM/BAM 處理
SAMtools / Picard:格式轉換、排序、去除 duplicates
變異偵測(Variant Calling)
GATK(HaplotypeCaller):常用於 germline variant 分析
FreeBayes / DeepVariant:替代工具
VarScan2 / Mutect2:腫瘤樣本 somatic variant 分析
註解與解釋
ANNOVAR / VEP:將 SNP/INDEL 加入基因與疾病資訊
SnpEff:功能影響預測
二、轉錄體分析(RNA-seq)
FeatureCounts / HTSeq:定量基因表現
DESeq2 / edgeR:差異表現分析
clusterProfiler / GSEA:路徑富集分析
三、表觀遺傳 / ChIP-seq / ATAC-seq
MACS2:peaks 偵測
DeepTools:coverage、可視化
ChIPseeker:結合註解分析
四、多樣性與菌叢分析(16S/Metagenomics)
QIIME2 / mothur:微生物族群結構分析
Kraken2 / MetaPhlAn:物種分類與豐度估計
HUMAnN3:功能路徑分析
五、常見輔助工具與平台
Galaxy
圖形化介面分析平台,適合非程式背景用戶
Bioconda
安裝 NGS 工具的 Conda 套件管理資源庫
Nextflow/Snakemake
建立重複性與模組化的分析流程
IGV
基因組視覺化瀏覽器
這些工具組成一套完整的 NGS 生物資訊分析流程,可依據應用目的(癌症研究、轉錄分析、病原檢測等)做適當組合與最佳化,是當代基因體研究的核心能力。
Last updated