[陳柏仰] 超高速DNA甲基化序列比對定位— BS-Seeker3

 

BS-Seeker3 演算過程及分析結果

(A) 優化的演算過程包括新的索引方法、資料處理、超高速定位及後續資料處理 (B) 使用者可上傳一般或自訂的基因體特徵 (如基因、跳躍基因) 以繪製其相對位置前後的平均甲基化程度 (C) 在模擬資料下的平均比對10M序列的時間 (D) 利用模擬資料估計定位10M序列來自不同的序列複雜度的正確率 (E) 平均定位一人類資料的時間。

 

背景DNA甲基化為表觀基因體修飾之一,可以調控基因表現以及跨代遺傳。而其中甲基化的程度,可藉由全基因體亞硫酸鹽定序 (BS-seq; WGBS) 來估計,其精確度可達單核苷酸等級。目前,僅有少數甲基化序列比對定位的程式可在合理的時間內,將龐大的表觀基因體資料定位完成。我們開發了BS-Seeker 3進行超高速DNA甲基化序列比對定位, BS-Seeker 3讓一般的生物資訊實驗室也能夠有效率且大幅度地增加其電腦計算能力,以滿足生命科學研究中快速擴張的表觀基因體定序需求。

結果:  BS-Seeker包含了前一代BS-Seeker2中所有的比對特色及優點,可同時達到高精確度與高配對率,以進行超高速比對,其效能比其它相似程式多上至少兩倍。此外,BS Seeker 3可與本實驗室研發出的下游分析程式MethGo (Liao et al (2015) BMC Genomics)順暢地連結,進行高達9種的基因體以及表觀基因體分析。

結論對於處理亞硫酸鹽轉化後的資料,BS-Seeker3是一項準確率高,且具備多樣功能又快速的程式流程。同時,它也讓用戶對於甲基化資料能有著更好的思考方式。

 

實作連結:  BS Seeker3以及實作教學,可通過以下連結使用

 

https://github.com/khuang28jhu/bs3/

 

本論文的第一作者為暑期大學實習生 Kevin Huang 。