經(jīng)典案例
技術(shù)介紹 數(shù)據(jù)分析 經(jīng)典案例 常見問題
以擬南芥為例依據(jù)染色體間的關(guān)系de novo組裝植物基因組
研究背景
基因組組裝的一個典型的兩步策略是:雙端測序組裝contigs,然后contigs組裝成scaffolds。在過去的10年間,二代測序逐漸變得低廉、常用、廣泛。大多數(shù)的植物基因組通過二代測序產(chǎn)生了草圖,組裝成contigs或scaffolds。但是進一步得到染色體尺度的scaffolds的高質(zhì)量基因組卻依然困難。近期報道一種更為高效的方法是根據(jù)染色體的關(guān)系得到染色體尺度的組裝(Hi-C)。本研究,我們直接根據(jù)染色體內(nèi)部的關(guān)系,做了Hi-C分析并評估Hi-C數(shù)據(jù)。
研究方法


研究結(jié)果

1 Ler染色體組裝結(jié)果。A:Ler de novo組裝聚類預(yù)測;B:Hi-C與遺傳圖譜組裝結(jié)果比較;C-G:5個染色體的順序和方向預(yù)測;H:Hi-C與遺傳圖譜組裝結(jié)果順序比較;I-M:樣本中低相互關(guān)系的染色體組裝評估分布。

2 Hi-C組裝結(jié)果與已有同源基因組(Col)比較。A:Ler;B:Col;C:兩者相關(guān)性。

3 聚類中錯誤scaffolds與正確scaffolds的長度分布。

4 LUSTER_MIN_RE_SITES與ORDER_MIN_N_RES評估。A:聚類覆蓋度;B:聚類錯誤;C:排序覆蓋度;D:排序錯誤;E:方向覆蓋度;F:方向錯誤。

研究結(jié)論

根據(jù)染色體內(nèi)關(guān)系而開發(fā)的de novo染色體尺度組裝是一種新精確構(gòu)建完成參考序列的方法。該方法能夠以一種低成本的方式進行更為精確和標準的分析,并為植物其他方面的分析打開一扇門。
參考文獻

De Novo Plant Genome Assembly Based on Chromatin Interactions: A Case Study of Arabidopsis thaliana. [Molecular Plant, 2014]
