數(shù)據(jù)分析
技術(shù)介紹 數(shù)據(jù)分析 經(jīng)典案例 常見問題
數(shù)據(jù)分析

1、測(cè)序堿基錯(cuò)誤率評(píng)估
測(cè)序錯(cuò)誤率決定堿基質(zhì)量,受測(cè)序儀本身、測(cè)序試劑、樣品等多因素影響,原始測(cè)序序列raw reads含有帶接頭的reads及低質(zhì)量的reads。為了保證信息分析準(zhǔn)確,需對(duì)原始序列進(jìn)行篩選,得到clean reads。

2、GCAT含量分布
GC含量分布檢查用于檢測(cè)有無AT、GC分離現(xiàn)象,該現(xiàn)象可能是測(cè)序或者建庫所引起。對(duì)于DGE測(cè)序來說,會(huì)導(dǎo)致reads前6-7個(gè)堿基有較大的波動(dòng),屬于正常情況。

3、序列基因組比對(duì)
統(tǒng)計(jì)比對(duì)到基因組各個(gè)染色體的reads密度,從密度分布圖中,可以更加直觀看出樣本中轉(zhuǎn)錄本在個(gè)染色體不同區(qū)域的基因的表達(dá)情況。
4、IGV可視化
采用IGV軟件對(duì)基因組上比對(duì)序列文件可視化,可直觀查看染色體、基因上具體序列細(xì)節(jié)。
5、相關(guān)性分析
樣品間基因表達(dá)水平相關(guān)性是檢驗(yàn)實(shí)驗(yàn)可靠性和樣本選擇是否合理的重要指標(biāo)。相關(guān)系數(shù)越接近1,表明樣品之間表達(dá)模式的相似度越高

6、主成分分析
主成分分析用于評(píng)估生物重復(fù)及處理?xiàng)l件間的整體差異。將多個(gè)變量通過線性變換以選出較少個(gè)數(shù)重要變量,進(jìn)而評(píng)估實(shí)驗(yàn)設(shè)計(jì)的合理性。
7、火山圖
火山圖用于直觀展示兩組實(shí)驗(yàn)中,基因表達(dá)量的上調(diào)、下調(diào)情況。

8、差異基因聚類熱圖
將表達(dá)模式相同或相近的基因進(jìn)行聚類分析,進(jìn)而識(shí)別未知基因的功能或已知基因的未知功能;這些同類的基因可能具有相似的功能,或是共同參與同一代謝過程或細(xì)胞通路。
9、趨勢(shì)分析
趨勢(shì)分析,將不同時(shí)間點(diǎn)或狀態(tài)點(diǎn)的基因表達(dá)值進(jìn)行聚類,通過計(jì)算基因落入時(shí)間表達(dá)譜或狀態(tài)表達(dá)譜的顯著水平,識(shí)別顯著性的變化趨勢(shì)表達(dá)譜和與這些變化趨勢(shì)相關(guān)的基因。
10、差異基因GO富集
對(duì)差異基因進(jìn)行GO富集,直觀的反映出在生物過程(Biological Process)、細(xì)胞組分(Cellular Component)和分子功能(Molecular Function)富集的GO term上差異基因的個(gè)數(shù)分布情況。
11、GO有向無環(huán)圖
DAG有向無環(huán)圖展現(xiàn)富集到的GO術(shù)語之間的關(guān)系。
12、差異基因PATHWAY富集
將差異基因進(jìn)行PATHWAY富集,對(duì)得到通路注準(zhǔn)差異基因信息,上調(diào)基因的KO節(jié)點(diǎn)標(biāo)紅色,下調(diào)基因的KO節(jié)點(diǎn)標(biāo)綠色。
13、蛋白互作網(wǎng)絡(luò)
在數(shù)據(jù)庫中獲得差異基因表達(dá)蛋白之間的關(guān)系,進(jìn)行蛋白互作網(wǎng)絡(luò)的分析。
14、基因共表達(dá)網(wǎng)絡(luò)分析
基因共表達(dá)網(wǎng)絡(luò)分析(Gene Co-expression Network Analysis)是根據(jù)基因在不同樣本中的表達(dá)量的變化,將表達(dá)模式相似的基因進(jìn)行聚類,從而得到不同的module(cluster)及其相互關(guān)系。

15、火山圖
此火山圖用于直觀展示兩組實(shí)驗(yàn)中,lncRNA表達(dá)量的上調(diào)、下調(diào)情況。

16、差異lncRNA聚類熱圖
將表達(dá)模式相同或相近的lncRNA進(jìn)行聚類分析,進(jìn)而識(shí)別未知lncRNA的功能或已知lncRNA的未知功能;這些同類的lncRNA可能具有相似的功能,或是共同參與同一代謝過程或細(xì)胞通路。
17、趨勢(shì)分析
趨勢(shì)分析,將不同時(shí)間點(diǎn)或狀態(tài)點(diǎn)的lncRNA表達(dá)值進(jìn)行聚類,通過計(jì)算lncRNA落入時(shí)間表達(dá)譜或狀態(tài)表達(dá)譜的顯著水平,識(shí)別顯著性的變化趨勢(shì)表達(dá)譜和與這些變化趨勢(shì)相關(guān)的lncRNA。

18、novel lncRNA鑒定
多種算法鑒定得到的lncRNA數(shù)量Venn圖。

19、序列保守性分析
對(duì)lncRNA的序列進(jìn)行保守性分析。

20、位點(diǎn)保守性分析
對(duì)lncRNA的序列中的位點(diǎn)進(jìn)行保守性分析。

21、SNP、InDel分析
SNP是基因組上由單個(gè)核苷酸變異形成的遺傳標(biāo)記,InDel是樣本中發(fā)生的小片段的插入缺失,此圖展示的是SNP與InDel在基因組上分布密度。

22、可變剪切分析
mRNA前體經(jīng)不同的剪接方式或選擇不同的剪接位點(diǎn)將產(chǎn)生多種mRNA剪切異構(gòu)體,可變剪切是調(diào)節(jié)基因表達(dá)和蛋白質(zhì)多樣性的重要機(jī)制。

23、融合基因分析
mRNA在轉(zhuǎn)錄后會(huì)發(fā)生基因融合現(xiàn)象,產(chǎn)生融合蛋白,對(duì)機(jī)體的正常代謝產(chǎn)生影響,許多疾病與基因融合有關(guān)。

以上分析皆為標(biāo)準(zhǔn)分析,生因生物可根據(jù)具體項(xiàng)目、具體需求提供個(gè)性化分析。
