?
伯豪生物多組學(xué)研究策略!
? ? ? ? 上海伯豪生物技術(shù)有限公司(以下簡(jiǎn)稱“伯豪生物”)2008年12月成立,是一家以科技服務(wù)、疾病與健康檢測(cè)服務(wù)、分子檢測(cè)產(chǎn)品的開(kāi)發(fā)和生產(chǎn)為主營(yíng)業(yè)務(wù)的高新技術(shù)企業(yè),并于2016年成立上海市院士專家工作站;并入選國(guó)家發(fā)展和改革委員會(huì)第一批基因檢測(cè)技術(shù)應(yīng)用示范中心,以及“高發(fā)腫瘤及遺傳性疾病基因檢測(cè)示范中心”。伯豪生物建立了國(guó)內(nèi)齊全的生物技術(shù)服務(wù)平臺(tái),能夠應(yīng)用生物芯片、基因測(cè)序、生物標(biāo)志物篩選驗(yàn)證、分子檢測(cè)、基因編輯等技術(shù)平臺(tái)在基因組、轉(zhuǎn)錄組及表觀遺傳等組學(xué)層面提供優(yōu)質(zhì)服務(wù),并具有多年生物信息分析經(jīng)驗(yàn)。
? ? ? ?生命現(xiàn)象的發(fā)生和調(diào)控過(guò)程是極其復(fù)雜的,在腫瘤、自身免疫疾病、代謝疾病等復(fù)雜疾病的發(fā)生發(fā)展過(guò)程中,在干細(xì)胞分化、胚胎發(fā)育與物種進(jìn)化等生命現(xiàn)象中,會(huì)涉及到基因組、轉(zhuǎn)錄組、蛋白質(zhì)組及表觀遺傳等多層面的變化及調(diào)控。在大數(shù)據(jù)時(shí)代,將多個(gè)組學(xué)數(shù)據(jù)結(jié)合起來(lái)的整合研究——多組學(xué)(Multi-omics)研究,是一大趨勢(shì)。
? ? ? ?對(duì)于一個(gè)復(fù)雜的疾病或生命現(xiàn)象的研究,要綜合考慮其表型以及生理生化指標(biāo)以及基因組、轉(zhuǎn)錄組、蛋白質(zhì)組、表觀遺傳及代謝組等多層面的變化。將上述多組學(xué)的數(shù)據(jù)整合分析,以掌握其全局的變化過(guò)程,為研究其調(diào)控機(jī)制和精準(zhǔn)醫(yī)療提供綜合解決方案。
組學(xué)數(shù)據(jù)的可靠性是多組學(xué)數(shù)據(jù)的質(zhì)量基礎(chǔ)
? ? ? ?伯豪生物具備14年的芯片服務(wù)與8年的測(cè)序服務(wù)經(jīng)驗(yàn),是Affymetrix與Agilent公司在中國(guó)多年的服務(wù)供應(yīng)商,以及Illumina的認(rèn)證服務(wù)供應(yīng)商,以可靠而優(yōu)質(zhì)的數(shù)據(jù)質(zhì)量深受客戶推崇。真實(shí)而可靠的數(shù)據(jù)質(zhì)量是多組學(xué)數(shù)據(jù)分析的質(zhì)量基礎(chǔ)。?
多年積累的數(shù)據(jù)庫(kù)和生信分析經(jīng)驗(yàn)是多組學(xué)數(shù)據(jù)的分析基礎(chǔ)
? ? ? ?多組學(xué)的數(shù)據(jù)分析中涉及到甲基化對(duì)mRNA與lncRNA乃至miRNA的轉(zhuǎn)錄前調(diào)控作用;lncRNA對(duì)mRNA的轉(zhuǎn)錄前及轉(zhuǎn)錄后調(diào)控作用;miRNA對(duì)mRNA的轉(zhuǎn)錄后降解和抑制的調(diào)控作用;內(nèi)源競(jìng)爭(zhēng)性RNA(ceRNA)通過(guò)對(duì)miRNA的結(jié)合而對(duì)mRNA的調(diào)控作用;CNV對(duì)基因表達(dá)的劑量效應(yīng);SNV對(duì)基因功能的影響以及對(duì)信號(hào)通路基因的激活和抑制作用。伯豪生物多年的數(shù)據(jù)分析中,建立了多組學(xué)不同分子間的相互作用模式,以及多組學(xué)數(shù)據(jù)庫(kù),積累了豐富的組學(xué)數(shù)據(jù)分析經(jīng)驗(yàn),為多組學(xué)的聯(lián)合分析,提供了數(shù)據(jù)庫(kù)和生信分析保證。


多組學(xué)項(xiàng)目方案設(shè)計(jì)策略
一、技術(shù)的選擇與實(shí)驗(yàn)設(shè)計(jì)
? ? ? ?多組學(xué)項(xiàng)目的方案設(shè)計(jì)需對(duì)研究的疾病與現(xiàn)象深入了解與分析,根據(jù)不同疾病的內(nèi)在特點(diǎn),在基因組、轉(zhuǎn)錄組和表觀層面?zhèn)戎睾侠磉x擇適合技術(shù)。例如通過(guò)對(duì)3299份來(lái)自于12種實(shí)體瘤樣本的研究表明,腫瘤可以分為M class (mutation-driven,突變驅(qū)動(dòng)) 和C class (copy number-driven,拷貝數(shù)變異驅(qū)動(dòng)) 兩類,其中C class的腫瘤主要有卵巢癌、乳腺癌、肺(鱗)癌及頭頸癌等,此類腫瘤可以把重點(diǎn)放在拷貝數(shù)的研究中。所以根據(jù)疾病是否涉及基因組層面的變異或變異的側(cè)重點(diǎn),在基因組層面上選擇外顯子測(cè)序或CNV芯片技術(shù),另外可以根據(jù)疾病是否有可能影響到DNA甲基化、組蛋白修飾,以確定是否加入表觀層面的分析。


二、多組學(xué)數(shù)據(jù)的整體展示
? ? ? ?多組學(xué)的數(shù)據(jù)分析,不是單獨(dú)對(duì)幾個(gè)組學(xué)數(shù)據(jù)的羅列和展示,關(guān)鍵是整合分析項(xiàng)目中涉及到的基因組、轉(zhuǎn)錄組或表觀遺傳等層面的數(shù)據(jù),展示出不同層面的相互作用與調(diào)控關(guān)系,以幫助研究者從全局上把握疾病發(fā)展中的內(nèi)在變化,進(jìn)而聚焦到關(guān)鍵的通路及基因。
(1) 熱圖展示
? ? ? ?在下圖中將甲基化、mRNA與lncRNA三種數(shù)據(jù)整合成一張熱圖,圖中的每一行不但代表了一個(gè)特定的基因的表達(dá)以及此基因?qū)?yīng)的甲基化修飾,還體現(xiàn)了數(shù)據(jù)庫(kù)中有調(diào)控關(guān)系的lncRNA與mRNA的相互關(guān)系。在圖中,能夠看到甲基化對(duì)mRNA與lncRNA的轉(zhuǎn)錄前的負(fù)調(diào)控作用,以及l(fā)ncRNA對(duì)mRNA的轉(zhuǎn)錄前及轉(zhuǎn)錄后的正調(diào)控及負(fù)調(diào)控作用。同時(shí),在圖中還可以看到單個(gè)樣本在的甲基化和轉(zhuǎn)錄上的個(gè)性特征。直觀的展示了不同層面的差異表達(dá)基因和差異修飾位點(diǎn)的相互關(guān)系,同時(shí)為進(jìn)一步的數(shù)據(jù)挖掘提供了指導(dǎo)。
(2) 染色體圖展示
? ? ? ?在多組學(xué)的分析中,不但可以根據(jù)靶基因的相互作用將不同層面的數(shù)據(jù)整合分析,也可以單純地通過(guò)位置關(guān)系將不同組學(xué)的數(shù)據(jù)相結(jié)合。如下圖中,通過(guò)CNV、基因表達(dá)與甲基化修飾的位置關(guān)系,將三個(gè)組學(xué)的數(shù)據(jù)有機(jī)的結(jié)合起來(lái),分析CNV對(duì)于表達(dá)的劑量效應(yīng),以及甲基化對(duì)于基因表達(dá)的調(diào)控作用。
(3) 圈圖展示(Circos plot)
? ? ? ?也可以用Circos plot以圈圖從整體上展示全基因組水平上的甲基化水平及基因表達(dá)差異,也可以將CNV甚至是SNV也同時(shí)展示出來(lái)。
三、多組學(xué)數(shù)據(jù)的分型及整合分析
? ? ? ?多組學(xué)的數(shù)據(jù)分析,會(huì)得到多個(gè)層面的數(shù)據(jù),這些數(shù)據(jù)都可以分別用非監(jiān)督聚類的辦法對(duì)疾病的亞型分型。但分別針對(duì)不同分子層面的聚類會(huì)得到不同的聚類結(jié)果,而且有些樣本在不同的聚類中會(huì)分配到不同的亞型,所以推薦將多組學(xué)的數(shù)據(jù)整合考慮,得到綜合的分型結(jié)果。在理想的聯(lián)合分析中不但要綜合考慮到不同層面的分子變異還要考慮到不同變異間的相互關(guān)系,進(jìn)而分析不同層面分子的上調(diào)、下調(diào)或激活、抑制等相互作用。例如,CNV的增加可能會(huì)增加基因的表達(dá),DNA的甲基化可能會(huì)抑制基因表達(dá),SNV對(duì)AA編碼的改變或終止密碼子的出現(xiàn)會(huì)不同程度地影響蛋白的功能,雖然mRNA水平上沒(méi)有改變,但功能的失活會(huì)影響pathway中的下游基因。不同層面的整合分型以及基因通路激活抑制的聯(lián)合分析構(gòu)成了多組學(xué)數(shù)據(jù)挖掘的核心。可以采用的分析方法包括:基于已經(jīng)發(fā)表文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)的Integrated Pathway Activities(IPA)分析;基于網(wǎng)絡(luò)分析的PAthway Recognition Algorithm using Data Integration on Genomic Models (PARADIGM) ,PARADIGM可實(shí)現(xiàn)不同層次表達(dá)以信號(hào)通路展示;此外常用的方法還有基于模型獨(dú)立的隨機(jī)樣本計(jì)算的雙向聚類方法(consensus clustering)以及基于每個(gè)不用平臺(tái)數(shù)據(jù)的協(xié)方差而整合聚類的Integrative clustering方法等。

三、多組學(xué)數(shù)據(jù)的進(jìn)一步挖掘與展示
? ? ? ?多組學(xué)數(shù)據(jù)分析中的另一大難點(diǎn)是在錯(cuò)綜復(fù)雜的數(shù)據(jù)中尋找到核心的通路與驅(qū)動(dòng)基因。伯豪在多年的分析中建立了從基礎(chǔ)的GO與pathway富集分析到共表達(dá)網(wǎng)絡(luò)與ceRNA調(diào)控網(wǎng)絡(luò)分析,以及GSEA與WGCNA分析,到利用收費(fèi)數(shù)據(jù)庫(kù)的IPA分析,為客戶提供了一整套分析方案和思路去挖掘各個(gè)組學(xué)中的關(guān)鍵基因與通路。同時(shí)利用多個(gè)層面數(shù)據(jù)間的相互關(guān)系,尋找相互具有調(diào)控關(guān)系的位點(diǎn)或基因。再通過(guò)復(fù)雜的網(wǎng)絡(luò)圖,將基因組變異、基因表達(dá)差異,甲基化修飾差異以及基因間的相互作用在同一張圖上展示出來(lái)。


