轉(zhuǎn)錄因子(transcription factors, TFs)是指通過結(jié)合基因上游特異核苷酸序列,進(jìn)而調(diào)控該基因轉(zhuǎn)錄的一類蛋白質(zhì)。轉(zhuǎn)錄因子可以協(xié)調(diào),驅(qū)動基因表達(dá),構(gòu)成了復(fù)雜的轉(zhuǎn)錄因子調(diào)控網(wǎng)絡(luò),從而調(diào)控免疫反應(yīng)、發(fā)育模式等許多生命進(jìn)程。因此分析轉(zhuǎn)錄因子表達(dá)及其調(diào)控活性對于解析復(fù)雜生命活動具有重要意義。
SCENIC(single-cell regulatory network inference and clustering)是一種基于共表達(dá)和motif分析的技術(shù),旨在推斷單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)中存在的轉(zhuǎn)錄因子及其靶基因并構(gòu)建調(diào)控網(wǎng)絡(luò),以直觀查看基因表達(dá)調(diào)控關(guān)系和鑒定細(xì)胞狀態(tài)。以Python語言實(shí)現(xiàn)的SCENIC(pySCENIC)速度較快。在輸入單細(xì)胞基因表達(dá)量矩陣后,pySCENIC的分析過程分為三步:1. 基于共表達(dá)模式 (coexpression pattern) 推斷轉(zhuǎn)錄因子及其所有的候選靶基因 (target genes);2. cisTarget分析每個(gè)共表達(dá)模塊中的基因,去除間接靶標(biāo)基因,僅保留TF motif富集的模塊和targets,被保留的TF-target genes 稱為regulon;3. AUCelll為每個(gè)細(xì)胞的regulon活性打分,構(gòu)建細(xì)胞-regulon 活性矩陣。

對照組:3個(gè)癌旁粘膜樣本
(著重解讀pySCENIC分析)
作者進(jìn)行單細(xì)胞測序后進(jìn)行了分群,把52721個(gè)細(xì)胞分成了8個(gè)主群,分別是上皮細(xì)胞(EPCAM+);內(nèi)皮細(xì)胞(CD31+);兩種類型的成纖維細(xì)胞(COL1A1+)---炎癥性癌癥相關(guān)成纖維細(xì)胞iCAFs(PDGFRA+)和肌癌癥相關(guān)成纖維細(xì)胞mCAFs(RGS5+);B細(xì)胞(CD79A+);骨髓細(xì)胞 (LYZ+);T細(xì)胞(CD3D+)和肥大細(xì)胞(TPSAB1+)(圖1)。

被招募到腫瘤區(qū)域的單核細(xì)胞經(jīng)歷M2極化
髓系細(xì)胞進(jìn)一步分為了7個(gè)亞群:腫瘤相關(guān)巨噬細(xì)胞TAMs(MRC1+C1high);CD1C+樹突狀細(xì)胞(CD1C+DCs,CD1C+CLEC10A+);單核細(xì)胞(S100A8+S100A9+);增殖的骨髓細(xì)胞 (TOP2A+); 交叉呈現(xiàn)的DCs (CLEC9A+); 濾泡B細(xì)胞 (CD79A+MS4A1+);和LAMP3+ DCs(LAMP3+CCR7+)(圖2a)。并且用流式細(xì)胞儀證實(shí)了這些亞群。不同細(xì)胞類型之間的差異也可以通過TF motif的活性來確定 (圖2b)。

b. SCENIC分析得到的TF motif的活性也可以識別細(xì)胞亞群。以每一行的Z-score顯示
值得注意的是,單核細(xì)胞主要來源于正常粘膜組織,而腫瘤相關(guān)巨噬細(xì)胞(TAMs)在膀胱癌組織中富集。此外,這兩種細(xì)胞的轉(zhuǎn)錄組似乎呈現(xiàn)出持續(xù)的變化,表明招募到腫瘤區(qū)域的單核細(xì)胞被重編程為TAMs (圖3a)。為了進(jìn)一步研究這個(gè)持續(xù)的過程,作者對單核細(xì)胞和TAMs進(jìn)行了擬時(shí)序分析和RNA速率分析,也觀察到了類似的現(xiàn)象(圖3b)。結(jié)合SCENIC分析識別到的關(guān)鍵motif,作者發(fā)現(xiàn)單核細(xì)胞被重編程為TAMs的過程中,三個(gè)motif (BACH1、MAFG和NFE2) 的活性下調(diào),與此同時(shí)MAF、STAT1和STAT2的motif活性升高,這可能是導(dǎo)致M2極化的原因(圖3c)。這些結(jié)果為抑制或者逆轉(zhuǎn)免疫抑制微環(huán)境的形成提供了潛在靶點(diǎn)。

b. Monocle2預(yù)測的從單核細(xì)胞到TAMs的分化軌跡
c. 在分化過程中被明顯抑制或激活的TF motif,以細(xì)胞群著色
在膀胱癌中鑒定到兩種不同的成纖維細(xì)胞亞型
成纖維細(xì)胞進(jìn)一步被分為兩種不同的類型(圖4a):PDGFRA+成纖維細(xì)胞(iCAFs)表現(xiàn)出多種細(xì)胞因子和趨化因子的強(qiáng)烈表達(dá),RGS5+成纖維細(xì)胞具有與肌癌相關(guān)成纖維細(xì)胞(mCAFs)相似的特征。通過GO富集分析,作者探究了這兩種細(xì)胞類型的功能富集通路。接著SCENIC分析進(jìn)一步研究了這兩種成纖維細(xì)胞類型的功能。發(fā)現(xiàn)MEF2D和MEF2C是mCAF的特異性motif,這些motif在肌肉系的轉(zhuǎn)錄調(diào)控中具有深遠(yuǎn)的作用。Motif TCF21和TWIST2在iCAFs中被高度激活,TCF21與冠心病有關(guān),能夠增強(qiáng)平滑肌細(xì)胞的“纖維肌細(xì)胞”表型 (圖4b, c)。

a. 成纖維細(xì)胞的tSNE圖,按集群(上方)和亞群標(biāo)記(下方)著色
b. 由SCENIC估計(jì)的每個(gè)細(xì)胞的TF motif的曲線下面積(AUC)得分的熱圖。顯示的分別是iCAFs和mCAFs中前五個(gè)激活的motif
c. tSNE圖按轉(zhuǎn)錄因子表達(dá)水平(上方)和AUC分?jǐn)?shù)著色(下方)著色
結(jié) 語
通過以上案例,我們可以發(fā)現(xiàn)pySCENIC分析可以幫助驗(yàn)證細(xì)胞類型鑒定的結(jié)果,也可以結(jié)合擬時(shí)序軌跡分析,RNA速率分析等展示分化過程中的motif活性變化,還可以進(jìn)一步探究細(xì)胞功能。希望這次關(guān)于pySCENIC進(jìn)行轉(zhuǎn)錄因子調(diào)控網(wǎng)絡(luò)分析的分享可以為老師們提供一些啟發(fā)。
【參考文獻(xiàn)】
1.Van de Sande, B., Flerin, C., Davie, K., De Waegeneer, M., Hulselmans, G., Aibar, S., Seurinck, R., Saelens, W., Cannoodt, R., Rouchon, Q., Verbeiren, T., De Maeyer, D., Reumers, J., Saeys, Y., & Aerts, S. (2020). A scalable SCENIC workflow for single-cell gene regulatory network analysis. Nature protocols, 15(7), 2247–2276.
2.Chen, Z., Zhou, L., Liu, L., Hou, Y., Xiong, M., Yang, Y., Hu, J., & Chen, K. (2020). Single-cell RNA sequencing highlights the role of inflammatory cancer-associated fibroblasts in bladder urothelial carcinoma. Nature communications, 11(1), 5077.
