基于二代測序平臺(NGS)的scATAC-seq技術利用Tn5酶的DNA隨機打斷功能,可以富集染色質局部開放區域上的基因組DNA短片段(通常80-300 bp),這些短片段被當作開放染色質(open chromatin)的信號。然而,在使用過量的Tn5轉座酶切割并標記染色質局部開放區域的過程中也會產生一些長片段基因組DNA,這些長片段DNA是否包含染色質狀態信息尚不清楚。

2022年10月11日,北京大學生物醫學前沿創新中心(BIOPIC)湯富酬課題組在Cell Research 發表了題為“scNanoATAC-seq: a long-read single-cell ATAC sequencing method to detect chromatin accessibility and genetic variants simultaneously within an individual cell”的論文,首次報道了名為scNanoATAC-seq的基于三代測序平臺(單分子測序平臺)的單細胞染色質可及性測序技術。該技術整合了長讀段單分子測序平臺和單細胞染色質可及性測序技術(scATAC-seq:Single cell Assay for Transposase Accessible Chromatin with high-throughput sequencing)的優勢,實現了在一個單細胞中同時檢測染色質開放狀態以及基因組結構變異。
該研究中使用的NGS DNA建庫試劑盒(目錄號:N233)來自近岸蛋白,近岸蛋白的NovoNGS? DNA Library FlashPrep Kit for Illumina?已助力多篇高分文章發表,是您二代測序建庫的得力助手!
該研究開發了基于單分子測序平臺的單細胞ATAC-seq測序技術(如圖1所示),并且探索了其在生物學問題上的應用。首先該研究利用五種人類細胞系(GM12878, eHAP1, HEK293T, HFF-1 and K562)以及在體的人類外周血單核細胞(PBMCs),證實了scNanoATAC-seq技術可以像基于二代測序平臺的scATAC-seq一樣根據染色質開放狀態對不同細胞類型進行準確分群并且揭示關鍵的染色質開放狀態調控信息(如圖2所示)。

圖1. scNanoATAC-seq實驗流程圖(左)和分析原理圖(右)
接下來利用scNanoATAC-seq技術長讀段的優勢對等位基因特異性的染色質開放區域進行了準確鑒定。對于二倍體細胞,基于二代測序平臺的ATAC-seq技術要區分一個染色質開放區域的兩個等位基因,需要在該開放區域(通常長度在80-300bp之間)內有雜合的單核苷酸多態性(SNP)位點。而基于三代測序平臺的scNanoATAC-seq技術要區分一個染色質開放區域的兩個等位基因,不需要該開放區域內有雜合SNP位點,而只需要在該開放區域兩側的各4000bp內有雜合SNP位點或者是雜合結構變異即可。

圖2. scNanoATAC-seq對不同細胞類型進行分群的效果
相比于基于二代測序平臺的ATAC-seq技術,基于三代測序平臺的scNanoATAC-seq技術可以在同一個細胞系中檢測到十倍以上的等位基因特異性的染色質開放區域。例如,應用scNanoATAC-seq技術,該研究在人類B淋巴細胞系GM12878的印記基因TRIM61的啟動子差異甲基化區域檢測到了等位基因特異性的染色質開放區域(如圖3所示,母源等位基因啟動子區域染色質處于開放狀態,父源等位基因啟動子區域染色質處于關閉狀態),而此染色質開放區域內在GM12878細胞系中不存在雜合SNP位點,不能被短讀段的ATAC-seq方法測到。

圖3. 用scNanoATAC-seq技術鑒定出來的印記基因TRIM61的啟動子差異甲基化區域的等位基因特異性的染色質開放區域
值得討論的是,在染色質開放程度較高的基因組DNA裸露區域,Tn5轉座酶的濃度越高,得到的DNA文庫片段越短。由此可以推斷,在使用過量Tn5轉座酶的情況下,scNanoATAC-seq技術捕獲到的長讀段的染色質開放區域中,除了通常的染色質開放區域(open chromatin)外,還可能存在開放程度較弱的染色質區域,例如寬容染色質區域(permissive chromatin),而這些是短讀段測序無法檢測到的。事實上,相較于基于二代測序平臺的scATAC-seq技術, 基于三代測序平臺的scNanoATC-seq技術檢測到了更多的核小體占位信息(如圖4所示)。另外,關于比對困難的基因組區域例如重復序列區域的染色質開放狀態的研究,相較于二代測序平臺的scATAC-seq,基于三代測序平臺的scNanoATAC-seq也存在明顯優勢。

圖4. scNanoATAC-seq和10x scATAC-seq測序片段在轉錄起始位點附近信號富集的情況
然后,研究利用scNanoATAC-seq技術可以在一個單細胞中檢測染色質開放狀態的同時,還可以檢測基因組中的各種結構變異事件(插入,缺失,重復,倒位,易位等)。以人類慢性髓系白血?。–ML)細胞系K562的大量細胞基因組三代測序數據為基準,該研究發現scNanoATAC-seq技術在K562細胞系(至少5個單細胞支持)中分別檢測到了7688個插入事件(占基準的64.6%)和6120個缺失事件(占基準的67.7%),準確度分別為93.8% 和75.5%。除了經典的BCR-ABL1易位事件,該研究也可以檢測到長達89 kb的缺失事件,該缺失事件同時截斷了ZRANB1和CTBP2兩個基因(如圖5所示)。而已知CTBP2可以抑制白血病細胞增殖,這意味著scNanoATAC-seq技術檢測到了K562細胞系中潛在的導致抑癌功能缺失的結構變異事件。
隨后使用scNanoATAC-seq數據分析了單個細胞的拷貝數變化(CNVs)。eHAP1是一個完全的單倍體細胞系,在eHAP1中沒有觀察到大規模的CNVs。GM12878和HFF-1被認為是沒有明顯CNVs的二倍體細胞系,而該研究在GM12878細胞系中檢測到1號和16號染色體上有大規模CNVs的亞克隆。由于HFF-1是雄性的衍生細胞系,該研究觀察到其X染色體的拷貝數是常染色體的一半,和推測結果一致。該研究還在K562的7、9、X染色體和HEK293T的13染色體上發現了大規模的CNVs,這與之前的研究結果一致。綜上所述,scNanoATAC-seq技術可以準確檢測單個細胞的基因組拷貝數變異,能準確地區分出整倍體細胞和非整倍體細胞,因此可以應用于癌癥的研究。

圖5. 用scNanoATAC-seq技術鑒定出來的ZRANB1和CTBP2兩個基因上的結構變異(大片段缺失)事件(上)以及PCR驗證結果(下)
最后,利用scNanoATAC-seq技術的長讀段優勢在GM12878細胞系中檢測到了3868對染色質共開放事件。以SOX4基因上找的共開放事件為例,這些相鄰的共同開放的基因組功能元件由直接連接兩個開放區域的長讀段支持,其讀段長度分布與非共開放區域的讀段長度分布明顯不同(如圖6和圖7所示)。另外,實驗數據表明6號染色體組蛋白基因簇上的幾個增強子和啟動子也是共開放的。

圖6. 利用scNanoATAC-seq鑒定相鄰的調控元件共開放事件的原理
而利用基于二代測序平臺的scATAC-seq技術分析染色質共開放事件高度依賴每個單細胞的檢測覆蓋度,如果scATAC-seq的檢測覆蓋度比較低,就很難檢測到染色質共開放事件。更重要的是,即使在scATAC-seq的檢測覆蓋度很高的情況下,其中一半的染色質共開放事件的信號是來自一個單細胞中兩個不同等位基因的共同開放,是技術假象,而基于三代測序平臺的scNanoATAC-seq技術檢測到的染色質共開放事件的信號都是來自單個DNA分子的直接連鎖信息,都是真實的來自一個單細胞中同一個等位基因的共同開放事件,沒有上述這類技術假象。

圖7. 發生在SOX4基因附近的調控元件共開放事件
綜上,scNanoATAC-seq技術擁有廣泛的生物學應用前景。該方法可以在單個細胞中同時檢測染色質可及性和基因組結構變異。該方法利用長讀段優勢可以在單個細胞中發現其內部沒有雜合SNP位點標記的等位基因特異性的染色質開放區域,這是短讀段的scATAC-seq技術無法實現的。該方法還可以發現具有直接證據支持的,發生在同一個等位基因不同調控元件上的共開放事件。scNanoATAC-seq技術的出現預示著單細胞表觀基因組三代測序時代的到來。
近岸蛋白提供ATAC實驗方案(目錄號:N248),采用新型Tn5轉座酶技術,將裸露的雙鏈DN**段化的同時引入測序接頭,再經過后續提取與PCR擴增,得到直接用于Illumina測序平臺的二代測序文庫,操作便捷,數據重復性好。
近岸蛋白相關產品
|
目錄號 |
產品名稱 |
|
NovoNGS? DNA Library FlashPrep Kit for Illumina? |
|
|
Chromatin Profile Kit for Illumina |
|
|
NovoNGS? DNA Clean Beads |
|
|
Tagment DNA Extract Beads |
|
|
NovoNGS? CUT&Tag 3.0 High-Sensitivity Kit (for Illumina?) |
|
|
NovoNGS? ChiTag? pAG-Transposase |
|
|
NovoNGS? ChiTag? pAG-Transposome |
|
|
NovoNGS? Tn5 Transposase |
