對scRNA-seq數據進行挖掘,首先要進行降維、聚類和細胞定義。然后基于以上結果,再開展亞群分析、細胞通訊、擬時序、差異分析等各種高級分析。在這個過程中,如何定義每一類細胞群是整個單細胞分析的基礎,也是重中之重,但同時也是最耗時、最復雜的一步。
2022年水稻的一篇文章中,研究人員采用了多種方式進行了細胞類型注釋,今天小編以這篇文章為例,為大家展示下不同的注釋方法。

樣本類型
在水稻從營養發育到生殖發育的轉變過程中,IM(花序分生組織)、BM(分支分生組織)和SM(小穗分生組織)的建立發生在很短的時間。因此,作者在發育早期的兩個階段:S1(< 2 mm)和S2(2–3 mm)采集了花序樣本,各兩個重復,并采集leaf(L)作為對照。
單細胞轉錄組學確定了水稻花序中離散的細胞類型
首先,作者通過基因表達的定量集合分析定義的每個簇中標記基因和富集基因表達之間的相關性,將所有的細胞分為四類。對小穗和分生組織 marker 基因(基于前期遺傳學實驗)進行的qusage分析,判斷cluster 1,11是spikelet(小穗組織),cluster5,9,13是meristem(分生組織)?;贚或S1/S2樣品的優勢基因,判定cluster7、8、14、12、15為leaf(葉),cluster0、2-4、6、10為rachis(軸)(圖2a)。

Spikelet亞分群
Cluster1和11 (spikelet) 的二次亞聚類分析揭示了10個小穗亞簇,通過小穗標記基因的表達分布,cluster7、5、0、9、4分別確認了各自的細胞類型(圖3a)。除此以外,cluster1、3和6的基因表達譜富集了“細胞周期”、“應激反應”和“非生物刺激反應”,因此,它們被歸類為spikelet supporting cells (SSC),支持整個小穗發育(圖3a)。cluster2和8具有相似的基因表達譜和GO注釋,與被注釋為meristem(分裂組織)的cluster7共享相似的擬時序發育軌跡,因此兩者均被歸類為spikelet identity cells (SICs)。

Floret亞分群
為了具體研究小花發育,作者去除SSC亞群,并將剩余細胞重新聚集成10個小花細胞亞群(圖4a)。其中:
Cluster0, 2,8,9通過已知的 marker 基因判斷出細胞類型,分別被鑒定為lemma(外稃)、palea(內稃)、lodicule(漿片)和stamen(雄蕊);
Cluster5 特異表達的基因DWT1,通過做基因突變實驗,發現這個基因突變后影響花的發育,判斷DWT1為干細胞基因,從而判斷cluster5為花的干細胞;
Cluster1,6 特異富集 ROC 家族基因,通過搜索發現這群基因在擬南芥中是在干細胞外層的 le 細胞中特異表達,于是在水稻中進行實驗,驗證了這群基因也是在 le 細胞中表達;
Cluster4有一群特異表達基因,追尋這些基因在擬南芥中的功能,發現其抑制托葉的生長,判斷cluster4細胞為抑制托葉生長的細胞;
編碼組蛋白的基因在小花亞群cluster3和4中富集,Histone4也在SM和FM附近的細胞中積累(圖4e),表明水稻花發育期間可能存在保守的苞片抑制,否則苞片的產生將與分生組織競爭。因此,小花亞簇3被分類為“邊界”細胞,將SICs和外稃與隱蔽的苞片細胞分開(圖4a)。
Cluster7通過做原位實驗,發現其差異基因在托葉的位置上表達。

Meristem細胞亞分群
對被注釋為meristem的cluster5,9和13進行的亞群分析,將細胞分為了12個meristem亞群,根據marker的表達情況,該組織被分為BM、IM、SM三大亞群(圖5a)

以上,就是該文章所有涉及到細胞類型注釋的部分。作者采用了多種方式,例如基于marker表達,基于富集分析,基于擬時序,基于濕實驗等,希望這篇文章多樣的細胞類型注釋方式能給各位老師帶來一定啟發。
