代謝組學是對生物體某一特定組分所包含的所有代謝物進行定性及定量分析,并研究該代謝組在外界干預或疾病生理條件下動態變化規律的一門學科。代謝組學是一門交叉性極強的學科,我們經常講,代謝組學是用物理學原理的設備,檢測化學原理的化合物,然后通過計算統計學,分析生物學機理,最終闡述醫學等各種現象,真的是相當的復雜。
百趣代謝組學研究中心專家亮哥從事代謝組學檢測分析工作十幾年,從不懂到懂一點,也是有非常漫長的過程。然而最近亮哥看一些文章,聽一些報告,和客戶朋友聊一些天,發現大家對代謝組學研究依然有很多誤區。故而總結這十大誤區供大家討論及參考:
誤區九:代謝組學檢測中色譜圖中峰的高低代表物質含量的高低?
很多客戶朋友做完項目以后經常性提出的一個要求是希望我們把物質標注在色譜圖上(如下圖a, b標注),這樣做合不合理呢?

圖1. GC-TOF-MS總離子流色譜圖
另外,還有個小故事:
一次,我們的結果顯示某個物質(比如a)的峰面積遠大于另外一個物質(比如b),這跟客戶所知道的常識是相違背的,根據常識,該物種中a的含量是低于b的含量的,于是對我們的結果產生質疑,本著顧客是上帝的原則,公司將項目款悉數退還。大概半年以后,客戶了解到這是質譜檢測的一種正?,F象,直呼公司大氣,有大公司風范,從此成為公司的鐵桿粉絲。
以上兩種情況,都是出于對色譜質譜的譜峰理解有誤所致。
圖1我們展示的是GC-MS的總離子流色譜圖(Total Ion Chromatogram, TIC),TIC圖是將每個時間點質譜中所有離子的信號強度加和后連續描繪得到的譜圖,圖中橫坐標是代謝物在色譜中的保留時間(RT),縱坐標是離子強度;
但是,我們肉眼看到的一個譜峰就是一個代謝物嗎?
此時我們要引入一個提取離子流的概念。
提取離子流色譜圖(Extracted Ion Chromatogram, EIC)是指某個特定質荷比的離子的色譜圖,EIC圖的峰面積才是用于代謝物定量分析的峰面積。
如下圖所示,一個TIC圖內部可能包含多個EIC圖,這就是我們通常所說的共流出的概念。
所以除非我們所檢測的樣品里面的物質是簡單的,沒有共流出的現象,否則我們在TIC圖上標示物質的做法是不可取的,針對生物樣品的復雜體系,大部分我們肉眼所見的TIC譜峰,都是包含多個特征離子的。

圖2. TIC圖下的EIC及特征離子的質譜圖(A, B, C)
我們再來看看幾個LC-MS的TIC色譜峰圖:

圖3. 人血漿QC樣品正離子模式(POS)的TIC疊圖-18min

圖4. 人血漿QC樣品負離子模式(NEG)的TIC疊圖-18min
從圖形上可以看出,在同一個批次內,峰圖具有非常好的重現性。這也是判斷一個實驗做的好不好的質量控制標準之一。
那么我們換一個體系,采用12分鐘的方法來做呢?

圖5. 第一批人血漿樣品正離子模式(POS)的TIC圖-12min

圖6. 第一批人血漿樣品負離子模式(NEG)的TIC圖-12min
大家會發現,換體系以后,同樣都是人血漿樣品(不是同一個樣品),出來的譜峰差異很大。那是不是意味著代謝組學的檢測很不穩定,批次效應沒有辦法解決呢?
我們再來一批血漿,進一步來看相同的儀器,相同的體系(SOP),在不同的時間,不同的人員檢測不同批次的人血漿(不是同一個樣品)重現性如何呢?

圖7. 第二批人血漿樣品正離子模式(POS)的TIC圖-12min

圖8. 第二批人血漿樣品負離子模式(NEG)的TIC圖-12min
為了方便對照,我們將圖形放在一起來看一下:

圖9. 前后兩批人血漿樣品正離子模式(POS)的TIC圖-12min

圖10. 前后兩批人血漿樣品負離子模式(NEG)的TIC圖-12min
由此至少可以看出,在相同的儀器及相同的體系(SOP)下,不同批次的人血漿樣品(不同的時間,不同的操作人員,不同的樣品)的出峰規律還是非常一致的。
盡管如此,我們也不能忽視批次效應帶來的數據不穩定。那如果我們要做一個超大型的隊列,比如1萬例樣品的LC-MS非靶代謝組檢測,如何進行大型隊列的設計,避免批次效應帶來的影響呢?這個下次再講。
回到LC-MS的色譜峰上,還有一種常見的色譜峰圖叫基峰圖(Base Peak Chromatogram, BPC),是將每個時間點質譜圖中最強的離子的強度連續描繪得到的圖譜。最強的總是最少的,這樣得到的峰圖峰的數量看起來就比較尖銳,比較多,這并不是做了什么方法學的優化,實際上這只是色譜圖的一種呈現形式而已,往往發文章的時候有評審專家會認為BPC圖不是樣品真實的反映,所以不接受BPC的投稿,只接受TIC,這個要特別注意。

圖11. 第二批人血漿樣品正離子模式(POS)的BPC圖-12min

圖12. 第二批人血漿樣品負離子模式(NEG)的BPC圖-12min
最后我們再分析一下上文中那個小故事的情況。
為啥非靶標代謝組學數據中物質的峰面積不能代表物質的真實含量呢?
通過上面的對峰圖的理解,我們已經知道,峰面積的半定量我們是依據提取離子流色譜圖的峰面積進行的,由于每個化合物在質譜中的離子化效率以及質譜檢測器的高能打拿極對于不同離子的電子置換效率不同等因素,使得儀器檢測到的峰強度并不能反映化合物的真實含量,不過,對于不同的樣品,同一個物質峰是在相同的情況下采集的,可以做比較,故而非靶代謝組學只能用來尋找樣品間或組間的差異,而不能對同一個樣品內的不同物質進行濃度含量的比較。
總結一下亮哥這次分享的經驗要點:
1. 針對復雜的生物樣品,不可以在TIC圖上標示物質。
2. 質譜對于不同的物質,響應不一樣,故在非靶代謝組學中,同一個樣品內的不同物質不可以進行物質含量的比較。
文/亮哥聊代謝組學
