慢性肝病會誘發肝纖維化并進一步發展為肝硬化,最終導致肝癌的發生。肝組織活檢目前仍然是評價肝纖維化程度的金標準,但是由于組織活檢具有創傷性、樣本誤差等問題導致在臨床上的應用受到限制,因此非創傷性的準確可靠的診斷指標亟需開發。賈偉教授團隊與上海中醫藥大學劉平教授團隊合作通過對兩個研究隊列受試者進行血清靶向定量代謝組學研究,篩選出4個代謝物指標并建立機器學習模型進行疾病診斷,相關成果于2020年6月5日在《BMC Medicine》期刊在線發表。

血清代謝物篩選及診斷模型選擇
隊列一納入1006名受試者,其中504名慢乙肝患者(CLD),502例健康對照。隊列二納入390例受試者,其中300例慢乙肝患者,90例健康對照。除了失代償性肝硬化患者,其他疾病患者均接受肝組織活檢檢測進行疾病分期判斷。
我們采用靶向代謝組學定量測定血液樣本中24種膽汁酸、42種游離脂肪酸、32種氨基酸,其中26種代謝物在CLD vs正常、肝纖維化vs肝硬化、肝纖維化不同階段中存在顯著差異。根據LASSO算法和隨機森林(RF)算法共篩選出4種代謝物,分別為反式亞油酸(linoelaidic acid,C18:2,n6t)、?;悄懰幔╰aurocholate,TCA)、酪氨酸(tyrosine,Tyr)和纈氨酸(valine,Val)。此外,還發現Tyr/Val比值可以進一步提高分類性能以及年齡也是區分纖維化和肝硬化以及纖維化不同程度的危險因素。4種代謝物與纖維化分期、壞死性炎癥、CPA、AST、ALT、AST/ALT、PLT、FIB-4、APRI進行Spearman相關分析。四個代謝物(包括Tyr/Val)比現有臨床指標與纖維化程度均呈現更強的相關性。
為了確定一個合適的分類模型,我們在隊列一中采用10倍交叉驗證(CV)來比較代謝物構建的RF模型和兩個線性模型(logistic回歸(LR)、線性判別分析(LDA))以及與臨床指數、APRI、AST/ALT、FIB-4之間的診斷能力。以CV-受試者工作特征曲線(ROC)下的面積(CV- AUROC)和CV-精確率曲線(PR)下的面積(CV- AUPR)作為評價指標。結果顯示,診斷區分CLD和健康組, APRI、LR、LDA和RF模型的AUROCs和AUPR都很高,但RF模型具有最強的分類性能。在診斷纖維化和肝硬化、早期肝纖維化(S0-2)與晚期肝纖維化(S3-4)上,RF模型的CV-AUROC和CV-AUPR優于其他方法。經過綜合比較,基于決策樹的集成學習算法RF表現出更好的分類性能。


模型的構建
模型一:診斷CLD患者與健康組
CLD患者中反式亞油酸濃度(C18:2,n6t)顯著降低,而TCA、Tyr、Tyr/Val水平均高于對照組。隊列一中利用這四種代謝物標志物建立RF模型進行CLD患者和NC患者診斷,采用袋外數據(out of bag, OOB)進行RF模型評估。該模型AUROC和AUPR 分別達到0.997和0.994,明顯高于APRI (AUROC=0.973, p<0.001), FIB-4 (AUROC=0.848, p<0.001)和AST/ALT (AUROC=0.665, p<0.001)。其中,C18:2,n6t濃度越低、TCA濃度越高意味著CLD的風險越高。
基于OOB概率預測,采用logit函數計算模型一RF得分。瀑布圖顯示RF評分從NC(較低的RF得分)到CLD(較高的RF得分)有明顯的上升趨勢,兩組間RF得分存在顯著差異(p<0.001)。在訓練集cutoff值為0.434時,CLD患者診斷敏感性為98.4%,特異性為99%。當RF模型中使用Youden index產生最佳臨界值的敏感性和特異性優于AST/ALT、APRI和FIB-4。
模型二:區分CLD中肝纖維化患者和肝硬化患者
利用四種代謝物標志物和年齡建立RF預測模型以預測CLD肝硬化患者與非肝硬化患者?;贠OB預測,該模型AUROC為0.941,AUPR為0.87,優于APRI (AUROC=0.698, p<0.001) 、AST/ALT (AUROC=0.815, p<0.001)、FIB-4 (AUROC=0.869, p<0.001)。決策樹顯示Tyr/Val、酪氨酸、反式亞油酸水平越高,肝硬化風險就越高。RF模型臨界值為0.01對肝硬化與纖維化有效區分時,模型敏感性為87.0%,特異性90.4%。對HBV-DNA水平、壞死性炎癥程度、HBeAb、HBeAg、BMI、血小板(PLT)、肝功(如凝血酶原時間、白蛋白、直接膽紅素、間接膽紅素)和藥物(恩替卡韋)進行校正后,RF得分依然顯著 (p < 0.001),且敏感性和特異性均顯著優于AST/ALT、APRI和FIB-4。
模型三:CLD中纖維化的分級
在本研究將肝纖維化0-2期歸為早期纖維化(S0-2),3-4期被定義為晚期纖維化(S3-4)。根據年齡和四種代謝物標志物建立模型三用于區分早期纖維化和晚期纖維化,模型AUROC為0.918和AUPR為0.892,比APRI (AUROC=0.647, p<0.001),AST/ALT(AUROC=0.714, p<0.001),FIB-4(AUROC=0.802, p<0.001)更優。決策樹顯示,Tyr/Val、Tyr、年齡和TCA越高,晚期肝纖維化的風險越高。
logit診斷RF得分臨界值為-0.115可將早期纖維化患者與晚期纖維化患者區分開來,該模型敏感性為86.7%,特異性為90.5%。對HBV-DNA水平、壞死性炎癥程度、HBeAb、HBeAg、肝功能、血小板、BMI和藥物(恩替卡韋) 進行校正后,RF得分仍有統計學意義 (p < 0.001),且敏感性和特異性均顯著優于AST/ALT、APRI和FIB-4。


在獨立HBV隊列(隊列二)中驗證預測模型
隊列二中的樣本進行了相同的代謝組學研究,獲得與隊列一相似的代謝物濃度結果。對于CLD診斷,與APRI (AUROC=0.879, AUPR=0.958)、AST/ALT(AUROC=0.603, AUPR=0.849)、FIB-4 (AUROC=0.707, AUPR=0.897) 相比,構建的模型一依然具有更強分類性能,其AUROC為0.977和AUPR為0.993。此外,使用隊列一中模型一的cutoff值進行分析,結果顯示隊列二的RF得分診斷CLD的敏感性為92.2%,特異性為94.4%。模型二區分肝硬化患者和纖維化患者的AUROC為0.844和AUPR為0.827,比APRI (AUROC=0.608, p<0.001)、AST/ALT (AUROC=0.684, p<0.001)、FIB-4 (AUROC=0.758, p<0.001)更優。使用隊列一中模型二的cutoff值進行分析,模型二RF得分區分肝硬化患者和纖維化患者的敏感性為71.8%,特異性為81.6%。同樣,模型三區分纖維化階段的AUROC為0.807和AUPR為0.817,比APRI (AUROC=0.595, p<0.001)、AST/ALT (AUROC=0.667, p<0.001)、FIB-4 (AUROC=0.739, p= 0.01)更優。模型三RF得分區分纖維化S0-2期和S3-4期的敏感性為72.9%,特異性為76.1%。
此外,引入重分類改善指標(NRI)和積分判別改進(IDI)來量化模型對現有臨床指標診斷的改進。對不同分類目標(健康與CLD、肝纖維化與肝硬化、早期肝纖維化與晚期肝纖維化)分析中, 與FIB-4、APRI、AST/ALT相比,RF模型的NRI和IDI均得到陽性結果,說明代謝物建立的模型具有更好的分類表現。
S0-2、S3和S4多分類診斷
除了進行二分類分析外,我們還進一步分析了篩選到的潛在標志物是否可以對CLD患者進行多分類分析。于是重新構建RF模型,分別對APRI、AST/ALT和FIB-4進行多元回歸以診斷隊列1中S0-2期患者、S3期患者和S4期患者。在隊列一中,與APRI (AUROC=0.790, AUPR=0.658)、AST/ALT (AUROC=0.817, AUPR=0.688)、FIB-4 (AUROC=0.858, AUPR=0.774)相比,預測模型AUROC為0.944,AUPR為0.908。隊列2驗證集中,與APRI (AUROC=0.790, AUPR=0.608)、AST/ALT (AUROC=0.772, AUPR=0.597)、FIB-4 (AUROC=0.816, AUPR=0.699)相比,預測模型AUROC為0.841 (0.799-0.885),AUPR為0.748(0.674-0.81)。比較各模型的診斷表現,結果顯示代謝物多分類模型優于其他方法。
小結
隨著世界范圍內CLD患病率的上升,對該病嚴重程度進行準確可靠評估對治療方式選擇和縱向監測越來越重要。越來越多的研究嘗試開發可替代肝活檢的無創CLD診斷工具,例如目前已經被廣泛報道的AST/ALT、APRI和FIB-4。非侵入性評估方法方便同一個患者定期連續監測(例如每3個月或每半年),動態反映該患者的肝纖維化和肝硬化變化狀況,可用于療效監測,預后判斷,更適合臨床應用。本研究確定了一組代謝物標志物,包括反式亞油酸、TCA、Tyr,以及與CLD進展高度相關的Tyr/Val。本研究中,首先通過單變量、LASSO和RF分析,確定顯著差異代謝物作為候選標記物,并構建了相應的RF預測模型。雖然模型在驗證集中AUROC不如訓練集AUROC高,依然獲得了相對較好的AUROC(均為>0.8)。此外,當機器學習應用于生物醫學研究時,外部驗證/準確性測試下降是一個常見的事實,不過幾種代謝物的AUROC和AUPR仍明顯大于AST/ALT、APRI和FIB-4,表明代謝物模型具有更好的預測價值。
本研究也存在幾個局限性:
(1)藥物使用是本研究中的混雜因素,雖然對藥物使用校正后沒有改變,但仍需要更大規模的研究來進一步評估;
(2)本研究中HBV感染是CLD發生的唯一或主要原因且研究對象均為中國人,因此,對于其他病因或其他種族/民族群體還需進一步驗證;
(3)除了橫斷面研究,還應進行縱向研究,特別是用于區分早期和晚期肝纖維化。
綜上所述,我們通過靶向代謝組學分析,確定了四種代謝標志物可以準確區分CLD患者與健康者,并可區分不同階段肝纖維化。非侵入性代謝物診斷性能優于FIB-4、AST/ALT、APRI。如果在未來的研究中得到驗證,那么這種方式將有助于減少不必要的肝活檢來確定患者有無顯著纖維化,評估CLD進展程度。
參考文獻
Guoxiang Xie, Xiaoning Wang , et al., Serum metabolite profiles are associated with the presence of advanced liver fibrosis in Chinese patients with chronic hepatitis B viral infection. BMC Medicine, (2020) 18:144. https://doi.org/10.1186/s12916-020-01595-w.
原文下載,請長按識別下方二維碼

精彩推薦
1. 賈偉/李后開: “腸道菌-膽汁酸-腦”代謝軸可能參與阿爾茨海默病和肝性腦病的發病機制
2. 賈偉教授:菌群檢測到干預的產業閉環遲遲未形成,有2大原因!
3. 腸·道 | 賈偉:肝病腸治?且看腸道細菌如何對肝病推波助瀾!

