答疑解惑專題(四)——開源代謝組學全功能軟件介紹-自主發布-資訊-生物在線

答疑解惑專題(四)——開源代謝組學全功能軟件介紹

作者:麥特繪譜生物科技(上海)有限公司 2018-10-29T14:51 (訪問量:22088)

高通量代謝組學研究的一大難點在于數據處理和分析。對于質譜或核磁產生的海量數據需要借助于自動化的軟件來進行數據分析。代謝組學全流程軟件應具備完整的分析工作流程,包括數據預處理、物質鑒定、統計分析以及數據的解釋與整合。本文將介紹幾種應用最為廣泛且功能強大的全流程軟件(表1),供大家參考。



表1. 四種全流程軟件對比。



軟件簡介



MAVEN:MAVEN是基于現有開源軟件建立的LC-MS數據分析軟件,可處理MRM(multiple reaction monitoring)和高分辨的全掃描數據。軟件設計目的是開發一款用于探索和驗證代謝組學數據的圖形用戶界面,降低代謝組學分析的復雜性。該軟件具有從特征值提取到代謝物通路分析及數據可視化的整個數據分析功能。同時為了便于數據驗證,MAVEN 運用機器學習算法來自動評估峰值質量。



MZmine:MZmine是一款開源軟件,主要處理LC-MS和GC-MS平臺數據,可用于非靶向和靶向代謝組學數據分析。軟件設計核心理念是將功能模塊和數據處理模塊嚴格分開,以提高軟件的易用性。其中數據處理模塊采用嵌入式可視化工具,實現立即預覽分析結果的功能。軟件新增功能:基于RANSAC算法對齊峰列表、在線數據庫鑒別峰、改進的同位素模式識別以及實現數據可視化。項目管理是該軟件新增的另一核心模塊,用戶可隨時追蹤并儲存臨時的數據分析結果。



MetaboAnalyst:MetaboAnalyst是一款完全免費的web平臺代謝組學數據分析軟件。軟件分為八個功能模塊,可歸納成三大類:(1)探索性數據分析,包括“統計分析”和“時間序列”模塊。(2)功能分析,分別是“富集分析”、“通路分析”和“整合通路分析”模塊。(3)高級分析方法,包含“生物標志物分析”、“樣本量的估計”和“效能分析”模塊。此外,它還包含“其他實用程序”模塊,該模塊具有脂質組學數據分析的特殊功能和化合物ID 轉換工具。



XCMS Online:XCMS Online是一款基于云計算的數據處理平臺,它繼承了XCMS強大的數據預處理功能,如峰識別、峰對齊等,同時新增了單因素和多因素統計分析方法、代謝物特征注釋和代謝物鑒定,為非靶向代謝組學提供了完整的工作流程方案。另外它將XCMS的命令行界面改為用戶友好型的圖形用戶界面,降低了操作難度。



圖1. 軟件的主要功能界面。A,B,C,D分別為MAVEN, MZmine, MetaboAnalyst, XCMS Online。



主要功能對比




原始數據格式:MAVEN軟件要求原始數據以mzXML、mzData格式錄入。MZmine數據導入支持csv、mzTab、XML等格式,同時輸出格式有XML、SQL和 MetaboAnalyst。XCMS Online軟件可支持多種原始數據格式,包括netCDF、mzXML、mzData和Agilent.d文件,但數據加載的時間會因文件大小而不同,有時甚至長達數小時。而MetaboAnalyst數據輸入不同于前三類軟件,它要求的格式為csv、txt或zip包,數據類型為化合物濃度、NMR/MS 的箱式結構或峰強度列表或LC/GC-MS圖譜,因而輸入的數據通常要求已完成去噪平滑和基線校正等譜圖預處理。



數據預處理:數據預處理主要包括峰識別、峰對齊、樣本標準化、零值填充和奇異樣本剔除。MetaboAnalyst和XCMS Online軟件主要是基于XCMS R包實現峰識別、峰對齊和峰匹配等數據預處理功能。MetaboAnalyst峰識別采用高斯模型算法,峰對齊提供四種分析方法,即COW、DTW、基于化學遷移的峰對齊和根據質量公差及保留時間公差的峰對齊,且這些方法能夠檢驗數據的完整性。XCMS Online除進行單一的峰識別峰對齊外,還將保留時間校正前后的結果以總特征離子色譜圖和RT校正曲線圖的形式展示出來,并從RT校正曲線中識別出極端值,并將其刪除。MAVEN軟件利用機器學習算法對峰質量進行評估,通過設定m/z范圍提取對應的色譜圖,以此識別峰,然后進行峰分組并得出峰質量分數。MZmine軟件的峰列表處理分為六大模塊:零值填充、同位素檢測、濾過、對齊、標準化和峰鑒定。其中峰列表對齊運用RANSAC算法。



統計分析:MetaboAnalyst是所有綜合性分析工具中統計功能和方法最全面的軟件,包括常規的統計方法和高級機器學習算法,單因素分析包含t檢驗、火山圖、單因素方差分析和相關分析;多因素分析有PCA、PLS-DA和OPLS-DA;高維特征值的提取方法有顯著性分析(Significance Analysis of Microarrays, SAM)和微陣列的經驗貝葉斯分析(Empirical Bayesian Analysis of Micoarrays, EBAM)算法;聚類分析有系統樹圖、熱圖、K均值和自組織神經網絡分析;有監督分析方法包括RF和SVM算法。同時還提供了時間序列分析,用來檢測代謝物濃度或代謝物判別模型隨時間的變化趨勢。MZmine中的統計分析相對其數據預處理并不是開發的重點內容,僅提供基本統計方法,但同時支持使用第三方統計軟件提供的高級算法,包括交叉驗證圖、聚類分析、曲線距離分析、Log ratio圖、熱圖、PCA以及Sammon’s投影法等。MAVEN軟件包中的數據分析主要是針對兩樣本間的比較,利用t檢驗來估計兩樣本間的差異。XCMS Online提供的基本統計方法有配對t檢驗和多組比較的方差分析,另外提供了其特有的多樣本間兩兩比較的meta分析方法。其中單因素分析的統計結果以云圖輸出,多因素則以PCA得分圖輸出。



其他高級功能:MetaboAnalyst軟件是唯一提供功能分析(包括富集分析、通路分析和整合通路分析)和高級分析(包括生物標志物分析、樣本量估計和效能分析)的軟件。功能分析中的代謝物富集分析目前只針對哺乳動物,代謝通路分析模塊又分為代謝通路富集分析和路徑拓撲結構分析。高級分析中,生物標志物分析是基于PLS-DA、SVM及RF的基礎上使用ROC曲線進行分析的;效能分析和樣本量的估計則基于 Bioconductor軟件包SSPA。該方法是利用實驗數據中檢測的全部統計量來估計效應大小的分布、效能和最小樣本量。



物質鑒定及通路分析數據庫:MAVEN提供通路可視化界面(圖 1A),其數據庫來源于KEGG 和Metacyc。MZmine軟件為物質鑒定提供多條途徑,包括自定義數據庫搜索、在線數據庫搜索以及片段和加合物搜索等,同時支持在線連接多種通路分析的組學數據庫。物質鑒定庫有HMDB、METLIN和PUBChen;通路分析數據庫支持KEGG;其他還包括chemspider、Lipid Maps、MassBank、Plantcyc和YMDB數據庫。MetaboAnalyst中物質鑒定支持 HMDB 和 METLIN等庫,代謝物通路分析提供KEGG和SMPDB等庫。XCMS Online軟件同樣支持 HMDB和METLIN物質鑒定庫以及BIOCYC和KEGG代謝通路庫。



小結

MAVEN軟件的顯著優勢在于能對峰質量進行良好的評估,能提供可信度較高的代謝組學數據,同時能實現數據在代謝途徑中的可視化繪圖。MZmine軟件除具有全面的數據預處理功能外,同時支持用戶開發新的算法,所以它既適合于無編程基礎的組學工作者也適合一些高級用戶。MetaboAnalyst的優勢則在于它強大的數據統計分析、高級分析以及功能分析等功能,這對代謝組學數據的注釋和整合具有重要意義。XCMS Online軟件是經典 XCMS 函數包的擴展,使用簡便,是一款良好的用戶友好型軟件,但不具有良好的擴展性。



參考文獻:

梁丹丹, 李憶濤, 鄭曉皎,等. 代謝組學全功能軟件研究進展[J]. 上海交通大學學報:醫學版, 2018, 38(7).



更多內容請閱讀原文獻
麥特繪譜生物科技(上海)有限公司 商家主頁

地 址: 上海市浦東新區秀浦路2555號康橋商務綠洲E6棟5層

聯系人: 林景超

電 話: 400-867-2686

傳 真: 021-20900216

Email:marketing@metaboprofile.com

相關咨詢

客戶案例 | Cell重磅!代謝物α-KG化身血管 “智能開關”——破解玫瑰痤瘡治療困局 (暫無發布時間 瀏覽數:6415)

客戶案例 | Gut:幽門螺桿菌并非僅有!房靜遠院士團隊揭示胃癌又一“促癌元兇”咽峽炎鏈球菌 (暫無發布時間 瀏覽數:6756)

講座預告 | 4月23日19點,房靜遠院士團隊精講Gut-咽峽炎鏈球菌產生的甲硫氨酸促進胃癌進展 (暫無發布時間 瀏覽數:5522)

繪譜學堂 | 3月19日14點,腸道菌群與代謝在抑郁癥治療中的作用及診斷潛能研究 (暫無發布時間 瀏覽數:10696)

Cell Metabolism | 賈偉等科學家揭秘“清醛益生菌”精準攔截高糖產乙醛通道,筑牢代謝防火墻 (暫無發布時間 瀏覽數:13531)

客戶案例 | GUT:結腸炎患者福音!腸道高豐度Parasutterella菌+免疫陷阱=腸癌高風險,靶向干預有了新方向! (暫無發布時間 瀏覽數:13687)

客戶案例 | 蘇州大學賈志浩/張勇等Nature Communications:抑制PRMT3模擬限制性飲食改善代謝靈活性 (暫無發布時間 瀏覽數:17561)

繪譜導讀 | 頂刊聚焦腸道微生物-宿主代謝:從膽汁酸互作到腫瘤免疫的健康密碼 (暫無發布時間 瀏覽數:16411)

Nature Communications | 代謝組學和蛋白質組學揭示阻斷精氨酸琥珀酸合成酶1可緩解潰瘍性結腸炎 (暫無發布時間 瀏覽數:16632)

客戶案例 | Cell Metabolism:抗性淀粉治脂肪肝 “因人而異”?腸道菌群才是療效 “開關”! (暫無發布時間 瀏覽數:17139)

ADVERTISEMENT