關(guān)于我們
經(jīng)典重讀丨Anal Chem代謝組學(xué)分析流程
自1999年代謝組學(xué)誕生以來,每年發(fā)表的代謝組學(xué)研究的文章數(shù)量都在不斷增加,在疾病診斷、藥物研發(fā)、食品安全、環(huán)境科學(xué)等諸多領(lǐng)域都有極其廣泛的應(yīng)用,我司精心挑選了一批代表性的科學(xué)文獻,逐一重讀,帶你用一杯茶的時間,理解近20年來的代謝組學(xué)技術(shù)進展和重要應(yīng)用。
在“組學(xué)”技術(shù)中,代謝組學(xué)的分析發(fā)展產(chǎn)生了深遠(yuǎn)影響,由于代謝物的不同理化性質(zhì)及濃度范圍,需要更加強有力的分析策略。來自西班牙圣帕布洛大學(xué)(Universidad San Pablo CEU),波蘭格但斯克醫(yī)科大學(xué)(Medical University of Gdańsk)和波蘭比亞韋斯托克醫(yī)科大學(xué)(Medical University Of Białystok)的研究者們于2020年在Analytical Chemistry上發(fā)表代謝組學(xué)分析流程最新進展綜述,具體內(nèi)容包括(1)樣品收集和制備(2)分析工具以及(3)數(shù)據(jù)挖掘策略和化合物鑒定的新趨勢。文章標(biāo)題“Recent Developments along the Analytical Process for Metabolomics Workflows”,原文鏈接:https://doi.org/10.1021/acs.analchem.9b04553。
一、樣品收集
制定和優(yōu)化樣本收集和處理的標(biāo)準(zhǔn)操作程序?qū)τ讷@得可靠數(shù)據(jù)以及在涉及不同生物樣本庫分析的流行病學(xué)規(guī)模的代謝組學(xué)研究中至關(guān)重要。
1.血液、血漿和血清
血液、血漿和血清是代謝組學(xué)分析使用最廣泛的基質(zhì),用于疾病研究以揭示潛在的生物標(biāo)志物。盡管目前已有標(biāo)準(zhǔn)化的血液樣本采集方案,但針對非靶向代謝組學(xué)研究的最佳策略仍在爭論中。一些研究對血漿和血清樣本進行了基于LC-MS的靶向代謝組學(xué)分析,探究樣本類型和收集管選擇對代謝物絕對濃度的影響,發(fā)現(xiàn)血清樣本中的代謝物濃度高于檸檬酸鹽血漿和EDTA血漿。此外,如果儲存不當(dāng),許多代謝物水平特別是一些脂類,如溶血磷膽堿和鞘磷脂,在樣本采集后30分鐘內(nèi)會發(fā)生變化。
近年來發(fā)展了一些新的采樣技術(shù),如體積吸收微量采樣技術(shù)(Volumetric absorptive microsampling,VAMS),用于收集固定體積(10 μL,20 μL和30 μL)包括血液在內(nèi)的各種生物體液,其對靶向和非靶向代謝組學(xué)研究的適用性仍在評估中。為了克服傳統(tǒng)靜脈穿刺術(shù)的主要缺點,開發(fā)了使用友好且無痛的觸摸激活靜脈切開術(shù)(Touch-activated phlebotomy,TAP),對45種代謝物的靶向LC−MS分析表明,45種代謝物中有39種,包括大多數(shù)氨基酸、膽汁酸、N,N-二甲基-L-甘氨酸、三甲胺N-氧化物、葡萄糖、乳酸和�;鈮A,在來自傳統(tǒng)血液采集和TAP采集的樣品中具有可比性,而半胱氨酸、還原型谷胱甘肽、琥珀酸和尿酸的水平有顯著差異。在最近的一項研究中,采用了干血斑甲醇提取方法用于高通量、基于芯片的nano-ESI-MS分析,耗時短,溶劑消耗最少,無過載情況。
在常規(guī)臨床環(huán)境中正確收集的任何血液樣本,包括最初為其他目的收集的血液樣本,都可能被用于差異分析的代謝組學(xué)。然而,重現(xiàn)性在樣品收集和制備中至關(guān)重要。因此,強烈建議遵循可靠的標(biāo)準(zhǔn)操作規(guī)程。
2.尿液
就穩(wěn)定性而言,尿液樣本應(yīng)始終保存在低于-20°C的溫度下�?紤]臨床條件,尿樣可以在−20°C或更低的溫度下保存少于30天,長期保存建議−80°C。
3.組織
使用組織樣本的代謝組學(xué)的第一個挑戰(zhàn)是樣本的異質(zhì)性,對于特定區(qū)域的代謝,必須特別小心。大腦是最復(fù)雜的器官之一,由于許多病理現(xiàn)象僅限于特定的區(qū)域。例如,神經(jīng)原纖維纏結(jié)是阿爾茨海默病的主要特征之一,主要位于海馬體和大腦的皮質(zhì)/邊緣區(qū)域。其他異質(zhì)性組織如肝和肺。
第二個挑戰(zhàn)是通過使內(nèi)源性酶失活來有效地抑制正在進行的代謝反應(yīng)。盡管有不同的樣本保存方法,但最普遍的方法是在液氮(-196℃)中速凍。組織樣本采集的一個內(nèi)在因素是許多代謝物的變化,因為合成代謝反應(yīng)在死后到組織收集的時間段內(nèi)停止,分解代謝反應(yīng)不會。代謝組學(xué)分析不僅有助于揭示個體死亡后組織內(nèi)可能的變化,還有助于法醫(yī)學(xué)、癌癥和移植研究。
4.糞便
在了解腸道微生物對健康的廣泛影響的同時,糞便代謝組學(xué)也引起了越來越多的關(guān)注,因為糞便是一種非侵入性的基質(zhì),代表了腸道中消化過程的最終產(chǎn)物。對于人體研究,志愿者可以使用消毒的廣口塑料袋或容器(例如Fecotainer)等工具自行收集糞便樣本,且應(yīng)在采集樣本前接受指導(dǎo),以避免糞便被水、尿液或衛(wèi)生紙污染。在任何生物基質(zhì)的代謝組學(xué)研究中,樣本儲存都是至關(guān)重要的,糞便也不例外。因此,在采集樣品后,必須立即將樣品放置在密封、絕緣的容器中,并在2小時內(nèi)送到實驗室,在−80℃下儲存,防止微生物發(fā)酵。
多個因素包括飲食暴露、運動、藥物、一天中的時間和大便本身的異質(zhì)性,將影響基于糞便的代謝組學(xué)研究結(jié)果。因此,最佳策略需要將新鮮樣本直接在運輸容器中勻質(zhì),然后在將樣本放置在−80°C之前等分為多份,避免凍融循環(huán)。由于糞便粉末具有吸濕性,稱量時必須小心。
5.細(xì)胞
細(xì)胞單細(xì)胞培養(yǎng)是生物材料的重要來源,是生物體液和組織的替代品。代謝組學(xué)領(lǐng)域?qū)Υx調(diào)節(jié)的研究一直集中在這類樣本上。然而,關(guān)于細(xì)胞代謝組學(xué)的最佳工作流程,如收集、淬滅和代謝物提取,缺乏共識。在代謝組學(xué)研究中,胰酶消化法和刮取法是兩種廣泛使用的獲取貼壁生長細(xì)胞的方法。有研究在比較了刮取法和胰酶消化法收集貼壁細(xì)胞(HeLa和MCF7)以及凍融循環(huán)和玻璃微珠作為細(xì)胞裂解策略后得出結(jié)論:刮取和凍融循環(huán)相結(jié)合是利用同位素標(biāo)記LC-MS分析貼壁哺乳動物細(xì)胞代謝組學(xué)的最佳方法。另一個可能對細(xì)胞代謝組學(xué)研究有重大影響的關(guān)鍵因素是傳代次數(shù)。Abdul-Hamid等人用物理刮刀和胰酶消化的方法收集三種傳代次數(shù)(9,12和14)的RAW 264.7細(xì)胞,并通過1H NMR分析。結(jié)果表明,傳代次數(shù)越多,三羧酸循環(huán)和糖酵解所涉及的氨基酸和代謝物水平越低。另一方面,收集方式對甲硫氨酸和半胱氨酸途徑以及甘油磷脂代謝也有影響。因此,作者提出,傳代次數(shù)較少(<9P)的胰酶消化的原始細(xì)胞更適合于基于1H NMR的代謝組學(xué)。
盡管在前面描述的研究中使用了胰酶消化,但有報道發(fā)現(xiàn)在細(xì)胞胰酶消化過程中發(fā)生了代謝物滲漏,因此必須謹(jǐn)慎使用這種方法,而這種滲漏主要是由于收集過程本身的破壞性。
基于細(xì)胞的代謝組學(xué)研究的一種潛在的最佳工作流程可能包括首先通過熒光激活細(xì)胞分選(Fluorescence-activated cell sorting,F(xiàn)ACS)分離感興趣的細(xì)胞類型,然后在細(xì)胞裂解之前淬滅細(xì)胞代謝。然而,細(xì)胞中代謝物水平可能在細(xì)胞分選到淬滅的時間段內(nèi)發(fā)生改變。LluFrio等人發(fā)現(xiàn),F(xiàn)ACS誘導(dǎo)星形膠質(zhì)細(xì)胞氧化應(yīng)激,改變了細(xì)胞的氧化還原狀態(tài),改變了近一半檢測到的代謝物的信號強度。主要的發(fā)現(xiàn)是改變了谷胱甘肽二硫化物(GSSG)與谷胱甘肽(GSH)、NADPH與NADP+、NAD+與NADH的比率,同時發(fā)現(xiàn)參與TCA循環(huán)、糖酵解和磷酸戊糖途徑的氨基酸、�;鈮A等代謝物水平的降低。相反,F(xiàn)ACS-星形膠質(zhì)細(xì)胞的尿苷和肌苷水平升高。作為這項研究的繼續(xù),Binek等人進行了多平臺(液相色譜-質(zhì)譜、氣相色譜-質(zhì)譜和毛細(xì)管電泳-質(zhì)譜)代謝組學(xué)分析,以研究流式細(xì)胞儀對C57BL/6小鼠腹膜巨噬細(xì)胞代謝組的影響。作者評估了免疫染色、FACS以及這兩種技術(shù)結(jié)合的效果,并與對照組的細(xì)胞進行了比較。結(jié)果表明,F(xiàn)ACS至少影響10%檢測的代謝物,包括甘油磷脂、脂肪�;�、脂肪酸酯、氨基酸(及其衍生物)、甘油脂和鞘脂。這些變化與FACS在細(xì)胞代謝組中誘導(dǎo)的物理應(yīng)激有關(guān),包括誘導(dǎo)炎癥樣狀態(tài),涉及Ca2+信號和磷脂酶A2移位到細(xì)胞膜。此外,細(xì)胞能量消耗的改變,導(dǎo)致細(xì)胞損傷,也被發(fā)現(xiàn)潛在地破壞細(xì)胞的動態(tài)平衡。
二、樣品處理
關(guān)于代謝物的提取,建議根據(jù)代謝物的極性指數(shù)和logP范圍選擇提取溶劑。不同極性的混合溶劑在一次提取中可覆蓋更多的代謝物,用不同的混合溶劑提取多次可進一步提高提取效率。
近年來發(fā)展了許多關(guān)于樣品制備分析的新方法,如體外液體萃取表面分析(In vitro liquid
extraction surface analysis,ivLESA),可在抽吸培養(yǎng)基后對貼壁細(xì)胞直接進行nano-ESI-MS分析。類似的LESA-nano-ESI-MS已被用于細(xì)胞脂質(zhì)組成研究。解吸電噴霧電離(Desorption electrospray
ionization,DESI)能夠以最少的制備直接分析生物基質(zhì),但局限性之一是非極性化合物的電離效率很低。為了克服這個問題,已經(jīng)開發(fā)了一種基于光電離的正電化組件(DESI/PI)來促進解吸的中性代謝物的二次電離。
最近新型樣品基質(zhì)如胎盤組織、骨骼、視神經(jīng)、母乳、外淋巴液等已被用于代謝組學(xué),每種基質(zhì)都需要獨特的條件來進行最佳勻質(zhì)、代謝物提取和分析。
任何儀器技術(shù)的進步,如超高效液相色譜或高分辨質(zhì)譜,都可提供更多和更高質(zhì)量的信息。
非靶向代謝組學(xué)可以作為一種發(fā)現(xiàn)和產(chǎn)生假設(shè)的工具,其主要目標(biāo)不是定量,而是以半定量的方式對兩個或兩個以上的組別進行差異分析。然而,由于無法獲得代謝物的定量水平,代謝組學(xué)最近的一種趨勢是通過靶向方法獲得高代謝物覆蓋率,這種方法有不同的名字如大規(guī)模靶向代謝組學(xué)(Large-scale targeted metabolomics),廣泛靶向代謝組學(xué)(Widely targeted metabolomics)等。
研究者們通�?紤]不同方法的組合以獲得更高的代謝物覆蓋率。當(dāng)分析物數(shù)量增加時,一些化合物可能具有非常相似的結(jié)構(gòu)和相同的質(zhì)荷比,因此必須進行色譜分離。在這種情況下,通常需要延長色譜分離時間以提高分離度。此外,大多數(shù)靶向方法使用三重四極桿,為要測定的不同化合物設(shè)置不同的MRM通道,因此代謝物的數(shù)量越多,MRM通道數(shù)就越多,方法的靈敏度可能會受到影響。有兩種方法可以克服這一挑戰(zhàn)。一是將一個分析方法中的MRM通道拆分成多個分析方法,一個樣品進樣多次,但這會影響方法的通量。另一種方法是增加難檢測代謝物的MRM通道的駐留時間(Dwell Time),避免創(chuàng)建多個方法。然而,駐留時間的過度增加會使每個峰的點數(shù)減少。
除此之外,在一個方法中測定多個代謝物還面臨其他兩個挑戰(zhàn):定量和克服基質(zhì)效應(yīng)。根據(jù)是否定量可將代謝組學(xué)分為靶向代謝組學(xué)和非靶向代謝組學(xué),又可將靶向代謝組學(xué)進一步細(xì)分為三種策略。一是當(dāng)有已知濃度或純度的標(biāo)準(zhǔn)品時,可進行靶向定量分析(Targeted Quantitative Analysis),提供的最終結(jié)果是樣品中代謝物的真實濃度。使用穩(wěn)定同位素內(nèi)標(biāo)可以克服基質(zhì)效應(yīng),但局限在于可獲得的標(biāo)準(zhǔn)品及同位素內(nèi)標(biāo)數(shù)目有限或價格昂貴。二是當(dāng)待分析的代謝物標(biāo)準(zhǔn)品無法獲得,使用其他結(jié)構(gòu)類似物作為內(nèi)標(biāo)的靶向估計分析(Targeted Estimative Analysis),所獲得的結(jié)果是真正濃度的估計。三是靶向比較分析(Targeted Comparative Analysis),當(dāng)標(biāo)準(zhǔn)品和結(jié)構(gòu)類似物均無法獲得,唯一的選擇是比較信號強度,包括處理組樣品和對照組樣品的比較以及單個樣品和混合樣品比較。
1.氣相色譜-質(zhì)譜
氣相色譜-質(zhì)譜聯(lián)用(Gas chromatography-mass spectrometry,GC-MS)是代謝組學(xué)中一項非常重要的技術(shù),用于分析易揮發(fā)的化合物,但存在峰容量有限,峰重疊嚴(yán)重的問題。在此基礎(chǔ)上發(fā)展了全二維氣相色譜(GC×GC),經(jīng)第一根色譜柱分離流出的化合物進入第二根色譜柱實現(xiàn)二次分離。基于GC×GC的非靶向代謝組學(xué)已用于細(xì)菌、尿液、血清和血漿、植物等不同基質(zhì),然而GC×GC方法在方法學(xué)標(biāo)準(zhǔn)化、數(shù)據(jù)解析和結(jié)果一致性方面仍存在局限,阻礙了該技術(shù)充分發(fā)揮其潛力。
2.毛細(xì)管電泳-質(zhì)譜
毛細(xì)管電泳-質(zhì)譜(Capillary electrophoresis-mass spectrometry,CE-MS)已被用于代謝組學(xué)研究,用于分析各種復(fù)雜的生物樣品,檢測極性和離子化合物。目前,CE−MS被認(rèn)為是其他技術(shù)如HPLC−MS、GC−MS和NMR的補充,進一步提高代謝物的覆蓋率。
電噴霧電離(Electrospray ionization,ESI)是最常見的用于CE和MS耦合的軟電離技術(shù)。然而,CE−MS耦合本身并不簡單,它需要毛細(xì)管末端的導(dǎo)電液體保持電流并獲得兼容的電位,以形成穩(wěn)定的電噴霧。表1列出了2018年至2019年7月報道的CE−MS在生物樣品靶向和非靶向代謝組學(xué)中的相關(guān)研究。
盡管包括大量樣本的代謝組學(xué)研究的數(shù)量有所增加,但這些研究仍然有限。由于CE−MS分離效率很高,非常適合小樣本隊列的代謝組學(xué)研究(≈100),然而,它在大規(guī)模人群隊列研究中的可靠性仍然存在爭議。因此,Harada等人的研究可以被認(rèn)為是一個里程碑。他們通過分析8413個血漿樣本以獲得來自日本人群的人類血漿樣本代謝圖譜,檢驗了CE−MS在大規(guī)模測量中的重復(fù)性和有效性。在這項工作中,對80種極性代謝物進行了結(jié)構(gòu)鑒定和定量,在質(zhì)控樣品中的變異系數(shù)低于30%。這些結(jié)果證明了CE−MS平臺在進行大規(guī)模隊列研究方面的能力。
3.離子遷移譜
在基于質(zhì)譜的代謝組學(xué)研究中,盡管應(yīng)用不斷增加,儀器不斷進步,仍有許多因素限制了代謝物鑒定。離子遷移譜(Ion mobility spectrometry,IMS)提供了額外的分離維度,并且工作在毫秒內(nèi),可以幫助代謝物鑒定。此外,離子遷移允許測量碰撞截面(Collision cross-section,CCS),這是一個比保留指數(shù)更具重現(xiàn)性的正交分析參數(shù),可以和保留時間以及精確分子量信息結(jié)合使用,獲得代謝物的特性。
近年來,IMS-MS有了相當(dāng)大的進步,主要分類有漂移時間離子遷移譜(Drift-time ion mobility spectrometry,DTIMS)、行波離子遷移譜(Traveling wave IMS,TWIMS)、高場不對稱波形離子遷移譜(High-field asymmetric waveform ion mobility spectrometry,F(xiàn)AIMS或DMS)、捕獲離子遷移譜(Trapped IMS,TIMS)等。對于代謝組學(xué)分析,TWIMS和DTIMS是最常用的IM類型,F(xiàn)AIMS和TIMS在小分子分析方面也具有巨大的潛力。表2總結(jié)了使用不同類型的IMS的最新代謝組學(xué)研究。
在所有這些文章中,離子遷移率的加入可以更好地分離共洗脫化合物,降低噪音,更好地分離同分異構(gòu)體和碎片離子。然而,由于商業(yè)儀器相對較新,需要改進軟件能力,以便能夠通過建立和使用CCS數(shù)據(jù)庫有效地提取多維數(shù)據(jù)和處理CCS值。
4.手性分析
許多生化過程不僅包括內(nèi)源化合物,還包括外源化合物和微生物代謝物等,表現(xiàn)出立體特異性,這些類型化合物的分析需要有效的分離方法。由于樣品的復(fù)雜性和對映體的分離,二維液相色譜(Two-dimensional liquid chromatography,2D-LC)特別適合手性代謝組學(xué),但主要缺點是數(shù)據(jù)管理和分析時間長(>1h)。
關(guān)于手性代謝組學(xué)的靶向或非靶向的方法,通�;谝唤M具有相同官能團的化合物或者和某條代謝途徑相關(guān)的代謝物。非靶向或大規(guī)模的手性代謝組學(xué)研究在文獻中并不常見。手性代謝物的準(zhǔn)確定量需要使用內(nèi)標(biāo)來克服基質(zhì)效應(yīng)引起的離子抑制,可使用同位素標(biāo)記衍生化的方法,目前已開發(fā)了很多手性或非手性同位素標(biāo)記衍生化試劑。
四、數(shù)據(jù)處理
由質(zhì)譜產(chǎn)生的數(shù)據(jù)是龐大且復(fù)雜的,因此需要大量的算法和工作流程處理和分析獲得的大量信息。圖1展示了代謝組學(xué)數(shù)據(jù)特征及數(shù)據(jù)處理策略。
圖1.代謝組數(shù)據(jù)組成、數(shù)據(jù)質(zhì)量提高策略和變量選擇步驟
1.提高數(shù)據(jù)質(zhì)量
數(shù)據(jù)清洗
高質(zhì)量數(shù)據(jù)的重要性不言而喻,因此,代謝組學(xué)數(shù)據(jù)清洗是必要的。這種策略的主要好處是為相關(guān)特征建立數(shù)據(jù)歸一化參數(shù)。綜合的數(shù)據(jù)預(yù)處理和降噪算法以及多種數(shù)據(jù)篩選策略可以有效地提高總體數(shù)據(jù)質(zhì)量。
數(shù)據(jù)標(biāo)準(zhǔn)化
雖然數(shù)據(jù)標(biāo)準(zhǔn)化的概念是已知的,但在代謝組學(xué)數(shù)據(jù)背景下,仍不夠明確�?紤]到可用算法的多樣性以及關(guān)于系統(tǒng)偏差來源的有限信息,為給定的數(shù)據(jù)集選擇最佳方法是一項重大挑戰(zhàn),也是目前代謝組學(xué)數(shù)據(jù)預(yù)處理的主要障礙。已經(jīng)提出了幾種基于不同原理的標(biāo)準(zhǔn)化策略,這些策略旨在消除由實驗源(例如,實驗偏差、信號漂移、樣品降解、測量變化、進樣體積變化和樣品提取效率)和生物變異(例如,生物體液濃度變化、不同細(xì)胞大小和不同樣品測量)引起的混淆。經(jīng)常在基于MS的非靶向代謝組學(xué)中觀察到儀器響應(yīng)的系統(tǒng)性變化,批次內(nèi)和批次間效應(yīng)都會降低統(tǒng)計效能,并對報告結(jié)果的重復(fù)性和再現(xiàn)性產(chǎn)生負(fù)面影響,阻礙數(shù)據(jù)解釋。然而,LC-MS代謝組學(xué)數(shù)據(jù)暴露于由以下原因引起的特定的變異源:(I)MS源中污染物的累積,(II)源自流動相組成和制備的雜質(zhì)或變異性,(III)分析柱性能,或(IV)樣品基質(zhì)復(fù)雜性的差異,因此,需要更有效的批次校正策略。在假設(shè)QC響應(yīng)與進樣順序無關(guān)的情況下,基于QC重復(fù)分析的算法是最推薦的方法之一。
任何校正方法都應(yīng)謹(jǐn)慎使用,因為可能會嚴(yán)重影響潛在生物標(biāo)志物的選擇,并可能導(dǎo)致錯誤的結(jié)論。因此,最優(yōu)方案的選擇必須依賴于數(shù)據(jù),滿足實驗設(shè)計的標(biāo)準(zhǔn)和研究目的。
2.變量/特征選擇
生物標(biāo)志物的主要作用是區(qū)分不同的組別,例如,健康和疾病。因此,選擇攜帶相關(guān)生物信息的變量是代謝組學(xué)工作流程中最重要和最具挑戰(zhàn)性的任務(wù)之一。目前已經(jīng)開發(fā)了許多單變量或機器學(xué)習(xí)方法,如聚類、回歸或分類,以幫助將組學(xué)數(shù)據(jù)轉(zhuǎn)化為實際的臨床應(yīng)用。這些方法可以分為(I)特征子集選擇方法(刪除不起作用或多余的變量)和(II)特征提取方法(創(chuàng)建原始變量的組合作為新特征,以降低所選變量的維度)。表3提供了相關(guān)算法的概述。此外,特征選擇可以使用非監(jiān)督模型或監(jiān)督模型。多變量分析方法,如無監(jiān)督主成分分析或有監(jiān)督偏最小二乘法,已成為代謝組學(xué)的標(biāo)準(zhǔn)程序。然而,最近在代謝組學(xué)研究中報道了越來越多的嵌入式方法,如隨機森林(RF)、神經(jīng)網(wǎng)絡(luò)或最小絕對值收斂和選擇算子(LASSO)方法,以及許多其他基于機器學(xué)習(xí)算法的方法。
五、代謝物注釋和鑒定
根據(jù)所采用的分析技術(shù),代謝物鑒定工作流程存在較大差異。
1.GC-EI-MS
GC-MS通常配備EI作為電離源,分子碎裂模式高度可重復(fù)。此外,根據(jù)保留時間可以很容易地計算保留指數(shù)。目前基于GC-MS數(shù)據(jù)的代謝物鑒定有較完善的方法,GC-MS數(shù)據(jù)庫包含單同位素質(zhì)量、碎裂模式和保留指數(shù)等信息。
代謝物注釋通常使用商業(yè)化數(shù)據(jù)庫,如NIST,Wiley,MoNA和Fiehn;開源數(shù)據(jù)庫,如GOLM或者自建庫�;贕C-MS的非靶向代謝組學(xué)在代謝物注釋方面已經(jīng)取得了重要進展,但在未知代謝物鑒定方面仍有許多目標(biāo)需要實現(xiàn)。
2.LC-ESI-MS和CE-ESI-MS
在代謝物鑒定方面,CE-MS和LC-MS的重現(xiàn)性不如GC-MS,這主要是由于ESI源可能產(chǎn)生加合物、二聚體和碎片(包括源內(nèi)裂解),導(dǎo)致了一種本質(zhì)上不同的代謝物鑒定方法。近年來,代謝組學(xué)許多化學(xué)信息學(xué)和生物信息學(xué)工具已經(jīng)取得了巨大進步,為闡明未知化合物結(jié)構(gòu)提供了有力支持(如圖2所示)。
圖2.代謝物注釋和鑒定的時間軸及軟件工具的開發(fā)
專門用于代謝組學(xué)研究的數(shù)據(jù)庫在21世紀(jì)初創(chuàng)建,最初只提供化合物的m/z和結(jié)構(gòu)(The Cyc Collection,Metlin,LIPID MAPS,HMDB,或KomicMarket)(見圖2,第0類)。然而,實驗測到的化合物數(shù)量并不能覆蓋完整的代謝組,因此,開發(fā)了一些從已知的代謝物生成合理結(jié)構(gòu)的工具(MINE和BioTransformer)。
代謝組數(shù)據(jù)庫開發(fā)的下一階段是包括碎片相關(guān)的信息,允許搜索譜圖(XCMS,HMDB或MassBank)(見圖2,第1類)。然而,由于標(biāo)準(zhǔn)品的數(shù)量有限,不可能獲得這些數(shù)據(jù)庫中存在的大多數(shù)化合物的實驗數(shù)據(jù)。因此,創(chuàng)建了不同的工具和方法來預(yù)測不同實驗條件下的碎裂譜圖(MetFrag,MAGMa,MyCompoundID,CFM-ID,或CSI:FingerID)(見圖2,第2類)。
由于相似的結(jié)構(gòu)通常具有相似的碎裂模式,代謝物的鑒定仍然缺乏信心,因此使用正交信息注釋和鑒定代謝物。例如,化合物的疏水性決定了它在色譜柱上的保留時間或毛細(xì)管電泳中的遷移時間。應(yīng)用正交信息注釋代謝物的另一個例子是評估一種化合物可能形成的離子(加合物、多電荷、二聚體等)。這種正交信息已逐漸包含在代謝物注釋和識別工具(MZeDB,CAMERA,MetFrag,LipidBlast,iMeT,CMM)中(見圖2,第3類)。
最近,開發(fā)了一些包括生物體不同代謝物之間生物關(guān)系的工具(MassTRIX,GNPS,xMSannotator,BioCAn,NAP,ADAPTIVE,MetDNA、MolNetEnhancer,或MetNet)(見圖2,第4類)。
代謝物注釋和鑒定數(shù)據(jù)庫逐漸包含了更多關(guān)于化合物的信息。研究代謝物網(wǎng)絡(luò)和評估推定注釋之間的關(guān)系是最近創(chuàng)建或更新工具的發(fā)展趨勢。當(dāng)使用更多的信息進行代謝物注釋時,代謝組學(xué)實驗將獲得更高的置信度。
此外,可用于進行代謝物注釋和鑒定的大量工具(本綜述包括41個,但這個數(shù)字正在指數(shù)級增加)使得用戶需要學(xué)習(xí)多種不同語言,如R、Python、Web應(yīng)用程序和獨立應(yīng)用程序,因此出現(xiàn)了集成代謝組學(xué)實驗所有階段使用的不同工具的框架或工作流(Workflow4Metabolomics,Taverna和KNIME)。
同時,開源數(shù)據(jù)庫(XCMS、MassBank、MetabolomicsWorkbench和GNPS)的存在使研究人員能夠傳播獲得的信息,與代謝組學(xué)領(lǐng)域的其他研究者共享。這些數(shù)據(jù)庫承諾以更標(biāo)準(zhǔn)化的方式呈現(xiàn)結(jié)果,并有機會在后續(xù)實驗中使用其他研究人員的數(shù)據(jù)來改進注釋和鑒定。然而,大量用戶上傳關(guān)于相同代謝物的相同或非常相似的信息可能會使數(shù)據(jù)難以使用。由于專門用于不同代謝物類型、方法或目的的數(shù)據(jù)庫之間重疊較少,用戶友好和免費訪問不同的數(shù)據(jù)源至關(guān)重要。
結(jié)論
分析化學(xué)的概念正在發(fā)展,包括非靶向、差異分析和半定量分析。在進行差異分析時,會通過統(tǒng)計分析來消除可能影響所有比較樣本的因素,從這個意義上說,它們的嚴(yán)格控制并不關(guān)鍵。同時,這并不意味著代謝組學(xué)可以被用作一個黑匣子,在黑匣子里輸入樣本,按下儀器上的按鈕,軟件平臺自動提供結(jié)果。在處理未知因素時,深入了解分析的目標(biāo)、樣本、分析工具,以及數(shù)據(jù)挖掘和代謝物鑒定策略,對于獲得有意義的結(jié)果至關(guān)重要。