代謝組學(xué)是以代謝物分析的整體方法來(lái)研究功能蛋白如何產(chǎn)生能量和處理體內(nèi)物質(zhì),評(píng)價(jià)細(xì)胞和體液內(nèi)源性和外源性代謝物濃度及功能關(guān)系的新興學(xué)科,是系統(tǒng)生物學(xué)的重要組成部分,其相應(yīng)的研究能反映基因組、轉(zhuǎn)錄組和蛋白組受內(nèi)外環(huán)境影響后相互協(xié)調(diào)作用的最終結(jié)果,更接近反映細(xì)胞或生物的表型,因此被越來(lái)越廣泛地應(yīng)用。
隨著代謝分析技術(shù)逐漸改進(jìn),獲得數(shù)據(jù)已不是難題,然而能否將呈多維的、海量的波譜數(shù)據(jù)進(jìn)行有效壓縮和轉(zhuǎn)換卻是首要解決的問(wèn)題,這就要借助于專門的數(shù)據(jù)分析方法。鑒定差異代謝物常用的分析方法包括主成分分析(PCA)、偏最小二乘判別分析(PLS-DA)、正交偏最小二乘判別分析(OPLS-DA)等。數(shù)據(jù)分析結(jié)果還需要經(jīng)過(guò)t檢驗(yàn)和變量權(quán)重重要性排序(variable importance in projection,VIP)值篩選差異性代謝產(chǎn)物。一般認(rèn)為,同時(shí)滿足P<0.05,VIP>1.0的變量為差異代謝物。
人類代謝數(shù)據(jù)庫(kù)(HMDB)是一個(gè)全面的、免費(fèi)的網(wǎng)絡(luò)資源,包含了有關(guān)人體代謝物的詳細(xì)信息。人體代謝物是指在人體內(nèi)發(fā)現(xiàn)的小分子,包括肽、脂類、氨基酸、核酸、碳水化合物、有機(jī)酸、生物胺、維生素、礦物質(zhì)、食品添加劑、藥物、化妝品、污染物,以及人類攝入、代謝、分解或接觸的任何其他化學(xué)物質(zhì)。代謝組學(xué)的發(fā)展(即代謝體的研究)的關(guān)鍵是代謝組學(xué)數(shù)據(jù)庫(kù)的開(kāi)發(fā)。就像基因組學(xué)和蛋白質(zhì)組學(xué)依賴于GenBank和UniProt中的參考序列來(lái)注釋基因和蛋白質(zhì)一樣,代謝組學(xué)也至關(guān)重要地依賴于參考化合物數(shù)據(jù)和參考光譜數(shù)據(jù)來(lái)注釋代謝物。盡管存在許多“代謝”數(shù)據(jù)庫(kù),例如KEGG,Reactome和Cyc數(shù)據(jù)庫(kù),但真正的“代謝組學(xué)”數(shù)據(jù)庫(kù)卻相對(duì)較少。一些較著名的代謝組學(xué)數(shù)據(jù)庫(kù)包括Metlin,MetaboLights,Metabolomics Workbench,Lipid Maps和HMDB。
隨著代謝組學(xué)的日益發(fā)展,越來(lái)越多的人把目光轉(zhuǎn)向代謝組學(xué)的研究,而其數(shù)據(jù)處理也已經(jīng)成為研究中重要的難題。雖然目前國(guó)內(nèi)外代謝組學(xué)的研究已經(jīng)取得了一些成果,但由于其尚未有功能完備的數(shù)據(jù)庫(kù),數(shù)據(jù)分析受到一定的限制。 與此同時(shí),生物樣本的復(fù)雜性使得代謝組學(xué)的研究難以達(dá)到分析全部的組分以及所有的代謝成分的要求,這就需要進(jìn)一步發(fā)展高通量、高效、快速的以及整合化的儀器分析技術(shù),開(kāi)發(fā)能滿足全組分分析的算法和軟件,將儀器分析技術(shù)、數(shù)據(jù)處理技術(shù)、多元統(tǒng)計(jì)分析技術(shù)以及可視化軟件有機(jī)結(jié)合起來(lái),以更好地促進(jìn)代謝組學(xué)的發(fā)展。