通過OPLS-DA過濾掉了不相關的正交信號,因而獲得的差異性代謝物更加可靠。本項目采用 OPLS-DA模型第一主成分的VIP(Variable Importance in the Projection)值(閾值>1),并結合Student t檢驗(t-test)的p值(閾值<0.05)來尋找差異性表達代謝物??蛻粢部梢愿鶕约旱男枨?,選擇其他差異代謝物的篩選標準。
我們將篩選差異代謝物的結果以火山圖(volcano plot)的形式進行可視化,結果如圖所示:
差異代謝物篩選火山圖
通過以上分析得到的差異代謝物,在生物學上往往具有結果和功能相似性/互補性,或者受同一代謝通路的正調控/負調控,表現為在不同實驗組間具有相似或相反的表達特征。對這類特征進行層次聚類分析,有助于我們將具有相同特征的代謝物歸為一類,并發現代謝物在實驗組間的變化特征。
差異代謝物層次聚類分析熱力圖
生物體中的復雜代謝反應及其調控并不單獨進行,往往由不同基因和蛋白質形成復雜的通路和網絡,它們的相互影響和相互調控最終導致代謝組發生系統性的改變。對這些代謝和調控通路的分析可以更全面,更系統的了解實驗條件改變導致的生物學過程的改變,性狀或疾病的發生機理和藥物作用機制等生物學問題。
京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes, KEGG) Pathway數據庫以基因和基因組的功能信息為基礎,以代謝反應為線索,串聯可能的代謝途徑及對應的調控蛋白,以圖解的方式展示細胞生理生化過程。這些過程包括能量代謝,物質運輸,信號傳遞,細胞周期調控等,以及同系保守的子通路等信息,是代謝網絡研究最常用的通路數據庫。
我們整理出差異代謝物映射的所有通路,如下表所示:
Pathway | Compounds |
mmu01 100Metabolic pathways
- Mus musculus (mouse) (23) |
cpd:C00041 L-Alanine;cpd:C00073 L-Methionine;cpd:C00086 Urea;cpd:C00106 Ura-cil;cpd:C00111 Glycerone phosphate;cpd:C00114 Choline;cpd:C00147 Adenine;cp-d:C00157 Phosphatidylcholine;cpd:C00178 Thymine;cpd:C002 14 Thymidine;cpd:C00245 Taurine;cpd:C00262 Hypoxanthine;cpd:C00385 Xanthine;cpd:C00515 D-Ornithine;cp-d:C00695 Cholic acid;cpd:C00719 Betaine;cpd:C00847 4-Pyridoxate;cpd:C010354-Guanidinobutanoate;cpd:C01477 Apigenin;cpd:C02 140 Corticosterone;cpd:C02528 Chenodeoxycholate;cpd:C05842 N1-Methyl-2-pyridone -5-carboxamide;cpd:C06427(9Z,12Z,15Z)-Octadecatrienoic acid |
mmu00240 Pyrimidine metabolism
- Mus musculus (mouse) (6) |
cpd:C00086 Urea;cpd:C00106 Uracil;cpd:C00178 Thymine;cpd:C00214 Thymidine;cpd:C00526 Deoxyuridine;cpd:C00881 Deoxycytidine |
mmu02010 ABC transporters - Mus musculus (mouse) (5) |
cpd:C00086 Urea;cpd:C00106 Uracil;cpd:C00178 Thymine;cpd:C00214 Thymidine;cpd:C00526 Deoxyuridine;cpd:C00881 Deoxycytidine |
… | … |
KEGG通路注釋信息表(部分)
獲得上述結果后,我們將差異代謝物在KEGG通路圖上進行標記,以亮紅色代表上調,亮藍色代表下調。以Citrate cycle
(TCA cycle)代謝通路為例:
代謝通路圖,其中紅色標記的點為差異代謝物
KEGG注釋分析僅找到所有差異代謝物參與的通路,但要想知道這些通路是否與實驗條件密切相關,需對差異代謝物進行進一步的代謝通路富集分析。通過對差異代謝物所在通路的綜合分析(包括富集分析和拓撲分析),我們可以對通路進行進一步的篩選,找到與代謝物差異相關性最高的關鍵通路。
代謝通路富集分析的結果以氣泡圖進行展示。氣泡圖中每一個氣泡代表一個代謝通路,氣泡所在橫坐標和氣泡大小表示該通路在拓撲分析中的影響因子大小,大小越大影響因子越大;氣泡所在縱坐標和氣泡顏色表示富集分析的P值(取負常用對數,即-log10P-value),顏色越深P值越小,富集程度越顯著。我們對富集分析和拓撲分析綜合考慮后凸顯出重要性的通路進行了標注,幫助客戶深入理解分析結果。
代謝通路富集分析氣泡圖