代谢组学相关数据库(及常用软件)

代谢组学相关数据库(及常用软件)

常用的代谢组相关数据库包括人类代谢组数据库(HMDB)、KEGG数据库、Reactome数据库等,介绍如下: 人类代谢组数据库(HMDB)是代谢组学中比较流行的数据库之一,包括人类小分子的详细信息体内发现的分子代谢物,不少于79,650个代谢物条目。 SMPDB 数据库与 HMDB 链接,包含大约 700 条人类代谢和疾病途径的途径图。 KEGG数据库是流行的代谢组数据库之一,包含代谢途径和相互作用网络的信息。 Reactome数据库主要收集人体主要代谢途径和重要反应的信息。 MassBank数据库主要收集许多高分辨率低代谢成分的光谱。

BioCyc 数据库包含途径和基因组数据。 METLIN 数据库是一个商业代谢组和串联质谱数据库,包含约 43,000 种代谢物和 22,000 个 MS/MS 谱图。 FiehnLib 数据库是一个商业代谢组数据库,包含约 1000 个保守代谢物的 EI 谱。

NIST/EPA/NIH 质谱库数据库也是一个商业代谢组数据库,包含超过 190,000 个 EI 谱图。 BioCyc 数据库收集途径和基因组数据,并且免费提供。 MetaCyc 数据库全面收集了许多不同生物体的代谢途径和酶的信息,包括 51,000 多篇文章。 MMCD数据库收集了10,000多种代谢物的信息及其MS和NMR数据,其中大部分是拟南芥代谢物。

代谢组学的分析流程

代谢组学的分析流程

一般来说,代谢组分析流程如下:首先对代谢物进行预处理,预处理的方法由测量分析方法决定。如果采用质谱分析,则需要提前将代谢物分离并电离。然后对预处理后的组分进行定性和定量分析。

在预处理中,常用的分离方法包括:气相色谱法(GC)、高效液相色谱法(HPLC)。气相色谱分辨率较高,但需要代谢组分气化,对组分的分子量有一定限制。高效液相色谱也广泛应用于代谢组分析,因为它在液相中分离代谢成分,因此不需要气化成分。与气相色谱法相比,其测量范围更宽,灵敏度更高。优势。此外,毛细管电泳还可以分离代谢成分,应用较少,但理论上其分离效率高于高效液相色谱。

在预处理过程中,常常会添加内标,以方便后续对样品质量的监测和比较。由于不同的实验批次和进样顺序对后续测量也有一定的影响,因此还添加了空白对照。与混合样品进行比较以进行质量监控。

对不同代谢成分进行定性和定量分析的方法包括质谱法(Massspectrometry,MS)和核磁共振波谱法(NuclearMagneticResonanceImaging,NMR)。其中,质谱法具有灵敏度高、特异性强的优点,广泛应用于代谢物的检测。它可以对分离和电离后的代谢物进行定性和定量。电离方法包括:常压化学电离(Atmospheric-Pressure Chemical Ionization,APCI)、电子电离(Electron ionization,EI)、电喷雾电离(Electrospray ionization,ESI)等,需要根据不同的分离方法进行选择。例如,电喷雾电离通常用于通过液相色谱分离组分。然而,由于质谱法不能直接检测生物溶液或组织,其应用受到了限制。为了提高原有质谱分析的灵敏度、简化样品制备、减少背景的影响,一些新的质谱相关技术得到了发展。这些技术包括:二次离子质谱 (SIMS) 和纳米结构引发剂 MS (NIMS),它们都是解吸/电离方法,两者均与基质无关。其中,SIMS利用高能离子束解吸样品的接触表面,具有空间分辨率高的优势,是与质谱联用的器官/组织成像的强大技术。 NIMS可用于小分子的检测。基质辅助激光解吸/电离(MALDI)是一种较为温和的电离方法,可以获得一些常规电离方法容易解离成片段的完整大分子的质谱信息,如DNA、蛋白质、肽和糖等。解吸电喷雾电离 (DESI) 是一种直接电离技术,可与质谱法串联使用,在大气条件下直接分析样品。其原理是利用快速移动的带电溶液流从接触表面提取样品,可用于法医分析、药物、植物、生物组织、聚合物等的分析。激光烧蚀电喷雾电离(LAESI)是一种结合中红外激光烧蚀和二次电喷雾电离的直接电离技术,可用于多种样品,包括植物、组织、细胞,甚至血液、尿液等未经处理的生物溶液,已应用于食品监管、药品监管等领域。核磁共振波谱不需要预先分离代谢组分。与质谱分析相比,核磁共振波谱具有结果重现性更好、样品制备更简单、无需预分离、对样品破坏较小等优点。它低于质谱法(有争议,一些人认为这是由于样品预处理工作流程不正确),但由于其易用性也被广泛使用。药品监管等领域。核磁共振波谱不需要预先分离代谢组分。与质谱分析相比,核磁共振波谱具有结果重现性更好、样品制备更简单、无需预分离、对样品破坏较小等优点。它低于质谱法(有争议,一些人认为这是由于样品预处理工作流程不正确),但由于其易用性也被广泛使用。药品监管等领域。核磁共振波谱不需要预先分离代谢组分。与质谱分析相比,核磁共振波谱具有结果重现性更好、样品制备更简单、无需预分离、对样品破坏较小等优点。它低于质谱法(有争议,一些人认为这是由于样品预处理工作流程不正确),但由于其易用性也被广泛使用。有些人认为这是由于样本预处理工作流程不正确造成的),但由于其易用性,它也被广泛使用。有些人认为这是由于样本预处理工作流程不正确造成的),但由于其易用性,它也被广泛使用。

此外,其他检测方法还包括:离子迁移谱分析(Ion-mobilityspectrometry,IMS)是一种基于电离分子在气相载体中的迁移来分离和分析这些分子的技术。灵敏度高,可单独使用或与质谱、气相色谱或液相色谱串联使用。电化学检测技术与高效液相色谱 (HPLC-ECD) 相结合,可用于测量复杂基质中的低含量成分,具有易用性、灵敏度和选择性。应用于临床研究、食品检测、药物检测等领域。拉曼光谱基于振动光谱,可以检测化合物的结构及其微小变化。具有不破坏样品、样品前处理简单、和高空间分辨率。它已用于临床病理学研究和微生物分类。以及检测、化合物分析等领域。

代谢组学数据的统计分析方法和策略

代谢组学数据的统计分析方法和策略

代谢组学数据的统计分析方法和策略

获得代谢组学数据后,需要利用软件读取并分析原始数据的信息,以确定原始数据中所含代谢成分的组成和含量。有许多统计软件可以读取和分析核磁共振谱和质谱数据。 XCMS 是一款常用的免费软件,用于读取和分析质谱原始数据。类似的常用软件还有MZmine2、MetAlign、MathDAMP、LCMStats等。

一旦获得代谢物组成和含量,就可以对这些数据进行统计分析。常用的分析方法包括主成分分析(PCA)、偏最小二乘回归、聚类分析、差异表达分析等。结果还可以利用上述数据库进行功能和通路富集分析。

代谢组学与组学数据整合

代谢组学与其他组学数据整合

如何更好地整合各种组学数据仍然是生物界面临的重大挑战,有时还面临不完善的实验设计和不同实验平台数据的整合。常用的方法有代谢途径水平分析、生物网络分析、经验相关分析等。有些软件或网站提供整合多个组学数据的即用型分析。例如,代谢途径富集分析包括:IMPaLA网站,使用来自11个数据库的3000多个代谢途径的信息,可用于整合多个组学分析;另外还有iPEAP软件、MetaboAnalyst网站等,可以提供代谢途径富集分析。提供生物网络分析包括:SAMNetWeb网站、可提供腹肌通路分析以及转录组和蛋白质组的网络分析; pwOmics包,是一个R软件包,可以根据随时间变化的转录组和蛋白质组信息构建网络;类似的软件还有MetaMapR(R包,带用户界面)、MetScape(Cytoscape插件)、Grinn(R包)等。可以进行经验相关性分析:WGCNA(R软件包),可以基于相关性和网络拓扑来整合和分析多种组学数据;其他 R 软件包包括 MixOmic、DiffCorr、qpgraph 和巨大。类似的软件还有MetaMapR(R包,带用户界面)、MetScape(Cytoscape插件)、Grinn(R包)等。可以进行经验相关性分析:WGCNA(R软件包),可以基于相关性和网络拓扑来整合和分析多种组学数据;其他 R 软件包包括 MixOmic、DiffCorr、qpgraph 和巨大。类似的软件还有MetaMapR(R包,带用户界面)、MetScape(Cytoscape插件)、Grinn(R包)等。可以进行经验相关性分析:WGCNA(R软件包),可以基于相关性和网络拓扑来整合和分析多种组学数据;其他 R 软件包包括 MixOmic、DiffCorr、qpgraph 和巨大。

靶向和非靶向代谢组分析技术区别

靶向和非靶向代谢组分析技术区别

代谢组学是生物体内生化反应的集合,是生命维持生命的物质基础,是研究生命活动的重要基础。代谢组学是基于高通量分析和生物信息学技术,研究生命在内、外环境影响下的内源代谢活动,包括代谢物的类型、数量和变化的检测和分析,从而研究集体生命。活动发生和发展的本质。

代谢物是生物过程的最终产物,其状态变化可以准确反映细胞功能的变化。研究表明,包括癌症在内的多种疾病,如肝病、肾病、心血管和神经系统疾病等,都与细胞内代谢状态变化引起的生理紊乱或细胞功能丧失有关。代谢组学已成为后基因组学时代功能基因组学的研究工具,大规模筛选新生物标志物用于疾病早期预测、诊断和分型的重要手段,以及精准医疗的重要技术手段之一。

代谢组学优势

代谢物种类和数量的变化易于检测;
与基因组学、蛋白质组学相比,技术手段更简单;
与基因组学和蛋白质组学相比,代谢物数量少,易于检测、验证和分析;
代谢水平的变化可以实时揭示机体的生理和病理状态。

代谢组学分类

根据研究目的不同,代谢组学又可分为非靶向代谢组学和靶向代谢组学。

非靶向代谢组学是指利用LC-MS、GC-MS、NMR技术对所有小分子代谢物(主要是细胞、组织、器官或生物体中刺激或扰动前后)进行公正的检测。通过生物信息学分析筛选相对分子质量小于1000Da的内源性小分子化合物的动态变化,并进行差异代谢物的通路分析,揭示其变化的生理机制。

靶向代谢组学是对特定类别代谢物的研究和分析。两者各有优缺点,常联合使用用于差异代谢物的发现和定量,以及对后续代谢分子标志物的深入研究和分析,应用于食品鉴定、疾病研究、动物模型验证等和生物标志物发现。在疾病诊断、药物研发、药物筛选、药物评价、临床研究、植物代谢研究、微生物代谢研究等方面发挥着重要作用。
代谢组学应用方向

1.生物样品中复杂代谢物的检测。
2. 寻找疾病的生物标志物。
3. 标记验证和绝对定量研究。
4.研究代谢途径的机制。

靶向代谢组学和非靶向代谢组
学之间的区别

靶向:关注目标代谢物,通常基于通路
非靶向:发现差异代谢物并寻找生物标志物

定性定量
靶向:定性定量同时进行,可检测浓度
非靶向:可定性,相对定量

方法
针对性:需要先购买标准品,进行方法学验证,然后进行测试,成本较高
非针对性:直接进样即可分析,成本相对较低

代谢组平台比较

非靶向代谢组学常用LC/MS、GC/MS、NMR三种检测方法,优缺点如下:

1、NMR(核磁共振)
优点是对样品无损,测量无偏差,即适用于血液、尿液等液体样品,也适用于固体样品如组织器官,测量速度快,可实现样本代谢组的动态监测。缺点主要是分辨率较低。

2、GC-MS(气相色谱法)
GC-MS是一种代谢组学研究技术,具有技术成熟稳定、分辨率高的特点。同时,由于数据库比较完整,质量也较好。缺点主要是样品处理复杂、衍生化困难。对物质进行表征和定量比较困难,影响了该技术在更大范围内的使用。

3、LC-MS(液相色谱)
优点主要表现在样品制备和预处理简单、实验重复性好、分辨率高、分离分析范围宽。

非靶向代谢组分析技术

代谢组学通常需要使用多种分析技术来满足不同的实验需求。常见的代谢组分析技术包括核磁共振(NMR)、液相色谱-质谱(LC-MS)、气相色谱-质谱(GC-MS)、毛细管电泳-质谱(CD-MS)、HILIC-MS等在。高分辨率质谱技术主要包括TOF-MS、FTICR-MS、Orbitrap-MS、Sector-MS等。

1. GC-MS(气相色谱)是代谢组学研究中的经典技术。具有技术成熟稳定、分辨率高的特点。同时,由于数据库比较完整,质量也更加准确。缺点主要是在样本上。加工过程复杂,且不易衍生化的物质难以表征和定量,影响了该技术在更大范围的应用。

2、LC-MS(液相色谱)的优点主要表现在样品制备和预处理简单、实验重复性好、分辨率高、分离分析范围广。

数据分析

数据预处理:使用XCMS、MZmine、MarkerView等工具进行原始数据处理。
差异代谢物的鉴定:常见的分析方法包括主成分分析(PCA)、偏最小二乘判别分析(PLS-DA)和正交偏最小二乘判别分析(OPLS-DA)。数据分析结果还需要通过t检验和投影变量重要性(VIP)值来筛选差异代谢物。一般认为同时满足P<0.05且vip>1.0的变量为差异代谢物。
代谢通路分析:常见的代谢组通路数据库包括HMDB、KEGG、Reactome、BioCyc、MetaCyc等数据库,可用于代谢通路和相互作用网络分析。
多组学分析:多组学分析已经是组学发现的趋势。可用的数据库和工具包括 IMPaLA 网站、iPEAP 软件、MetaboAnalyst 网站、SAMNetWeb 网站、pwOMICS、MetaMapR、MetScape、Grinn、WGCNA、MixOmic、DiffCorr、qpgraph、巨大等。

关于样品

1. 微生物和细胞样品:快速灭活代谢活性(猝灭),同时防止细胞裂解
2. 动物体液(如尿液、血液、组织、器官、唾液):采样后应迅速进行前处理,如添加抗凝剂和防腐剂,立即冷冻(-80℃)
3.植物样品:采集后快速冷冻(液氮),然后转至-80℃保存,200mg/箱
4.血清样品:500ul/箱(不少于200ul/箱),必须避免反复冻融。 (将血液收集于离心管中,静置30分钟使其凝固,然后离心取上清液装入干净的离心管中,然后8000rpm离心5分钟。-80℃冷冻保存送货。)
5、尿液样本:1ml/箱,原则上可以多取一点(尿液直接装入离心管,每管1ml,加一滴(约10ul)1/100(w/v)叠氮hua钠,冷冻-80℃)
6、瘤胃液:1ml/箱,原则上可以多取一点。收集步骤:瘤胃液6000×g离心15min,取上清液,等分,-80℃冷冻,干冰送样。为了使样品保持更长时间,可在取样后加入一滴(约10μl)1/100质量体积(w/v)叠氮hua钠溶液。