设为首页 | 加入收藏 |
站群导航
主站
教学机构
党政管理
科研及产业机构
公共服务
专题栏目
虚拟仿真实验平台
未指定
欢迎光临 中医药创新研究院 !
您的位置:首页 >通知公告>详细内容

通知公告

MedMeta:基于基因组学与AI的全球药用物种次生代谢物综合数据库

来源: 发布时间:2025-09-18 14:02:21 浏览次数: 【字体:

近日,成都中医药大学中医药创新研究院/交叉学科研究院本草基因组学研究团队在中国工程院院刊主刊Engineering发表了题为MedMeta: An AI-Enabled and Genomics-Based Database for Functional Profiling of Secondary Metabolites in Medicinal Species的文章。通过整合基因组学与人工智能技术,构建了首个覆盖全球八大药典药用物种的次生代谢物综合数据库MedMeta,实现了次生代谢物与基因组、生化和药理学信息的关联。MedMeta不仅为合成生物学、道地药材研究以及传统医药体系的现代转化提供了宝贵资源,也为天然产物的功能解析和药物研发提供了一个功能强大且可扩展的研究框架。成都中医药大学本草基因组学团队孟繁博特聘副教授、博士研究生张桂阳、萧文科为共同第一作者,陈伟教授为通讯作者。

f98f88853e5f46c5a99943ffdb8ada25.png 

01 研究背景

药用资源是疾病防治的重要基石,全球八大药典系统收录了众多药用物种,这些物种所含的次生代谢物既是传统药物发挥药理作用的核心物质基础,也是现代创新药物研发中不可或缺的关键先导化合物来源。然而,当前有关次生代谢物的研究仍面临多重瓶颈:一方面,现有次生代谢物数据库多聚焦于化学结构与生物活性数据,对生物合成途径、功能机制等关键内容收录不足,难以支撑深度研究;另一方面,传统代谢物提取与表征方法效率低下,即便基因组学与AI技术为解析代谢物作用机制提供了新工具,但海量且分散的组学数据缺乏统一整合平台,严重制约了药用资源的挖掘效率。在此背景下,建一个覆盖药典物种并整合多维数据的 AI 驱动数据库,已成为推进传统医学现代化和加速创新药物发现的迫切需求。

02 研究内容

研究团队基于全球八大药典收录的1,035种药用物种,通过系统的数据整合与标准化预处理流程,从Gene-encoded Natural Diverse Components RepositoryGNDC)数据库中筛选获得146,101个次生代谢物。代谢物来源涵盖植物、动物、藻类及真菌等类群,涉及78个目、181个科。为实现代谢物的系统分类与属性表征,采用NPClassifier建立“Pathway-Superclass-Class”三级分类体系,同时结合ADMET-AI模型预测各代谢物的吸收、分布、代谢、排泄及毒性(ADMET)等药代动力学性质,最终构建起全面且标准化的基础数据体系(图1)。

依托人工智能技术,MedMeta数据库具备三大核心功能:其一,通过BioNavi-NP模型对次生代谢物进行逆合成分析,解析得到196,356条潜在生物合成路径,并结合E-zyme预测每条路径中各步反应所需的关键酶,为代谢物合成机制研究提供依据;其二,基于RDKit生成次生代谢物与DrugBank收录化合物的Morgan指纹,通过计算Tanimoto系数量化二者结构相似性,筛选具有潜在成药价值的候选代谢物;其三,利用DeepICER深度学习框架预测代谢物对人类细胞系转录组的扰动效应,同时通过SuperPred 3.0工具预测代谢物的潜在分子靶标,并开展GO功能富集分析及KEGG通路富集分析,揭示代谢物发挥作用的潜在生物学机制(图1)。

9cc7b79592314e53903043b1599d40cc.jpg 

1. MedMeta中数据预处理和人工智能驱动的注释工作流程

为验证MedMeta数据库的实用性与可靠性,以伞形科3个代表性物种(前胡、当归、芹菜)为研究对象,围绕香豆素类代谢物的多样性差异展开分析。结果显示,3个物种中香豆素类代谢物的组成差异(前胡含简单香豆素、呋喃香豆素及吡喃香豆素,当归含简单香豆素与线性呋喃香豆素,芹菜仅含简单香豆素)与关键合成酶(如U8PTOC)及生物合成基因簇(BGCs)的结构差异直接相关,凸显了MedMeta在解析代谢物多样性遗传基础方面的价值(图2)。

356bf9cb1c9a4610bb0bc29e2053abfa.jpg 

2. 前胡、当归和芹菜中香豆素生物合成途径的比较分析

同时,还以当归根中代表性吡喃香豆素类成分紫花前胡醇(decursinol)为例开展了药理学验证。MedMeta平台分析结果显示decursinol与补骨脂素(psoralen)、补骨脂定(psoralidin)结构相似;靶标预测与富集分析显示,decursinol可能通过调控MAPKPI3K/Akt等信号通路作用于MAPK1DUSP3NFKB1RPS6KA1CSNK2B等靶标;分子对接实验证实,decursinol与上述5个靶标具有较强结合能力(图3)。上述结果与已有文献报道的decursinol药理活性及作用机制一致,验证了MedMeta数据库的可靠性。

48b64a71d86c4c23a701f60138f0cae6.jpg 

3. 基于MedMetadecursinol药理学分析

综上,MedMeta通过整合传统药用数据与人工智能工具,为药用物种次生代谢物的研究提供了分析平台,实现了“代谢物—基因—通路—功能”的系统化整合,为解析次生代谢物生物合成途径及其药理学分析提供了数据支撑。

03 基金及平台支持

该研究得到了四川省自然科学基金(2024ZDZX0019)和国家中医药管理局创新团队及人才培养计划(ZYYCXTD-D-202209)项目的资助。成都中医药大学-沐曦集成电路(上海)股份有限公司“中医药人工智能联合实验室”为平台开发提供了硬件和算力支持。


论文链接:https://doi.org/10.1016/j.eng.2025.09.007


终审:创新研究院管理员
【打印正文】
Baidu
map