【创新前沿】《核酸研究》报道我校化合物ADMET性质综合评估平台admetSAR3.0

时间:2024年07月09日访问次数:24

近日,我校药学院唐赟教授课题组发布了全面升级的化合物ADMET性质综合评估平台admetSAR3.0,该平台能够为化合物ADMET数据搜索、性质预测和优化提供一站式服务,用户可通过如下链接免费使用该平台:http://lmmd.ecust.edu.cn/admetsar3/。相关研究成果以“admetSAR3.0: a comprehensive platform for exploration, prediction and optimization of chemical ADMET properties”为题,发表于国际著名期刊《核酸研究》(Nucleic Acids Research,IF=16.6)。

化合物ADMET性质,即化合物在体内的吸收、分布、代谢、排泄及毒性性质,在药物发现和化学品安全性评估中发挥着至关重要的作用。不良ADMET性质是导致药物研发失败的主要原因之一,也是化学品安全性评估的重点。唐赟教授课题组长期致力于人工智能赋能的化合物ADMET性质预测和优化研究,早在2012年,就在国际上率先推出了名为admetSAR的在线服务平台(http://lmmd.ecust.edu.cn/admetsar1/),收录了近96000个化合物的21万余条高质量实验数据,并采用机器学习方法构建了27个预测模型,受到国内外用户的广泛使用和好评。相关成果发表在美国化学会著名期刊J. Chem. Inf. Model. 2012, 52: 3099-3105,已被引用1400次。2019年升级到admetSAR2.0(http://lmmd.ecust.edu.cn/admetsar2/),模型数量增加到47个,并增加了基于骨架跃迁的性质优化模块ADMETopt,已完成用户提交任务85万次,相关成果发表在国际著名期刊Binformatics 2019, 35: 1067-1069,已被引用700次。为了进一步提高模型预测质量,以满足广大科研人员的研究需求,唐赟教授课题组最近对admetSAR在线服务平台进行了全面改版更新,升级到了3.0版本。全面升级的admetSAR3.0具有更综合的评估模块,更广泛的端点覆盖,更高效的预测框架,以及更友好的用户界面(图1)。

图1. admetSAR3.0的四大更新

更综合的评估模块:admetSAR3.0呈现了综合的ADMET性质评估模块,支持ADMET性质搜索、预测和优化三大功能,一站式服务便利用户开展ADMET性质评估研究。在搜索功能中,支持基于结构的相似性搜索,为交叉参照研究提供便利;在预测功能中,以高效的CLMGraph框架作为后端预测支持,提供更为快速的服务;在优化功能中,支持基于骨架跃迁和转化规则的性质优化,为不理想性质改造提供支持。在应用方面,admetSAR3.0侧重关注药物研发、环境风险评估和化妆品风险评估三大领域。

更广泛的端点覆盖:admetSAR3.0平台收录了超过10万个化合物的37万余条实验数据,并构建了多达119个ADMET性质端点的预测模型,包括18个基本性质端点、39个药代动力学性质端点、43个人体健康相关毒性端点、16个环境风险评估端点和9个化妆品风险评估端点。admetSAR3.0相较于其前代在化合物数量、数据记录和端点覆盖上分别有9.01%、78.08%和108.77%的提升。

更高效的预测服务:admetSAR3.0采用了一种基于对比学习预训练的多任务图神经网络(CLMGraph)框架,为ADMET性质预测提供鲁棒、可靠且快速的评估支持。admetSAR3.0中支持的90个分类端点的平均AUC值为0.87,且超过82%回归端点的相关系数R2为0.70以上。同时,运算速度非常快,admetSAR3.0进行1000个化合物的119个ADMET性质评估仅需约12秒钟,极大地提高了研究效率。

更友好的用户界面:admetSAR3.0为用户提供了便利的数据输入输出、清晰明了的结果呈现以及实用的使用说明。admetSAR3.0提高了输入数据的兼容性,可接受多种类型的输入格式,如SMILES式、绘制的化学结构和批量分子文件,并提供多种输出格式,包括数值数据、图形显示和可下载的结果文件。对于各端点的简介,用户只需将鼠标悬停于页面的问号或方框上,即可获得交互式的上下文帮助。

研究者还将admetSAR3.0与现有同类型的优秀在线服务平台进行了全面比较,结果显示admetSAR3.0具有ADMET端点覆盖广、功能综合及运算效率高等优势(表1)。

表1. admetSAR3.0与其他在线服务平台比较

我校药学院博士生顾雅馨、俞卓杭和汪祎梦为论文的共同第一作者(分别承担数据收集整理、网站框架构建和预测算法开发工作),唐赟教授为论文的通讯作者。本研究得到了国家重点研发计划和国家自然科学基金等项目的支持。

论文链接:https://academic.oup.com/nar/article/52/W1/W432/7655777或者https://doi.org/10.1093/nar/gkae298