跳到主要内容
研究与创新

研究人员使用分子动力学和机器学习来创建“超预测性”的药物发现计算机模型

ERK2抑制剂的分子动力学(MD)模拟,提取下一代化学信息学分析和机器学习的MD描述符。

即时发布

来自北卡罗来纳州立大学的研究人员已经证明,可以集成分子动力学模拟和机器学习技术以创建更准确的计算机预测模型。这些“超预测性”模型可用于快速预测哪些新的化合物可能是有前途的药物候选者。

药物开发是一种昂贵且耗时的过程。为了缩小可能是潜在的药物候选物的化学化合物的数量,科学家利用计算机模型,该计算机模型可以预测特定的化合物如何与感兴趣的生物学靶标相互作用 - 例如,可能涉及疾病过程的关键蛋白质。传统上,这是通过定量结构 - 活性关系(QSAR)建模和分子对接进行的,该分子对接依赖于这些化学品的2-和3-D信息。

Denis Fourches,计算化学助理教授,想要提高这些QSAR模型的准确性。“当您筛选一套3000万种化合物时,您不一定需要与您的型号非常高的可靠性 - 您只是获得关于该虚拟库的前5个或10%的Ballpark的想法。但是,如果您试图将200个类似物的领域缩小到10到10个,那么通常是药物开发的情况,您的建模技术必须非常准确。目前的技术绝对不够可靠。“

生物信息学的研究生茶叶和杰里米灰决定纳入分子动力学计算的结果 - 所有特定化合物如何在蛋白质的结合口袋中移动到基于机器学习的预测模型。

“大多数模型仅使用分子的二维结构,”Fourches说。“但实际上,化学品是复杂的三维物体,移动,振动并具有与蛋白质的动态分子间相互作用,一旦在其结合位点停靠。如果你只是看一下给定分子的2-D或3-D结构,你看不出。“

在概念验证研究中,Fourches和Ash看了ERK2激酶 - 一种与若干类型的癌症相关的酶 - 以及一组87名已知的ERK2抑制剂,从非常活跃到无活性。它们为每个87个化合物中的每一个进行独立的分子动力学(MD)模拟,并在ERK2口袋中计算了关于每个化合物的灵活性的关键信息。然后,他们使用化学信息技术技术和机器学习分析了MD描述符。MD描述符能够精确地区分活性ERK2抑制剂免于弱活性和零症,这不是模型仅使用2-D和3-D结构信息的情况。

“我们已经有关于这87个分子及其在ERK2的活动的数据,”Fourches说。“所以我们测试了看我们的模型是否能够可靠地找到最活跃的化合物。实际上,它准确地区分了强且弱的ERK2抑制剂,因为MD描述符编码了在ERK2的口袋中产生的相互作用,因此它还让我们更有了解强抑制剂的适用。

“在计算前进之前,我们允许我们模拟这种数据,它会使我们六个月来模拟ERK2的口袋里的一个分子。由于GPU加速,现在只需要三个小时。这是一个游戏更换者。我希望将从分子动力学提取的数据纳入QSAR模型,使新一代超预测模型将有助于将新颖,有效药物带到市场上甚至更快。这是人工智能为我们发现明天的毒品。“

这项工作出现在化学信息与建模。Ash是本文的第一个作者,由NIEHS补助金提供资金(T32ES007329)。其他资金由NC州校长的卓越阶级计划提供。

-peack-

编辑的注释:纸上的摘要跟随。

“用分子动力学轨迹计算的描述符”表征ERK2激酶抑制剂的化学空间“

DOI:10.1021 / ACS.JCIM.7B00048

作者Jeremy Ash,Denis Fourches,北卡罗来纳州立大学
发布:化学信息和建模杂志

抽象的:
定量结构 - 活动关系(QSAR)模型通常依赖于2D和3D分子描述符,以表征化学品并预测其实验活动。以前,我们表明,即使是最可靠的2D QSAR模型和基于结构的3D分子对接技术也不能精确地排序ERK2激酶的一组已知抑制剂,各种类型的癌症中的关键球员。在此,我们计算并分析了由ERK2-配体复合物的分子动力学(MD)轨迹计算的一系列化学描述符。首先,使用Schrodinger的Glide软件完成了具有已知结合亲和力的87个ERK2配体的对接;然后,使用GPU加速的Desmond程序执行溶剂显式MD仿真(20ns,npt,300k,tip3p,1fs)。其次,我们计算了基于用于在MD模拟上计算的LigAnd的代表性样本的3D描述符的分布的MD描述符。第三,我们在MD化学描述符空间中分析了87个抑制剂的数据集。我们展示了MD描述符(一世)与传统使用的2D / 3D描述符几乎没有相关,(ii)能够将最活跃的ERK2抑制剂与中等/弱的活性和助剂区分开来,(iii)提供有关活性配体独特特征的关键和互补信息。该研究代表了利用MD提取的化学描述符的最大尝试表征和模拟一系列生物活性分子。MD描述符可以实现下一代超级预测性MD-QSAR模型,用于计算机辅助优化和模拟优先级。

留下回应

您的电子邮件地址不会被公开。各个领域都需要。