图3. 随着虚拟化合物库规模的增加,假阳性分子数量增加。a,前N(N = 100,1,000,10,000和100,000)对接分子中假阳性分子百分比的热图。左边两列的假阳性分子是从极值分布中取样的,右边两列的假阳性分子是从均匀分布中取样的。b,两种策略中选择的100个分子中假阳性分子的百分比。第一种策略(黑色柱状图)是只选择排名前100个分子,第二种策略(灰色柱状图)是从5个排名范围中均匀随机地选择100个分子。五个排名范围分别是前1-100名,前101-1,000名,前1,001-10,000名,前10,001-100,000名和前100,001-1,000,000名。从每个排名范围中随机抽取20个分子,重复进行了20次。图片来源:
Nat. Chem. Biol.
随着化合物库规模的增加,罕见事件(欺骗分子对接打分函数并排名极为靠前的假阳性分子(artifacts))发生的次数也会增加。虽然导致这些假阳性分子的原因可能因靶点而异,但对它们出现的预期是一致的。所以本文作者通过数学建模的方式抽象模拟了假阳性分子随化合物库规模的变化,随着化合物库规模的增长,越来越多的假阳性分子挤占了高排名的位置(图3a)。文中还提出,通过分段式选取测试分子的方式来取代传统仅测试一系列最高排名分子的策略以降低实验测试集中出现假阳性分子的概率(图3b)。
综上所述,
在合理控制随化合物库规模增加而增加的假阳性分子的情况下,虚拟化合物库的急速扩张可以帮助更快找到更加适配靶标的配体分子,这将推动发现更多具有成药价值的小分子。
所以,在药物研发中,虚拟化合物库越大越好。
来自不列颠哥伦比亚大学的Artem Chekasov教授在同期的
Nature Chemical Biology
撰写了名为“The ‘Big Bang’ of the chemical universe”的评论文章对该文章给予高度评价。“本文提供了不少关于药物发现中使用超大化学库的实用且重要的见解”。
[14]
该论文第一作者是吕剑昆(Jiankun Lyu)博士,现为洛克菲勒大学助理教授并创立了计算分子发现实验室,实验室研究方向是超大规模虚拟筛技术的研发和应用。课题组组长近年来在
Nature、Science、Cell、Nature Chemical Biology、Nature Protocols
等期刊上发表多篇论文。欢迎具备编程能力并且具有理论计算化学、化学信息学、计算生物学,生物物理、结构生物学等相关专业背景的博士后和研究助理加盟。更多详情参见实验室网站https://lyulab.org。洛克菲勒大学是一所世界著名的生物医学教育研究中心,拥有26位科学家获得诺贝尔奖,坐落于纽约市曼哈顿上东区。申请者请提供简历、一页cover letter及推荐人信息到jlyu(at)rockefeller.edu(邮件地址请将(at)替换为@)。
原文(扫描或长按二维码,识别后直达原文页面):Modeling the expansion of virtual screening librariesJiankun Lyu, John J. Irwin & Brian K. Shoichet Nat. Chem. Biol
.,
2023
, DOI: 10.1038/s41589-022-01234-w
参考文献:
1 Bohacek, R. S., McMartin, C. & Guida, W. C. The art and practice of structure‐based drug design: A molecular modeling perspective.
Medicinal Research Reviews16
, 3-50, doi:doi:10.1002/(SICI)1098-1128(199601)16:1<3::AID-MED1>3.0.CO;2-6 (1996).
2 Ertl, P. Cheminformatics Analysis of Organic Substituents: Identification of the Most Common Substituents, Calculation of Substituent Properties, and Automatic Identification of Drug-like Bioisosteric Groups.
Journal of Chemical Information and Computer Sciences43
, 374-380, doi:10.1021/ci0255782 (2003).
3 Fink, T., Bruggesser, H. & Reymond, J. L. Virtual Exploration of the Small‐Molecule Chemical Universe below 160 Daltons.
Angewandte Chemie International Edition44
, 1504-1508, doi:doi:10.1002/anie.200462457 (2005).
4 Reymond, J.-L. The chemical space project.
Accounts of Chemical Research48
, 722-730 (2015).
5 Chevillard, F. & Kolb, P. SCUBIDOO: a large yet screenable and easily searchable database of computationally created chemical compounds optimized toward high likelihood of synthetic tractability.
Journal of Chemical Information and Modeling55
, 1824-1835 (2015).
6 Keserü, G. M. & Makara, G. M. The influence of lead discovery strategies on the properties of drug candidates.
Nature Reviews Drug Discovery8
, 203, DOI: 10.1038/nrd2796 (2009).
7 Stein, R. M. et al. Virtual discovery of melatonin receptor ligands to modulate circadian rhythms.
Nature579
, 609-614 (2020).
8 Gorgulla, C. et al. An open-source drug discovery platform enables ultra-large virtual screens.
Nature580
, 663-668 (2020).
9 Alon, A. et al. Structures of the
σ
2
receptor enable docking for bioactive ligand discovery.
Nature600
, 759-764 (2021).
10 Sadybekov, A. A. et al. Synthon-based ligand discovery in virtual libraries of over 11 billion compounds.
Nature601
, 452-459 (2022).
11 Fink, E. A. et al. Structure-based discovery of nonopioid analgesics acting through the α2A-adrenergic receptor.
Science377
, eabn7065 (2022).
12 Hert, J., Irwin, J. J., Laggner, C., Keiser, M. J. & Shoichet, B. K. Quantifying biogenic bias in screening libraries.
Nature Chemical Biology5
, 479-483 (2009).
13 Koehn, F. E. & Carter, G. T. The evolving role of natural products in drug discovery.
Nat. Rev. Drug Discovery4
, 206-220 (2005).
14 Cherkasov, A. The ‘Big Bang’ of the chemical universe.
Nature Chemical Biology
, 2023, DOI: 10.1038/s41589-022-01233-x
点击“阅读原文”,查看 化学 • 材料 领域所有收录期刊