基于人工智能的蛋白质设计精选
这是一个关于基于人工智能的蛋白质设计的研究论文集。 该仓库将持续更新,以跟踪基于人工智能的蛋白质设计的前沿进展。
欢迎关注和点赞!
目录
蛋白质设计概述
人工智能工具已经解决了蛋白质结构预测问题。这个问题从氨基酸序列推导出空间结构,并达到了原子级别的预测精度,例如AlphaFold 2。它结合了之前的蛋白质结构预测模型,自动学习蛋白质设计方法,从而真正服务于人类的制药需求。
蛋白质设计的具体实践方式多种多样,适用于不同设计过程的问题定义也大不相同。以下是一些例子:
- 从空间结构预测氨基酸序列的问题(Alphafold的逆问题),这假设可以通过分子动力学模拟等方法推导出所需蛋白质的空间结构。
- 对给定部分结构的蛋白质结构完成问题,如著名的David Baker团队最近在Science上发表的论文[1]。这假设只能找到部分结构匹配。
- 将拟合的能量函数与MD模拟相结合进行蛋白质设计,如中国刘海燕团队最近在Nature上发表的论文[2]。
此外,许多方法可用于蛋白质设计,相应的人工智能问题定义也大不相同。本文列出了一些基于人工智能的蛋白质设计的高水平文章,未来将持续更新。
论文
格式:
- [标题](论文链接) [链接]
- 作者1、作者2和作者3...
- 发表方
- 关键词
Nature
-
- Josh Abramson、Jonas Adler、Jack Dunger、Richard Evans、Tim Green、Alexander Pritzel、Olaf Ronneberger、Lindsay Willmore、Andrew J. Ballard、Joshua Bambrick、Sebastian W. Bodenstein、David A. Evans、Chia-Chun Hung、Michael O'Neill、David Reiman、Kathryn Tunyasuvunakool、Zachary Wu、Akvilė Žemgulytė、Eirini Arvaniti、Charles Beattie、Ottavia Bertolli、Alex Bridgland、Alexey Cherepanov、Miles Congreve、Alexander I. Cowen-Rivers、Andrew Cowie、Michael Figurnov、Fabian B. Fuchs、Hannah Gladman、Rishub Jain、Yousuf A. Khan、Caroline M. R. Low、Kuba Perlin、Anna Potapenko、Pascal Savy、Sukhdeep Singh、Adrian Stecula、Ashok Thillaisundaram、Catherine Tong、Sergei Yakneen、Ellen D. Zhong、Michal Zielinski、Augustin Žídek、Victor Bapst、Pushmeet Kohli、Max Jaderberg、Demis Hassabis 和 John M. Jumper
- 关键词:基于扩散的架构、蛋白质结构建模、生物分子空间建模
-
- B Huang、Y Xu、X Hu、Y Liu、S Liao、J Zhang、C Huang
- 关键词:能量函数、MD模拟、以骨架为中心
-
- Ivan Anishchenko、Samuel J. Pellock、Tamuka M. Chidyausiku、Theresa A. Ramelot、Sergey Ovchinnikov、Jingzhou Hao、Khushboo Bafna、Christoffer Norn、Alex Kang、Asim K. Bera、Frank DiMaio、Lauren Carter、Cameron M. Chow、Gaetano T. Montelione 和 David Baker
- 关键词:幻觉、修复、蛋白质设计
-
- Longxing Cao、Brian Coventry、Inna Goreshnik、Buwei Huang、William Sheffler、Joon Sung Park、Kevin M. Jude、Iva Marković、Rameshwar U. Kadam、Koen H. G. Verschueren、Kenneth Verstraete、Scott Thomas Russell Walsh、Nathaniel Bennett、Ashish Phal、Aerin Yang、Lisa Kozodoy、Michelle DeWitt、Lora Picton、Lauren Miller、Eva-Maria Strauch、Nicholas D. DeBouver、Allison Pires、Asim K. Bera、Samer Halabiya、Bradley Hammerson、Wei Yang、Steffen Bernard、Lance Stewart、Ian A. Wilson、Hannele Ruohola-Baker、Joseph Schlessinger、Sangwon Lee、Savvas N. Savvides、K. Christopher Garcia 和 David Baker
- 关键词:结合位点
Nature Biomedical Engineering
- 通过深度生成模型和分子动力学模拟加速抗菌剂的发现
- Payel Das、Tom Sercu、Kahini Wadhawan、Inkit Padhi、Sebastian Gehrmann、Flaviu Cipcigan、Vijil Chenthamarakshan、Hendrik Strobelt、Cicero dos Santos、Pin-Yu Chen、Yi Yan Yang、Jeremy P. K. Tan、James Hedrick、Jason Crain 和 Aleksandra Mojsilovic
- 关键词:抗菌剂、生成自编码器、分子动力学
Nature Communications
-
- Lorillee Tallorin、JiaLei Wang、Woojoo E. Kim、Swagat Sahu、Nicolas M. Kosa、Pu Yang、Matthew Thompson、Michael K. Gilson、Peter I. Frazier、Michael D. Burkart 和 Nathan C. Gianneschi
- 关键词:酶设计、机器学习
-
- Yunan Luo, Guangde Jiang, Tianhao Yu, Yang Liu, Lam Vo, Hantian Ding, Yufeng Su, Wesley Wei Qian, Huimin Zhao & Jian Peng
- 关键词:功能适应性、进化
-
- Jung-Eun Shin, Adam J. Riesselman, Aaron W. Kollasch, Conor McMahon, Elana Simon, Chris Sander, Aashish Manglik, Andrew C. Kruse & Debora S. Marks
- 关键词:自回归生成模型、蛋白质设计
-
- Namrata Anand, Raphael Eguchi, Irimpan I. Mathews, Carla P. Perez, Alexander Derry, Russ B. Altman & Po-Ssu Huang
- 关键词:蛋白质设计、能量函数、深度神经网络
-
- Jung-Eun Shin, Adam J. Riesselman, Aaron W. Kollasch, Conor McMahon, Elana Simon, Chris Sander, Aashish Manglik, Andrew C. Kruse & Debora S. Marks
- 关键词:自回归生成模型、蛋白质设计
Nature Machine Intelligence
-
- Jannis Born & Matteo Manica
- 关键词:分子语言建模、回归、转换器
-
- Noelia Ferruz & Birte Höcker
- 关键词:语言模型、可控、综述
Science
-
- J. Dauparas, I. Anishchenko, N. Bennett, H. Bai, R. J. Ragotte, L. F. Milles, B. I. M. Wicky, A. Courbet, R. J. de Haas, N. Bethel, P. J. Y. Leung, T. F. Huddy, S. Pellock, D. Tischer, F. Chan, B. Koepnick, H. Nguyen, A. Kang, B. Sankaran, A. K. Bera, N. P. King, D. Baker
- 关键词:语言模型、结构预测
-
- Jue Wang, Sidney Lisanza, David Juergens, Doug Tischer, Joseph L. Watson, Karla M. Castro, Robert Ragotte, Amijai Saragovi, Lukas F. Milles, Minkyung Baek, Ivan Anishchenko, Wei Yang, Derrick R. Hicks, Marc Expòsit, Thomas Schlichthaerle, Jung-Ho Chun, Justas Dauparas, Nathaniel Bennett, Basile I. M. Wicky, Andrew Muenks, Frank DiMaio, Bruno Correia, Sergey Ovchinnikov, David Baker
- 关键词:功能位点、深度学习、幻觉、修复
ICML、ICLR或NeurIPS
-
- Ziqi Gao, Tao Feng, Jiaxuan You, Chenyi Zi, Yan Zhou, Chen Zhang, Jia Li
- 关键词:蛋白质复合物结构预测、对接路径预测、策略网络、强化学习
-
BERTology遇上生物学:解释蛋白质语言模型中的注意力机制
- Jesse Vig, Ali Madani, Lav R. Varshney, Caiming Xiong, Richard Socher, Nazneen Fatema Rajani
- 关键词:语言模型、转换器、结构和功能特性
-
- Xiangzhe Kong, Wenbing Huang, Yang Liu
- 关键词:抗体设计、图转换
-
- David Brookes, Hahnbeom Park, Jennifer Listgarten
- 关键词:自适应采样、蛋白质设计
-
- Zeming Lin, Tom Sercu, Yann LeCun
- 关键词:多样性、生成模型、蛋白质设计
-
- Zander Harteveld, Joshua Southern, Michaël Defferrard, Andreas Loukas, Pierre Vandergheynst, Micheal Bronstein, Bruno Correia
- 关键词:变分自编码器、拓扑特征、锐化
-
Fold2Seq:用于蛋白质设计的联合序列(1D)-折叠(3D)嵌入生成模型
- Yue Cao, Payel Das, Vijil Chenthamarakshan, Pin-Yu Chen, Igor Melnyk, Yang Shen
- 关键词:生成模型、蛋白质设计
-
- Namrata Anand, Possu Huang
- 关键词:生成模型、蛋白质设计
-
- John Ingraham, Vikas Garg, Regina Barzilay, Tommi Jaakkola
- 关键词:生成模型、蛋白质设计
-
- XChristof Angermueller, David Dohan, David Belanger, Ramya Deshpande, Kevin Murphy, Lucy Colwell
- 关键词:强化学习、序列设计
-
- Zaixi Zhang, Yaosen Min, Shuxin Zheng, Qi Liu
- 关键词:目标蛋白,结构基序,逐片段生成
-
- Zuobai Zhang, Minghao Xu, Arian Jamasb, Vijil Chenthamarakshan, Aurelie Lozano, Payel Das, Jian Tang
- 关键词:药物发现,药物设计,新分子结构生成模型
Arxiv 或 bioRxiv
-
- Sarah Alamdari, Nitya Thakkar, Rianne van den Berg, Alex Xijie Lu, Nicolo Fusi, Ava Pardis Amini, Kevin K Yang
- 关键词:扩散模型,深度生成模型,蛋白质生成,框架,序列设计
-
- Brian Hie, Salvatore Candido, Zeming Lin, Ori Kabeli, Roshan Rao, Nikita Smetanin, Tom Sercu, Alexander Rives
- 关键词:ESMFold,语言模型,基于能量
-
通过整合结构预测网络和扩散生成模型实现广泛适用且准确的蛋白质设计
- Joseph L. Watson, David Juergens, Nathaniel R. Bennett, Brian L. Trippe, Jason Yim, Helen E. Eisenach, Woody Ahern, Andrew J. Borst, Robert J. Ragotte, Lukas F. Milles, Basile I. M. Wicky, Nikita Hanikel, Samuel J. Pellock, Alexis Courbet, William Sheffler, Jue Wang, Preetham Venkatesh, Isaac Sappington, Susana Vázquez Torres, Anna Lauko, Valentin De Bortoli, Emile Mathieu, Regina Barzilay, Tommi S. Jaakkola, Frank DiMaio, Minkyung Baek, David Baker
- 关键词:扩散,通用深度学习框架,从头设计结合蛋白
-
- Vladimir Gligorijević, Daniel Berenberg, Stephen Ra, Simon Kelow, Kyunghyun Cho
- 关键词:序列降噪自编码器,深度流形采样
-
- Robert Verkuil, Ori Kabeli, Yilun Du, Basile I. M. Wicky, Lukas F. Milles, Justas Dauparas, David Baker, Sergey Ovchinnikov, Tom Sercu, Alexander Rives
- 关键词:ESMFold,语言模型,固定骨架设计
-
- Zeming Lin, Halil Akin, Roshan Rao, Brian Hie, Zhongkai Zhu, Wenting Lu, Allan dos Santos Costa, Maryam Fazel-Zarandi, Tom Sercu, Sal Candido, Alexander Rives
- 关键词:结构预测,语言模型
-
TERMinator:使用三级重复基序的基于结构的蛋白质设计神经网络框架
- Alex J. Li, Vikram Sundar, Gevorg Grigoryan, Amy E. Keating
- 关键词:蛋白质设计,三级基序
-
- Robert Verkuil, Ori Kabeli, Yilun Du, Basile I. M. Wicky, Lukas F. Milles, Justas Dauparas, David Baker, Sergey Ovchinnikov, Tom Sercu, Alexander Rives
- 关键词:语言模型,蛋白质设计
其他
-
- Alexey Strokach, David Becerra, Carles Corbi-Verge, Albert Perez-Riba, Philip M.Kim
- 关键词:蛋白质设计,图神经网络
-
- Jung-Eun Shin, Adam J. Riesselman, Aaron W. Kollasch, Conor McMahon, Elana Simon, Chris Sander, Aashish Manglik, Andrew C. Kruse & Debora S. Marks
- 关键词:变体预测,蛋白质设计,自回归生成模型
参考文献
[1] Wang, Jue, et al. "使用深度学习搭建蛋白质功能位点"。Science 377.6604 (2022): 387-394.
[2] Huang, Bin, et al. "用于蛋白质设计的以骨架为中心的神经网络能量函数"。Nature 602.7897 (2022): 523-528.
贡献
我们的目标是使这个仓库变得更好。如果您有兴趣贡献,请参考这里的贡献指南。
许可证
基于人工智能的蛋白质设计精选集在 Apache 2.0 许可下发布。