凤凰新闻观察

让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

你的位置:凤凰新闻观察 > 全球热点 >

ByteDance Research登Nature子刊:AI+冷冻电镜,揭示卵白质动态

发布日期:2024-11-16 04:12    点击次数:115

开端:机器之心Pro

机器之心发布

机器之心剪辑部

2024 年的诺贝尔化学奖颁发给了在结构生物学领域取得紧要设立的 David Baker 团队和 AlphaFold 团队,引发了 AI for science 领域新的参议欢叫。

近两年科学界一个饱受争议的命题是:“AlphaFold 是否闭幕了结构生物学?” 率先,AlphaFold 之类的结构瞻望模子的老师数据恰是来自于以 X 射线、冷冻电镜(cryo-EM)等为代表的传统结构领略才略。其次,冷冻电镜技艺出奇擅长领略卵白质的动态,而这恰是 AlphaFold 所无法作念到的。刚巧的是,冷冻电镜这项技艺于 2017 年也赢得了诺贝尔化学奖。

那么,以 AlphaFold 为代表的 AI 技艺能否接济以 cryo-EM 为代表的传统才略?两个诺奖级技艺的碰撞,大要擦出什么样的火花?

ByteDance Research 建议 AI for Science 模子被 Nature 子刊收录

近日,来自字节向上 ByteDance Research 团队的参议东说念主员建议了 CryoSTAR 才略,得胜将来自原子模子的结构先验应用到冷冻电镜实验数据的动态领略中,为惩处这一问题带来了新的想路和才略。该恶果关连论文 “CryoSTAR: Leveraging Structural Prior and Constraints for Cryo-EM Heterogeneous Reconstruction” 已刊发于 Nature 旗下刊物 Nature Methods,李宜来、周奕、袁璟为共吞并作,顾全全训诫为通信作家。

论文连系:https://www.nature.com/articles/s41592-024-02486-1论文主页:https://bytedance.github.io/cryostar/开源连系:https://github.com/bytedance/cryostar

基于结构先验和照管的动态领略

CryoSTAR 是首个得胜在冷冻电镜实验数据上应用卵白质原子结构模态先验的才略,才略的主要特质有:

汇聚卵白质结构先验学问:CryoSTAR 才略翻新性地诓骗原子模子信息动作结构正则化来惩处冷冻电镜数据中的构象动态问题,这与以往大无数仅从计较机视觉角度处理问题的才略不同。它条目一个运转原子模子动作参考,将其结构信息用于适合地照管模子领略出的构象动态,从而松开搜索空间,幸免造作的领略驱散,达成更好更快的照管。输出两种模态的领略驱散:该才略专有之处在于它能同期输出粗粒度的原子模子和密度图领略驱散,这种多维度的驱散输出有助于参议东说念主员更全面地了解生物分子的结构和动态经由。同期,密度图的输出驱散也不错考证原子模子驱散的置信进度,检修粗粒度原子模子的动态是否大要充分被数据所复旧。

该才略分为两个阶段:

第一阶段通过结构正则化照管的变分自动编码器(VAE)领略数据中的动态构象。CryoSTAR 通过 Encoder,将构象的动态压缩到一个潜在变量中;Decoder 将潜在变量领略成相应的先验粗粒度原子模子的变形来拟合数据。它在三个基本假定下进行基于结构正则化:一是吞并链上的两个相邻残基应耐久保捏团结,通过连气儿耗损函数来照管;二是瞻望变形后残基不应过于围聚,通过冲突耗损函数来处分碰撞;三是局部结构应尽可能刚性,通过从先验原子结构模子构建弹性收集并使用弹性收集耗损函数来饱读动这种刚性,同期还选拔自妥当浮松才略来取舍弹性收聚会的边进行正则化,以幸免参考原子模子带来的过度偏差。第二阶段通过老师一个密度图解码器来得到密度图模态的动态构象领略驱散。在 VAE 老师完成后,索求所有图像对应的潜在变量并用于老师密度图解码器。密度图的细节优化由输入图像照管,不受结构先验和正则化的平直影响,从而最小化结构先验对输出密度图的 bias,使得生成的密度图可用于评估和考证粗粒度原子结构模子。

多种典型卵白数据上的实验考证

图 3 EMPIAR-10180 驱散

图 4 EMPIAR-10073 驱散

大型复合物(残基数目约 10,000)

CryoSTAR 在多个公开数据集(EMPIAR)的冷冻电镜实验数据上得到了考证。关于酵母预催化 B 复合物剪接体(EMPIAR-10180),使用 PDB: 5NRL 动作先验结构,cryoSTAR 得胜揭示了 SF3b 妥协旋酶区域的构象变化,其驱散与其他才略一致,况兼生成的粗粒度模子在电子密度图中得到了充分考证,展现出合理的通顺口头。关于 U4/U6.U5 三核糖核卵白(EMPIAR-10073),以 PDB: 5GAN 为参考结构,cryoSTAR 相同领略了头部结构域的动态变化,驱散与现存才略的发现一致。

图 5 EMPIAR-10059 驱散

图 6 EMPIAR-10827 驱散

膜卵白(氨基酸数目约 2,000)

图 7 CryoSTAR 与 CryoDRGN 在 EMPIAR-10059 上的驱散对比

关于 TRPV1 通说念卵白(EMPIAR-10059),使用 PDB: 7RQW 动作参考先验原子模子,cryoSTAR 发现了卵白外周可溶结构域的机密而平滑的通顺,每个亚基的通顺可通过不同主因素可视化。参议还标明结构正则化在揭示膜卵白能源学方面具相关键作用,比较之下,莫得结构先验的才略如 cryoDRGN 在膜卵白的动态领略方面存在不及。

单链卵白(氨基酸数目约 1,000)

图 8 CryoSTAR 与 CryoDRGN、3DFlex 在 EMPIAR-10059 上的驱散对比

关于 毒素卵白 α-LCT(EMPIAR-10827),cryoSTAR 揭示了两种类型的通顺,与龙套 3D 分类发现的两种构象相吻合,且生成的粗粒度原子模子合理,与密度图拟合精采。结构正则化在这个具有连气儿异质性的小卵白中效果显赫,比较其他才略如 cryoDRGN 和 3DFlex,cryoSTAR 生成的密度图更连气儿,能有用幸免密度图中的伪影。

转头:诓骗跨模态数据领略当然征象

字节向上 ByteDance Research 建议的新的聚集合构先验的才略 (CryoSTAR) 显赫训诲了冷冻电镜(Cryo-EM)在动态构象领略中的应用后劲。通过诓骗原子结构模态先验动作照管,同期输出两种模态的领略驱散,这一翻新才略在技艺上展示了其专有的上风,并为科学参议通达了新的大门。

该参议在冷冻电镜动态领略领域的要紧酷爱不成残酷。传统的冷冻电镜才略由于其永别率妥协析才气的驱散,时常难以捕捉到生物大分子复杂的动态变化。而这次引入结构先验的计策,极地面增强了动态构象领略的精度与可靠性,使咱们大要更真切地贯串生物大分子的动态行径过火机制。

这种才略的潜在价值在人命科学和制药领域尤为杰出。生物大分子的动态领略是贯串其功能机制的要津,如卵白质的折叠、酶活性部位的变化、受体 - 配体的汇聚口头等。这些动态经由与广阔生理与病理征象息息关连,举例细胞信号传导、代谢调控以及疾病发期望制等。因此,准确领略这些动态经由不仅能匡助揭示生物学基本问题,还能为发现新式药物靶点和优化药物筹划提供要紧依据。在制药领域,这一才略相同具有粗俗的应用出息。通过更高精度地捕捉卵白质和其他生物大分子的动态变化,参议东说念主员不错更有用地筛选潜在药物、筹划更具针对性的药物分子,进而提高药物研发的遵守和得胜率。举例,这一才略不错匡助领略癌症、神经退行性疾病等紧要疾病关连卵白质的动态构象变化,为建设新药物提供详备的分子级信息。

一言以蔽之,ByteDance Research 的这一翻新参议不仅代表了冷冻电镜动态领略技艺的最新发扬,更为人命科学和制药领域带来了雄壮的潜在价值。期待曩昔该才略能在更多参议和实质应用中得到考证和实际,为人命科学参议以及药物研发带来新的打破和但愿。

ByteDance Research AI 制药团队捏续在 AI for Science 所在发力

ByteDance Research AI 制药团队戮力于于将东说念主工智能技艺应用于科学参议与药物建设。团队在生成式卵白质筹划、卵白质构象瞻望以及冷冻电镜领略等领域取得了业界真贵标恶果。

卵白质筹划:团队研发了基于大规模卵白质谈话模子的序列筹划才略 LM-Design [1],大幅提高了卵白质序列筹划的准确度与遵守;研发了汇聚扩散模子与谈话模子的新一代卵白质基础模子 DPLM 1/2 [2, 3],初次全面合资了卵白质建模、贯串与生成;研发了基于偏好优化的抗体筹划才略 AbDPO [4],大要筹划出同期满足多种性质和能量条目的抗体。卵白质动态构象瞻望:团队研发了 ConfDiff [5] 等模子,准确瞻望了卵白质的构象变化,加深了对卵白质生物经由的贯串,还为新药研发提供了可靠的表面基础。冷冻电镜领略:团队研发了 CryoSTAR [6] 电镜领略器具,汇聚东说念主工智能技艺和高永别率成像,有助于揭示复杂生物分子体系的构象特征和动态变化;研发了第一个卵白质密度基座模子 CryoFM [7],为下一代电镜领略算法奠定了基础。

团队的参议恶果屡次发表在 Nature 子刊、ICML、NeurIPS、ICLR 等顶级学术会议上,得到学术界和业界的粗俗招供。

参考文件

[1] Zheng Z, Deng Y, Xue D, et al. Structure-informed language models are protein designers [C]//International conference on machine learning. PMLR, 2023: 42317-42338.

[2] Wang X, Zheng Z, Ye F, et al. Diffusion Language Models Are Versatile Protein Learners [C]. International Conference on Machine Learning, 2024.

[3] Wang X, Zheng Z, Ye F, et al. DPLM-2: A Multimodal Diffusion Protein Language Model [J]. arXiv preprint arXiv:2410.13782, 2024.

[4] Zhou X, Xue D, Chen R, et al. Antigen-Specific Antibody Design via Direct Energy-based Preference Optimization [C]. NeurIPS, 2024.

[5] Wang Y, Wang L, Shen Y, et al. Protein Conformation Generation via Force-Guided SE (3) Diffusion Models [C]. International Conference on Machine Learning, 2024.

[6] Li Y, Zhou Y, Yuan J, et al. CryoSTAR: leveraging structural priors and constraints for cryo-EM heterogeneous reconstruction [J]. Nature Methods, 2024: 1-9.

[7] Zhou Y, Li Y, Yuan J, et al. CryoFM: A Flow-based Foundation Model for Cryo-EM Densities. arXiv preprint arXiv:2410.08631, 2024.

文内视频连系:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650942721&idx=2&sn=46e92e291de4b4c2e84653daed604e43&chksm=84e7e97fb39060693788909e87ca5564198a19dede96165c35c3cb15d3f13ad720072bec07af&token=1483518759&lang=zh_CN#rd





Powered by 凤凰新闻观察 @2013-2022 RSS地图 HTML地图

Copyright Powered by365站群 © 2013-2024