时长:
9分钟
播放:
104
发布:
3个月前
主播...
简介...
播客Show Notes
本期主题
AlphaFold如何用AI破解蛋白质折叠难题?——约翰·詹珀带你看AI for Science的现在与未来
核心嘉宾
约翰·詹珀(John Jumper):AI for Science领域顶尖科学家,谷歌DeepMind核心成员,AlphaFold关键开发者。曾跨界物理学、计算生物学、生物物理学等领域,始终以"用AI加速科学发现"为目标。
内容概览
一、从物理学家到AI科学家:约翰·詹珀的跨界之路
- 职业转折:从物理学博士退学,进入计算生物学公司,发现"用技术解决实际问题(如药物研发)"的价值;
- 关键转型:因缺乏计算资源,转向统计学与机器学习(早期称"统计物理学"),后加入DeepMind,结合顶尖资源与团队推动科学突破;
- 信念:工具的终极意义是"让科学家实现更多发现"——AlphaFold已被引用3.5万次,助力疫苗、药物开发等领域,正是这一信念的印证。
二、蛋白质折叠:为什么它是"生物学世纪难题"?
- 蛋白质的核心作用:人体约2万种蛋白质是"纳米机器",负责细胞几乎所有功能(如运动、催化反应),其功能由三维结构决定;
- 折叠的关键:DNA指导蛋白质"线性组装"后,会自发折叠成三维结构——理解这一结构才能预测疾病、开发药物(药物常通过阻断蛋白质功能起效);
- 实验测定的痛点:需让蛋白质形成晶体(可能耗时1年以上,失败率极高),再用X射线解析,过程耗时1-2年、花费约10万美元;
数据鸿沟:已知蛋白质结构仅20万(年增1.2万),但蛋白质序列已发现数十亿,增速是结构的3000倍。
三、AlphaFold的诞生:AI如何破解这一难题?
- 核心目标:从蛋白质序列(线性指令)直接预测三维结构,填补"序列-结构"数据鸿沟;
- 三大核心支撑(数据、计算、研究):数据:基于公开的20万蛋白质结构(来自蛋白质数据库PDB),"人人都能获取";
计算:最终模型用128个TPU V3核心运行两周(非大规模语言模型级别,属学术可及范围);
研究(最关键):小团队提出全新机器学习方法,将Transformer思想与实验、"中等规模思想"结合,而非单一技术突破(如AlphaFold 2用1%数据就能超越前代SOTA系统); - 验证:通过CASP盲测(预测未发表结构),误差仅为其他团队的1/3,证明真实有效性。
四、AlphaFold的"破圈":从技术突破到改变科学
- 开放性是关键:代码开源+预测数据库(从30万扩展到2亿,覆盖已测序生物蛋白质);
信任建立:数据库让普通生物学家直接对比"预测与未发表结构",通过"证据的社会性"口耳相传; - 实际影响:加速实验:帮科学家节省数月甚至数年时间(如解决"一年无法纯化的蛋白质"预测);
催生新发现:《科学》杂志核孔复合体特刊3/4论文依赖它,助力靶向药物递送(如小鼠大脑细胞精准注射)、受精机制研究等;
涌现新能力:用户意外发现其可预测蛋白质相互作用("蛋白质提示工程")。
五、未来:AI for Science会有多"通用"?
- 核心逻辑:从零散数据(如蛋白质结构)训练通用模型,理解规律后填补空白,成为"实验家的放大器";
- 展望:AlphaFold是"基础模型"的开端,未来AI for Science不会局限于狭窄领域,将发展为广泛系统,持续解锁更多科学发现。
关键金句
- "工具的意义不是替代科学家,而是让他们能做我永远做不到的研究。"
- "AI的突破很少来自单一'革命性思想',更多是'中等规模思想'的累积。"
- "科学的进步不仅需要技术,更需要让技术'被信任、被使用'的开放性。"
适合听众
对AI、生物学、科学创新感兴趣者;关注"技术如何改变科研"的研究者、学生;想了解AlphaFold背后故事的科普爱好者。
评价...
空空如也
小宇宙热门评论...
暂无小宇宙热门评论