文 | 钱钱
编辑 | 阿景
清华大学张数一团队最近搞出了个大动静,不是发了篇普通论文,是直接给蛋白质工程来了场“技术双杀”。
一边是能把蛋白质序列空间压缩10^48倍的EvoAI,另一边是24小时不停工的iAutoEvoLab全自动进化工厂。
这俩技术搭伙,愣是把过去“大海捞针”式的蛋白质设计,变成了能“按图施工”的精细活。
从“望远镜扫描”到“锚点导航”,EvoAI破解蛋白质序列的浩瀚迷宫
以前搞蛋白质工程的研究员,怕是最有体会那种无力感。
你想设计个有特定功能的蛋白质,光理论上的序列组合就有10^50种,这数字啥概念?把全宇宙的原子都拿来当“零件”,都凑不齐这么多组合。
传统方法要么像用望远镜在星空里瞎扫,要么靠零碎数据猜,效率低得让人着急。
张数一团队琢磨着,这事儿不能这么干。
他们想,既然图片能压缩,保留几个关键像素点照样看得清,蛋白质功能是不是也能这么玩?于是EvoAI的“锚点理论”就这么来了甭管序列多复杂,抓住那些真正管功能的“核心锚点”就行。
这些锚点就像地图上的关键路标,有了它们,不用走遍每个角落也能摸清蛋白质的“功能脾气”。
为了找到这些锚点,团队搭了个叫EvoScan的实验平台。
用噬菌体当“运输车”装蛋白质基因,CRISPR当“手术刀”精准改序列,再设计个基因回路,让蛋白质功能好坏直接和噬菌体“生死”挂钩。
功能好的噬菌体就能活下来,差的直接淘汰。
这套组合拳打下去,锚点找得又快又准。
最让人服气的是几个验证实验。
绿色荧光蛋白纳米抗体功能丢了,靠EvoAI找的锚点突变,居然真给恢复了,研究新冠主蛋白酶耐药位点,不仅找到了已知的,还新发现一批藏在蛋白各个角落的“耐药钉子户”,就连AmeR转录因子,抓了82个锚点让AI设计,10个新变体活性直接涨了10到38倍,而传统模型设计的全不行。
AmeR这事儿最能说明问题。
它的序列空间理论上有10^50种可能,EvoAI愣是靠82个锚点就把功能摸透了,等于把探索范围压缩了10^48倍。
这可不是简单偷懒,是真的证明了蛋白质功能景观“能被压缩”抓对重点,就能跳出“全序列扫描”的死胡同。
从“手工传代”到“无人工厂”,iAutoEvoLab让蛋白质进化“自动化”
蛋白质进化不光设计难,搞进化实验也是个苦差事。
传统定向进化全靠人手动操作,传代、筛选、记录,通量低不说,还容易出错。
遇到那种初始活性几乎为零的蛋白质,比如CapT7融合蛋白,传统方法简直无从下手,就像让新手直接上手造火箭,根本启动不了。
张数一团队干脆一步到位,造了个iAutoEvoLab全自动进化工厂。
硬件上,液体处理工作站精准配溶液、传样品,机械臂跑来跑去转运培养板,恒温培养箱、生长检测仪、冰箱各司其职。
软件上,MegaFluent控制系统当“大脑”,自己编排流程、分析数据,每个实验孔都能独立控制。
再加上层流罩保证无菌,这工厂能一口气跑数周甚至数月不中断。
核心是那个叫OrthoRep的进化引擎。
把目标蛋白功能和酵母“生死”绑在一起,蛋白功能好了,酵母的选择标记基因就表达强,长得好,功能差,酵母就被淘汰。
等于给蛋白质上了“生存压力”,不用人管,它们自己就会为了活下去而“主动进化”。
拿CapT7融合蛋白测试时,这工厂真露了一手。
这蛋白初始活性基本为零,目标是实现基因转录和mRNA加帽“二合一”,以后能用在mRNA疫苗生产上。
工厂25天连轴转,同时管着上百条进化线路,自己调整抗生素浓度和菌液稀释比例。
最后搞出个CapT7-V14变体,在酵母里驱动基因表达的能力,比一开始强了30倍还多。
期刊编辑看完都说,这平台以后肯定能在蛋白质工程产业里大显身手。
张数一团队也想得明白,他们就是想做个通用工具,让大家都能用,顺便把行业数据标准也统一了。
以前搞蛋白质工程像“手工作坊”,以后说不定就能像“标准化工厂”一样批量生产功能蛋白。
这俩技术凑一起才是真厉害。
iAutoEvoLab不停进化出数据,喂给EvoAI当“训练素材”,EvoAI学好了就反过来自告奋勇设计进化路线。
AI预测+实验验证,形成个闭环,蛋白质进化就从“瞎猫碰死耗子”变成了“按剧本演戏”,真正实现“可编程”。
现在蛋白质工程算是摸到了“数据科学”的门。
以前靠经验瞎试,现在有AI看“功能地图”,有全自动工厂跑实验。
不管是mRNA疫苗生产、抗病毒药物开发,还是合成生物学需要的各种酶和抗体,以后都可能靠这套技术加速搞出来。
张数一团队这波操作,不光是发了两篇论文,更像是给蛋白质工程开了个“智能时代”的头。
上一篇:宁夏乡野 “满格信号”已成标配