用MoE打造DNA基础模型更强范式!人大实现seq2func全新突破
创始人
2025-07-11 15:41:10
0

新智元报道

编辑:LRST

【新智元导读】中国人民大学高瓴人工智能学院的研究团队提出通过创新模型架构来提升性能,其SPACE模型引入新架构,提升了DNA基础模型的性能与泛化能力,在多项测试中表现优异。

Sequence-to-function模型是一类强大的基因组模型,能够直接从DNA序列预测对应的功能特征,如染色质开放性、基因表达量、DNA剪切位点等。其中最具代表性的工作是2021年发表在Nature Methods的Enformer[1]。

近日,谷歌DeepMind发布的AlphaGenome[2]模型取得了重要突破,将前身Enformer的输入序列长度扩展至1Mb,引入了剪切强度、DNA三维接触图等一系列新的训练任务,并实现了单碱基精度预测。

AlphaGenome在众多基因组预测任务上达到了当前SOTA性能,再次证明了数据扩展在基因组学建模中的巨大潜力,同时也证明了sequence-to-function model这种有监督训练范式学习到的表征的巨大潜力。

然而,单纯的数据扩展并非提升模型能力的唯一路径。

来自中国人民大学高瓴人工智能学院的研究团队提出了一个重要的替代思路:通过对模型架构进行符合生物学原理的系统性创新,可以更高效地提升DNA基础模型的性能与泛化能力。

论文链接:https://arxiv.org/abs/2506.01833

Github链接: https://github.com/ZhuJiwei111/space

Huggingface链接: https://huggingface.co/yangyz1230/space

自适应协作专家

Enformer和AlphaGenome设计范式存在两个内在的架构性制约:

1. 物种共享编码器的局限性

这种「一视同仁」的编码器难以有效区分并建模不同物种间基因调控的特有模式(species-specific characteristics)与进化上的保守机制 。

2. 独立预测头的知识割裂

基因组的功能图谱,如染色质可及性、组蛋白修饰和转录因子结合,在生物学上是高度关联和协同作用的。

独立的预测头无法捕捉这些图谱间的内在依赖关系,从而限制了模型对复杂基因调控网络的深层理解 。

图1:SPACE模型架构总览。 模型包含三个核心阶段:(1) 基于CNN的局部上下文聚合模块;(2) 引入物种感知混合专家(MoE)的Transformer编码器;(3) 引入谱系分组和双层门控机制的增强型解码器

为了应对上述挑战,SPACE模型引入了两项关键的架构革新:

物种感知编码器 (Species-aware Encoder)

在Transformer编码器中部署了稀疏混合专家(MoE)层,以替代标准的前馈网络 。

该模块由一个共享的「专家」网络池和多个物种特异性的「门控网络」组成,对于来自特定物种的DNA序列,其对应的门控网络会动态地选择并加权激活一部分专家网络进行计算 。

这种设计使得模型能自适应地为不同物种分配不同的计算资源和参数路径,从而有效解耦并学习物种间的特有及共享调控特征。

此外,还引入了专家-物种互信息损失函数,以鼓励专家网络向物种特异化的方向分化 。

谱系分组增强解码器 (Profile-grouped Enhancement Decoder)

在解码阶段,依据生物学先验知识将功能相关的基因组图谱(如测量染色质可及性的DNase-seq和ATAC-seq)进行分组。

在此基础上,一个新颖的双层门控专家加权聚合模块被用于增强初始预测 。

第一层门控根据物种和序列的全局信息,动态选择最相关的「专家组」,以捕捉进化上的保守调控模式 。

第二层门控则在选定的专家组内部,根据各图谱的初步预测特征,为每个图谱精确选择并加权最合适的专家,从而建模图谱间的功能依赖性 。

最终,增强后的预测结果通过残差连接与初始预测融合,确保了训练的稳定性和预测的精确性 。

实验结果

在多个公认的基因组学基准上,对SPACE模型的性能进行了全面和严格的评估。

下游基因组任务基准测试

研究人员在Nucleotide Transformer (NT) 论文提出的一套包含18项下游分类任务的基准上,将SPACE与多个主流DNA基础模型进行了比较。

实验结果表明,SPACE模型在18项任务中的11项上取得了当前最佳(SOTA)性能,显著优于包括DNABERT-2、HyenaDNA以及NT系列在内的无监督预训练模型,也一致性地超越了其监督学习的基线模型Enformer。

这一结果强有力地支持了核心论点:一个架构设计优良的监督式预测模型,其学到的序列表示(representation)具有强大的泛化能力,可以作为一个高效的DNA基础模型。

图2:在Nucleotide Transformer下游任务中的性能比较(MCC分数)。 表格展示了SPACE与多个基准模型在18项任务上的表现。加粗字体表示该任务上的最优性能。SPACE在11项任务中达到SOTA

跨物种泛化能力评估

为了直接评估SPACE架构改进对模型跨物种泛化能力的影响,研究人员在GUE基准上进行了测试,特意选择了与模型训练物种(人、鼠)进化距离较远的酵母(10项表观遗传标记预测任务)和病毒(COVID变种分类任务)进行评估。

图3:在GUE基准上与Enformer的跨物种泛化能力比较。 SPACE在所有酵母和病毒预测任务上的性能(MCC或F1分数)均显著高于Enformer,向上箭头(↑)后的数值表示SPACE的绝对性能提升点数

与同样使用人鼠数据进行预训练的Enformer相比,SPACE在所有11项跨物种预测任务上均取得了显著的性能提升。

尤其是在酵母的H3K4me3标记预测任务上,SPACE的性能相较于Enformer提升了27.28个百分点,充分证明提出物种感知MoE编码器等架构在捕捉和迁移进化上保守的调控特征方面的有效性 。

总结

AlphaGenome展示了「数据规模为王」的强大潜力之际,SPACE模型提供了另一条同样富有前景的技术路径:通过引入符合生物学原理的、动态自适应的先进架构,可以更深刻、更高效地捕捉DNA序列中的复杂调控语言。

有理由相信,这种将架构设计与生物学洞见深度融合的研究范式,将为未来构建更强大、更具解释性的基因组学AI模型铺平道路。

参考资料:

[1] Avsec, Žiga, et al. "Effective gene expression prediction from sequence by integrating long-range interactions." Nature methods 18.10 (2021): 1196-1203.

[2] Avsec, Žiga et al. "AlphaGenome: advancing regulatory variant effect prediction with a unified DNA sequence model." DeepMind (2025).

相关内容

热门资讯

2025世界人工智能大会:机器... 2025世界人工智能大会现场,机器人技术大放异彩,吸引了众多目光。 今年的世界人工智能大会,仿佛一个...
国内首颗端边大模型存算一体AI... 7月27日消息,2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)正在举行。...
久哲决赛100%胜率被破,zw... 久哲总决赛的100%胜率被破了,还是被大家都看不上的zwy打破的。AG打TTG这场决赛的BP很神奇,...
麒麟9020手机!华为香港官网... 在 6 月 11 日举行的“华为 Pura 80 系列及全场景新品发布会”中, 华为发布了 Pura...
“投向未来” ,成都高新区全力... 7月25日,21世纪经济报道记者从成都高新区获悉,在日前举行的成都未来产业基金发布及产业对接活动上,...
周末最全爆火主题前瞻 在上期的复盘中罗列了一些大致的轮动主线,周末这两天在2025世界人工智能大会的影响下,AI、机器人火...
引领AI向善发展 社会科学研究... 在7月28日举行的世界人工智能大会社会科学分论坛上,一大批社科与AI融合发展的最新研究成果取得创新突...
蚂蚁要打通AI服务最后一公里 作者 | 柴旭晨 编辑 | 周智宇 曾经掀起扫码支付浪潮的蚂蚁,如今要在AI时代抢占新高地。 7月2...
2024年度船海产业AI创新实... 人民网上海7月27日电 (记者葛俊俊)7月27日,作为2025世界人工智能大会(WAIC2025)唯...
猴子未来或不必再为人类试毒? ... 来源:第一财经 #美FDA试验用芯片模型替代实验动物#【#猴子未来或不必再为人类试毒#? | 海斌访...
肥东县:别样“集体升学礼” 共... 一场仪式、一种风尚、一份成长……7月25日下午,由中共肥东县委宣传部、肥东县纪委监委、肥东县教育体育...
饿了么前CEO确认被抓!巨额现... 据“上海经侦ECID”官方公众号消息显示,上海警方通过护企工作站获取企业报案线索,循线侦查、成功侦破...
Steam游戏安装失败?一文教... Steam,这一由美国Valve公司倾力打造的数字游戏发行平台,自2003年面世以来,已迅速成长为全...
Steam注册人机验证难关?五... Steam,这一由Valve公司于2003年推出的电子游戏分发平台,已成为全球游戏爱好者的首选之地。...
弄堂游戏有了“消防元素”,魔都... 东方网7月27日消息:当弄堂游戏“撞上”安全知识。昨日,暑期过半,上海M50创意园限时出现“消防乐园...
中国AI赋能全球 助力多领域转... 在2025世界人工智能大会上,各国参会嘉宾表示,中国人工智能技术正用其独特的赋能能力,助力全球产业、...
华为Pura 80正式发售:5... 华为Pura 80系列在万众瞩目中迎来了其标准版的正式登场,这款新机在华为Pura 80 Pro系列...
分析师预测电子游戏行业4年后规... 尽管生活成本压力对全球娱乐行业造成了影响,但一份新报告显示,电子游戏行业的前景却一片向好——该行业的...
索尼PS官方招聘多平台总监,P... 如今的游戏市场中,主机游戏厂商纷纷放弃了独占策略,并开始了多平台布局。最近几天,索尼PS官方发布多平...
腾讯混元发布业界首个开源3D世... 7月27日,2025世界人工智能大会腾讯论坛上,腾讯正式发布混元3D世界模型1.0,并宣布全面开源。...