空间生物学是精准医学的新前沿。空间分子分析已经被用于揭示疾病生物学的新见解以及治疗反应和抵抗的机制。例如PhenoCycler-Fusion(PCF)空间单细胞蛋白组(CODEX)等技术,能够以单细胞分辨率同时识别和量化多达100种蛋白质生物标志物。尽管技术进步显著,但空间蛋白组学的工作流程需要专业的高端仪器和训练有素的人员,直接临床转化仍面临的重大挑战。相比之下,苏木精-伊红(H&E)染色的组织病理学是癌症等疾病临床诊断的金标准。近年来,深度学习的发展使得从H&E图像中估算特定分子特征(如基因突变和基因表达)成为可能。最新发表在《Nature Medicine》的一篇题为“AI-enabled virtual spatial proteomics from histopathology for interpretable biomarker discovery in lung cancer”的重量级文章中,研究人员提出了最新的解决方:H&E to protein expression (HEX),一个旨在从标准病理切片计算生成空间蛋白组学图谱的AI模型。
该研究的训练数据是基于382个肿瘤样本的819,000个病理图像块(tiles)及匹配的PCF空间单细胞蛋白组数据。研究对10名NSCLC患者的肿瘤样本的同一组织切片进行了PCF(CODEX)和H&E染色。PCF(CODEX)检测panel包含了40种抗体,涵盖肿瘤、免疫、结构和功能标记物,从而能够对肿瘤微环境进行全面的空间表型分析。这个庞大的数据集是模型成功的基础。
内部验证在两个具有PCF(CODEX)和H&E染色组织切片的独立数据集上(共372个肿瘤样本)评估了模型准确性。外部验证在一个包含34种组织类型的206个肿瘤样本的泛癌数据集上验证了HEX的普适性。相比其他从H&E图像预测蛋白质表达的方法,HEX表现出显著的性能提升。
研究者开发了名为MICA (Multimodal Integration via Co-attention) 的深度学习框架,结合原始H&E图像和AI衍生的虚拟空间蛋白质组学,以增强结果预测。临床验证应用于6个独立的非小细胞肺癌(NSCLC)队列,共2,298名患者。结果显示,与传统的临床病理学和分子生物标志物相比,HEX支持的多模态整合将预后准确性提高了22%,免疫治疗反应预测提高了24-39%。生物学解释上将预测结果与虚拟空间蛋白质组学图谱联系起来,识别了与治疗反应和抵抗相关的肿瘤-免疫空间生态位。总之,HEX为空间蛋白组临床应用提供了一种低成本、可扩展的方法,使得可解释的生物标志物的发现和临床转化成为可能,助力精准医疗。
值得注意的是在多种空间技术平台中,该研究选择了PhenoCycler-Fusion(PCF)空间单细胞蛋白组(CODEX)作为核心技术平台,原因并非偶然,而是基于PCF空间单细胞蛋白组的技术特性。
01、超多重蛋白标志物检测
PCF(CODEX)技术能够同时识别和量化多达100种蛋白生物标志物。这正符合研究的目标——生成“高维空间蛋白组学图谱”。研究者设计的panel中包含了40种抗体,能对肿瘤微环境进行“全面的空间表型分析”。这种超多重检测的性能允许在单次实验中捕获复杂的细胞类型和功能状态,为AI模型学习H&E形态学与复杂蛋白表达模式之间的关联提供了丰富且必需的数据基础。
02、单细胞分辨率与空间信息保留
PCF(CODEX)提供了单细胞分辨率。这一点至关重要,因为它能揭示肿瘤微环境中不同细胞(如癌细胞、免疫细胞、基质细胞)的精确空间分布和相互作用。文章中后续的生物学解释部分,如发现T细胞与肿瘤细胞的共定位、髓系细胞的聚集等,都依赖于这种高分辨率的空间信息。对于AI模型而言,学习这种精细的、细胞级别的空间关系,是准确预测蛋白表达和识别有临床意义的空间模式的关键。
03、与同一组织切片H&E染色的兼容性
这是本研究设计中的一个核心技术优势。对同一组织切片进行PCF(CODEX)成像后,对同一张切片进行标准的H&E染色。这种方法从根本上解决了空间对齐问题。由于两种图像来自完全相同的组织切片,只需通过图像配准技术(如文中使用的PALOM工具)进行精确的共定位,就能确保每一个H&E图像块(tile)都对应着其真实的、来自同一位置的蛋白表达数据。这为训练一个高度准确的预测模型提供了“黄金标准”的监督信号。如果使用相邻切片,会因组织结构的细微差异而引入噪声,影响模型性能。
04、技术成熟度与可行性
PCF(CODEX)其流程和试剂相对成熟稳定,该技术具有高度可重复性,适合用于生成大规模、高质量的训练数据集。研究成功获取了来自10个患者的约755,000个匹配图像块,这证明了PCF(CODEX)在该研究规模下的可行性。
05、优于空间转录组
与空间转录组学相比,研究选择PCF(CODEX)在蛋白组层面的检测,是因为蛋白质更直接地关联细胞功能,且在临床常用的FFPE样本中更稳定,其图像也更易被病理学家解读。这些都是基于临床转化视角的务实考量。
总之,PhenoCycler-Fusion(PCF)空间单细胞蛋白组(CODEX)技术已经成为空间多模态研究的领航者。
华盈生物空间多模态研究体系
PCF空间单细胞蛋白组成像示例
相关文献
Li Z et al. AI-enabled virtual spatial proteomics from histopathology for interpretable biomarker discovery in lung cancer. Nat Med (2026).https://doi.org/10.1038/s41591-025-04060-4.