近日,厦门大学健康医疗大数据国家研究院董继扬教授团队在质谱成像的空间分割领域取得重要进展,在分析化学顶级期刊《Analytical Chemistry》上发表3篇学术论文。
质谱成像(MSI)将质谱技术的分子信息和成像技术的空间信息有机结合起来,可以原位地对各种生物分子进行定性、定量和空间定位的分析,具有免标记、高通量和高灵敏度等优势,是药物研发、肿瘤异质性分析、新型环境污染物毒性探索、肿瘤发生发展及其相关标志物筛选的重要手段。
空间分割是MSI数据分析的一个关键步骤,它能够提供高维MSI数据的简要表示。有效的MSI空间分割结果意味着每个簇对应一个特定分子表型的组织区域,并且每个簇的特征分子将作为相应分子表型的标记物,可用于分类诊断和分子机制分析。因此,空间分割结果的好坏将影响后续的分析结果及其生物学解释。然而,由于MSI数据具有高维度、低信噪比和缺乏基准数据集等特点,MSI空间分割仍然是一项极具挑战性的任务。
首先,课题组通过大量数值实验,总结归纳MSI空间分割的主要步骤,并对关键数据滤波这一步骤在分割流程中的优先级和滤波算法进行优化,提出了MSI最优空间分割流程(pipeline),如图1所示。以小鼠胚胎的MSI数据为例,从目视检测、空间一致性、时间成本和鲁棒性等多方面评估了该流程的性能,证明了该流程的优越性。该项工作于2021年3月发表在 Analytical Chemistry 上。
图1. 优化的MSI空间分割流程及其结果
其次,首次将无监督的深度学习模型应用于MSI空间分割中,并通过引入分而治之策略,解决深度模型的参数初值敏感性问题,提出了一种基于分而治之策略的MSI分割深度模型dc-DeepMSI, 如图2所示。在小鼠胚胎的MSI空间分割任务中,dc-DeepMSI 的抗噪性、稳定性和时间成本方面均优于现有的方法。此外,将dc-DeepMSI模型用于人体乳腺癌组织的异质性分析,成功鉴别了三种主要的乳腺肿瘤分子分型,并筛选了相应的生物标志物,为阐明乳腺癌发生发展的分子机制提供有力证据。该项工作于2023年1月在线发表在 Analytical Chemistry 上。
图2. dc-DeepMSI实现人体乳腺癌肿瘤质谱成像数据的空间分割
此外,为了解决标注数据少的问题,提出基于弱监督学习的交互式MSI空间分割策略iSegMSI,如图3所示。该方法允许用户将不精确、不完整的先验知识以涂鸦方式输入模型,利用在线学习方式对模型产生的错误分割结果进行交互式修正,提高MSI分割的准确性。其中,iSegMSI被成功地应用于生物组织的代谢异质性分析中,实现小鼠胚胎和人体甲状腺肿瘤组织的MSI空间分割。该项工作于2022年10月发表在 Analytical Chemistry 上。这一系列的成果将为MSI技术在生物医学研究中的应用提供有力保障。
图3. iSegMSI实现质谱成像数据的交互式分割。
这一系列工作在董继扬教授的指导下完成,电子科学与技术学院、大数据研究院2019级博士生郭磊为第一作者。香港浸会大学蔡宗苇教授和深圳先进研究所赵超副研究员提供数据并协助指导,团队成员许晶晶高工、刘星星博士等参与了研究工作。该项工作得到了国家自然科学基金(No. 81871445),国家重点研发计划 (2017YFC1600505 and 2017YFE0191000),福建省自然科学基金(No. 2022Y0003)等项目的资助。
相关链接:
论文链接:
https://pubs.acs.org/doi/10.1021/acs.analchem.2c04045
https://pubs.acs.org/doi/10.1021/acs.analchem.2c01456
https://pubs.acs.org/doi/10.1021/acs.analchem.0c05242
生物医学网络分析实验室:https://bionet.xmu.edu.cn/