心理研发脑影像多中心大数据去站点效应标准化推荐方案

  • 严超赣研究组 王瑀薇、严超赣
  • 创建时间: 2023-04-28
  • 9020

        脑影像已迈入大数据时代,这意味着需要进行多中心脑影像大数据合作研究,而有效地去除站点效应以实现多中心数据标准化融合,是其中关键一步。近日,中国科学院行为科学重点实验室严超赣研究组的研究人员针对静息态功能磁共振成像(resting-state functional magnetic resonance imaging, R-fMRI)数据融合的站点效应问题,进行了全面的评估,并提出了一套有效地去站点效应的标准化推荐方案。

  在多个数据集中,研究人员对各种R-fMRI指标的去站点效应策略进行了全面评估,包括测试残留站点效应、个体识别能力、重测信度、统计结果的可重复性,以及站点和性别完全混淆情境下的表现。在个体识别能力(即在不同站点扫描的R-fMRI数据中,是否能识别出同一受试者)上,研究发现,虽然大多数方法都减少了站点效应,但是基于子采样最大平均距离的分布偏移校正算法(Subsampling Maximum-mean-distance based distribution shift correction Algorithm, SMA)和基于参数的未校正的CovBat在个体识别能力(聚类准确性)方面优于线性回归模型、线性混合模型、ComBat系列和不变条件变分自编码器(ICVAE)。在重测信度方面,SMA和基于参数的校正的CovBat优于未校正的ComBat系列和基于参数的未校正的CovBat。同时,SMA在Dice系数和大脑性别差异的可重复性方面优于后者。此外,SMA在站点和性别完全混淆情境下能更好地检测到ALFF的可重复的性别差异。为了优化SMA的识别能力、重测信度和稳定性,研究人员设计了实验来确定最佳目标站点特征。他们注意到目标站点的样本量和分布都很重要,并提出了一种启发式公式来选择目标站点。

图1 研究框架和数据

        (A) 评价框架。研究者从三个数据集——TSP-3、CoRR 和 FCP(步骤 1)中提取了五个广泛使用的 R-fMRI 指标。然后分别用 11 种方法去除它们的站点效应(步骤 2)。研究者从五个角度评估这些方法:残留站点效应(均值、方差和协方差)、个体可识别性、重测可靠性、可复制性以及站点和性别完全混淆的极端情况(步骤 3)。 (B) 这项工作中使用的数据集的人口统计信息。这包括数据集和站点名称、年龄分布以及每个站点的女性和男性数量。 (C) 详细评估过程。每个数据集都对残留站点效应进行检测。对在三个站点旅行的 41 名受试者进行了个体层面的鉴定。研究者使用分层聚类对 123 张图像进行聚类,通过聚类正确率评估属于每个被试的 3 张图像在校正后是否可以正确地分组在一起(第一行)。性别(男性与女性)的组水平统计分析:重复扫描 CoRR(重测信度,第二行)和 CoRR 和 FCP(可复制性,第三行)之间的Dice系数,以及站点和性别完全混淆(第四行)

  基于以上研究结果,研究团队推荐了基于SMA的脑影像多中心大数据去站点效应标准化推荐方案。这项工作还将为继续改进和创新脑影像大数据的标准化方法提供有力支持,有助于进一步提高多中心神经影像研究的准确性和可靠性。研究团队已经将所有数据开源在心理科学数据银行,代码开源在github,并将在下一个版本的DPABI中发布DPABI Harmonization多中心数据去站点效应模块,将提供包含SMA、ComBat,CovBat和其他方法的用户友好操作平台,以此推动领域对该方法的使用和检验。

图2 研究主要结果

(左上角)个体识别正确率:SMA和ComBat、CovBat方法两两进行统计检验。标红数字表示SMA校正后的个体识别正确率显著高于该方法校正后的个体识别正确率,紫色反之。(右侧)性别统计结果的重测信度和可重复性:对SMA和其他方法进行统计比较,红色标注出的方法在量化的评估指标上显著低于SMA,黑色则表示无统计学差异。(左下角)性别和站点完全混淆的极端情况:研究者比较了来自 FCP-Cambridge 的 74 名男性和来自 FCP-Beijing 的 106 名女性的 ALFF 性别差异,CoRR-SWU站点的重测数据协助ComBat、CovBat 和 SMA 方法进行校正。前两列对应CoRR-SWU两次重测数据分别协助校正后的性别统计差异,第三列是前两列重叠的结果,将第三列结果与可复制的性别统计差异(右下角,深绿色框)结果进行对比。同时给出了CoRR-SWU两次重测数据性别差异的可复现结果(左下角,亮绿色框)

  研究团队表示,随着大数据神经影像技术的飞速发展,去站点效应标准化方案将在基础研究和临床应用研究中发挥关键作用。该方法能够提高跨站点神经影像数据的整合能力,从而为研究者提供更加丰富和准确的大数据资源。这将有助于揭示大脑功能的更多秘密,为神经科学和心理学的进一步发展提供有力支持。未来,研究人员将继续关注去站点效应标准化方案在其他神经影像技术领域的应用,如结构磁共振成像、弥散张量成像等,并探索其在脑影像大数据深度学习中的优化策略。总之,心理所研发的脑影像多中心大数据去站点效应标准化推荐方案为神经影像领域带来了创新性的解决方案,将为多中心大数据研究提供有力支持,有助于解锁更多关于大脑功能和心理学的奥秘。

  此研究已在线发表于神经影像学期刊NeuroImage,同时该工作被2023年国际人脑图谱学会年会(OHBM)遴选为口头报告。第一作者是心理所博士生王瑀薇,通讯作者为严超赣研究员。

  该项目受到科技创新2030-脑科学与类脑研究重大项目(2021ZD0200600)、国家重点研发计划(2017YFC1309902)、国家自然科学基金(82122035、81671774、81630031)、中国科学院十三五信息化规划(XXH13505)、中国科学院重点研究计划(ZDBS-SSW-JSC006),北京市科技新星计划(Z191100001119104),以及中国科学院心理研究所科学基金(E2CX4425YZ)的资助。

  论文信息:

  Wang, Y.W., Chen, X., Yan, C.G. (2023). Comprehensive evaluation of harmonization on functional brain imaging for multisite data-fusion. Neuroimage, 120089, doi:10.1016/j.neuroimage.2023.120089.

,有助于进一步提高多中心神经影像研究的准确性和可靠性。研究团队已经将所有数据开源在心理科学数据银行,代码开源在github,并将在下一个版本的DPABI中发布DPABI Harmonization多中心数据去站点效应模块,将提供包含SMA、ComBat,CovBat和其他方法的用户友好操作平台,以此推动领域对该方法的使用和检验。