本文由Jiping Zhang、Wenjing Hu、Shuyuan Li、Yaofeng Wen、Yong Bao、Hefeng Huang、Chenming Xu和Dahong Qian等人共同撰写,发表于2021年8月的《IEEE Journal of Biomedical and Health Informatics》第25卷第8期。该研究提出了一种基于交错和多任务网络的染色体分类和拉直方法,旨在提高染色体核型分析的自动化水平,减轻医生的工作负担。
染色体核型分析是检测染色体异常的金标准,广泛应用于产前诊断、体外胚胎细胞遗传学分析和遗传病诊断等领域。然而,传统的核型分析过程高度依赖医生的经验,尤其是在染色体分类和拉直方面。尽管已有一些自动化方法尝试通过深度学习技术来分类染色体类型,但这些方法在处理弯曲染色体时表现不佳,且依赖于染色体中轴(medial axis, MA)的提取,而MA的提取在弯曲染色体上往往不准确。因此,本研究提出了一种新的方法,通过交错网络和多任务网络来实现染色体分类和拉直,减少对MA提取的依赖。
该研究分为三个阶段: 1. 多尺度特征学习:通过交错网络(interleaved network)学习多尺度特征。交错网络从高分辨率分支开始,逐步添加低分辨率分支,并通过多分辨率交换模块(multi-resolution interchange)在不同分辨率之间交换信息,以增强特征的表达能力。 2. 染色体分类和关节检测:利用第一阶段提取的高分辨率特征进行染色体关节检测,其他尺度的特征则用于染色体类型和极性的分类。关节检测通过卷积神经网络(CNN)生成热图来估计关节位置,而分类任务则通过多层感知器(MLP)子网络实现。 3. 染色体拉直:根据检测到的关节,将弯曲的染色体分离、旋转并重新组装,最后通过采样原始染色体的强度来恢复弯曲点周围的区域。
研究在包含32,810条染色体的数据集上进行了5折交叉验证,结果显示: - 染色体类型分类的平均准确率为98.1%,极性分类的平均准确率为99.8%。 - 关节检测的准确率在染色体仅有两个关节(起点和终点)时达到99.82%,但随着关节数量的增加,准确率逐渐下降。 - 染色体拉直后的结果显示,拉直后的染色体在强度和长度上与原始染色体保持一致,且拉直后的染色体更容易读取带型信息。
该研究提出了一种基于交错和多任务网络的染色体分类和拉直方法,显著提高了染色体核型分析的自动化水平。通过多尺度特征学习和多任务策略,该方法能够同时实现染色体分类和关节检测,且在处理弯曲染色体时表现出色。实验结果表明,该方法在染色体类型和极性分类上具有较高的准确率,且能够有效拉直弯曲染色体,保持染色体带型信息的完整性。
该研究在染色体核型分析领域具有重要的科学和应用价值。通过自动化染色体分类和拉直,该方法能够显著减轻医生的工作负担,提高染色体诊断的效率和准确性。此外,该方法还为其他医学图像处理任务提供了新的思路,尤其是在多任务学习和多尺度特征利用方面。
该研究还对比了多种现有的染色体分类和拉直方法,证明了所提出方法的优越性。特别是在处理复杂弯曲染色体时,该方法表现出更强的鲁棒性和准确性。此外,研究还探讨了网络在不同染色体类型上的表现,发现性染色体(X和Y)的分类准确率相对较低,这主要是由于样本不平衡问题。未来的研究可以通过数据增强或迁移学习来进一步提高模型的泛化能力。