这篇文档属于类型a,即报告了一项原创研究。以下是对该研究的学术报告:
作者及机构
本研究的主要作者包括Yan-Jun Li、Hsin-Hung Chou、Peng-Chan Lin、Meng-Ru Shen和Sun-Yuan Hsieh。他们分别来自国立成功大学医学信息研究所、国立暨南国际大学资讯工程学系、国立成功大学医院肿瘤科、国立成功大学医院妇产科以及国立成功大学资讯工程学系。该研究于2023年发表在《Journal of Translational Medicine》期刊上。
学术背景
本研究属于医学信息学和癌症预后预测领域。结直肠癌(CRC)是全球范围内发病率和死亡率较高的癌症之一,病理图像评估是癌症诊断和预后的金标准。然而,从高分辨率的全切片图像(WSIs)中提取具有临床意义的特征仍然具有挑战性。现有的方法通常通过采样图像补丁或从感兴趣区域(ROIs)中分割组织来开发生存预测模型,但这些方法忽略了组织的位置和数量信息,难以捕捉到具有临床意义的特征。因此,本研究提出了一种结合组织区域和病理特征的深度学习算法,旨在从WSIs中预测结直肠癌患者的生存率。
研究流程
本研究主要包括以下几个步骤:
数据来源
研究使用了两个公开数据集:NCT-CRC-HE-100K和TCGA-COAD。NCT-CRC-HE-100K包含从86张癌症组织切片中采样的100,000个图像补丁,用于训练ResNet50分类器以识别组织类型。TCGA-COAD数据集包含来自252名结直肠癌患者的258张WSIs,用于评估所提出的方法。
补丁采样与组织分类
从WSIs中随机采样224×224像素的补丁,并使用ResNet50分类器将这些补丁分类为不同的组织类型,包括肿瘤、淋巴细胞、间质和粘液等。背景补丁被排除,其他组织类型的补丁用于后续的特征提取。
病理特征提取
使用深度卷积生存模型(DeepConvSurv)从不同组织类型的补丁中提取病理特征。DeepConvSurv模型的输入为224×224像素的补丁,输出为32维特征。最终,结合肿瘤、淋巴细胞、间质和粘液四种组织类型的特征,得到128维的病理特征。
组织区域特征提取
通过图像处理技术对WSIs进行分割,定位和量化肿瘤、淋巴细胞和间质的区域。提取了五个组织区域特征,包括最大肿瘤面积、肿瘤内淋巴细胞面积、肿瘤周围淋巴细胞面积、肿瘤周围与肿瘤内淋巴细胞面积的比值以及总间质面积。
生存模型训练与评估
将128维的病理特征和5维的组织区域特征结合,形成133维的特征向量,用于训练六种不同的生存模型,包括Lasso-Cox、Ridge-Cox、Elastic Net-Cox、生存支持向量机(SSVM)、随机生存森林(RSF)和梯度提升回归树(GBRT)。使用五折交叉验证评估模型的性能,以一致性指数(C-index)作为评价指标。
主要结果
1. 病理特征提取
研究确定了肿瘤、淋巴细胞、间质和粘液四种组织类型的组合与生存率最相关,提取了128维的病理特征。这些特征在六种生存模型中表现良好,其中Lasso-Cox模型的C-index为0.679。
组织区域特征提取
提取的五个组织区域特征在生存预测中具有显著的临床意义。最大肿瘤面积、肿瘤内淋巴细胞面积和总间质面积与较差的生存率相关,而肿瘤周围淋巴细胞面积及其与肿瘤内淋巴细胞面积的比值与较好的生存率相关。
生存模型性能
结合病理特征和组织区域特征的模型在六种生存模型中表现优于现有的WSISA方法。Ridge-Cox模型的C-index达到0.704,比仅使用病理特征提高了2.5%。
结论
本研究提出了一种结合病理特征和组织区域特征的深度学习算法,用于从WSIs中预测结直肠癌患者的生存率。该方法在六种生存模型中表现优异,提供了具有临床意义和可解释性的特征。研究结果表明,组织区域特征能够显著提高生存预测的准确性,为癌症预后预测提供了新的思路。
研究亮点
1. 创新性
本研究首次将组织区域特征与病理特征结合,提出了一种新的深度学习算法,显著提高了结直肠癌生存预测的准确性。
临床意义
提取的组织区域特征具有明确的临床解释性,能够帮助病理学家更准确地评估患者的预后。
方法学优势
研究使用了多种生存模型和五折交叉验证,确保了结果的可靠性和普适性。
其他有价值的内容
研究还讨论了现有方法的局限性,并提出了未来研究方向,如使用更大的数据集验证方法的普适性,以及探索更高效的补丁采样方法。此外,研究还开源了代码,便于其他研究者复现和进一步改进该方法。