探索GPT-4在基于放射组学的机器学习模型中的潜力

分享自：

探索GPT-4在基于放射组学的机器学习模型中的潜力

人工智能

影像医学与核医学

期刊:neuro-oncology advancesDOI:10.1093/noajnl/vdae230

【点击此处】阅读全文、收藏及针对性提问

本文报告了一项关于利用GPT-4的Advanced Data Analysis (ADA)功能自主开发机器学习模型（MLMs）以预测胶质瘤分子类型的研究。该研究由Martha Foltyn-Dumitru、Aditya Rastogi、Jaeyoung Cho等作者共同完成，发表于2025年的《Neuro-Oncology Advances》期刊。研究的主要目的是探索GPT-4在基于MRI影像组学（radiomics）的胶质瘤分子类型预测中的潜力，并与手工构建的机器学习模型进行性能对比。
研究背景胶质瘤是中枢神经系统中最常见的原发性恶性肿瘤，其分子类型（如IDH突变状态和1p/19q共缺失状态）对患者的治疗和预后具有重要影响。传统的分子分型方法依赖于侵入性的组织活检，而基于影像组学的机器学习模型提供了一种非侵入性的替代方案。影像组学通过从医学影像中提取高维定量特征（如形状、纹理和强度指标），能够提供超越视觉评估的疾病特征信息。然而，现有的影像组学模型通常需要大量的技术知识和手工调优，限制了其在临床中的广泛应用。GPT-4作为一种大型语言模型（LLM），具备自主开发机器学习模型的能力，可能为这一领域带来新的突破。
研究流程研究分为以下几个步骤：
数据收集与预处理：研究纳入了615名新诊断的胶质瘤患者，所有患者均接受了术前MRI扫描，并根据IDH和1p/19q状态分为三类：IDH野生型（IDH-wt）、IDH突变且1p/19q共缺失（IDH-mut codel）和IDH突变但1p/19q非共缺失（IDH-mut non-codel）。MRI图像经过预处理，包括脑组织提取、图像配准和肿瘤区域分割。
影像组学特征提取：使用Python的PyRadiomics库从MRI图像中提取了377个影像组学特征，涵盖形状、一阶统计量、灰度共生矩阵（GLCM）等多个类别。
机器学习模型开发：研究将数据集分为训练集和测试集，使用GPT-4的ADA功能自主开发了一个随机森林分类器，并与手工构建的支持向量机（SVM）模型进行对比。GPT-4模型通过文本提示进行训练和测试，最终生成分类概率。
外部验证：研究还使用了两个公开的胶质瘤数据集（D2和D3）进行外部验证，以评估模型的泛化能力。
主要结果研究结果显示，GPT-4在D3数据集上达到了最高的准确率（0.820，95% CI = 0.819-0.821），显著优于手工构建的SVM模型（准确率为0.678，95% CI = 0.677-0.680）。然而，GPT-4在不同胶质瘤类型中的表现存在差异。在IDH野生型组中，GPT-4的召回率（recall）达到了0.997，显著高于SVM模型的0.742。但在IDH突变且1p/19q非共缺失组中，GPT-4的召回率仅为0.275，低于SVM模型的0.426。在IDH突变且1p/19q共缺失组中，GPT-4的表现也较差。
结论研究表明，GPT-4能够自主开发基于影像组学的机器学习模型，并在某些情况下达到与手工构建模型相当的性能。然而，由于数据集的不平衡性，GPT-4在处理某些胶质瘤类型时表现较差，表明其在处理端到端机器学习流程时仍存在局限性。尽管如此，GPT-4的自动化能力为临床医生提供了便捷的工具，降低了机器学习模型开发的技术门槛。
研究亮点自动化建模：GPT-4能够自主开发影像组学模型，减少了对手工调优的依赖。
性能对比：GPT-4在整体准确率上与手工构建的SVM模型相当，但在处理不平衡数据集时表现较差。
临床应用潜力：该研究展示了GPT-4在医学影像分析中的潜力，为临床医生提供了新的工具。
研究意义该研究为胶质瘤的分子分型提供了一种非侵入性的预测方法，展示了GPT-4在医学影像分析中的应用前景。尽管GPT-4在处理不平衡数据集时存在局限性，但其自动化能力为未来的医学研究提供了新的方向。通过进一步优化模型和数据集，GPT-4有望在临床实践中发挥更大的作用。
其他有价值的内容研究还讨论了GPT-4在临床应用中面临的挑战，包括数据隐私、模型可解释性和伦理问题。未来的研究需要进一步探索如何在不影响数据安全的前提下，充分利用GPT-4的自动化能力。

上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com

【点击此处】阅读全文、收藏及针对性提问