本文报告了一项关于利用GPT-4的Advanced Data Analysis (ADA)功能自主开发机器学习模型(MLMs)以预测胶质瘤分子类型的研究。该研究由Martha Foltyn-Dumitru、Aditya Rastogi、Jaeyoung Cho等作者共同完成,发表于2025年的《Neuro-Oncology Advances》期刊。研究的主要目的是探索GPT-4在基于MRI影像组学(radiomics)的胶质瘤分子类型预测中的潜力,并与手工构建的机器学习模型进行性能对比。
胶质瘤是中枢神经系统中最常见的原发性恶性肿瘤,其分子类型(如IDH突变状态和1p/19q共缺失状态)对患者的治疗和预后具有重要影响。传统的分子分型方法依赖于侵入性的组织活检,而基于影像组学的机器学习模型提供了一种非侵入性的替代方案。影像组学通过从医学影像中提取高维定量特征(如形状、纹理和强度指标),能够提供超越视觉评估的疾病特征信息。然而,现有的影像组学模型通常需要大量的技术知识和手工调优,限制了其在临床中的广泛应用。GPT-4作为一种大型语言模型(LLM),具备自主开发机器学习模型的能力,可能为这一领域带来新的突破。
研究分为以下几个步骤:
数据收集与预处理:研究纳入了615名新诊断的胶质瘤患者,所有患者均接受了术前MRI扫描,并根据IDH和1p/19q状态分为三类:IDH野生型(IDH-wt)、IDH突变且1p/19q共缺失(IDH-mut codel)和IDH突变但1p/19q非共缺失(IDH-mut non-codel)。MRI图像经过预处理,包括脑组织提取、图像配准和肿瘤区域分割。
影像组学特征提取:使用Python的PyRadiomics库从MRI图像中提取了377个影像组学特征,涵盖形状、一阶统计量、灰度共生矩阵(GLCM)等多个类别。
机器学习模型开发:研究将数据集分为训练集和测试集,使用GPT-4的ADA功能自主开发了一个随机森林分类器,并与手工构建的支持向量机(SVM)模型进行对比。GPT-4模型通过文本提示进行训练和测试,最终生成分类概率。
外部验证:研究还使用了两个公开的胶质瘤数据集(D2和D3)进行外部验证,以评估模型的泛化能力。
研究结果显示,GPT-4在D3数据集上达到了最高的准确率(0.820,95% CI = 0.819-0.821),显著优于手工构建的SVM模型(准确率为0.678,95% CI = 0.677-0.680)。然而,GPT-4在不同胶质瘤类型中的表现存在差异。在IDH野生型组中,GPT-4的召回率(recall)达到了0.997,显著高于SVM模型的0.742。但在IDH突变且1p/19q非共缺失组中,GPT-4的召回率仅为0.275,低于SVM模型的0.426。在IDH突变且1p/19q共缺失组中,GPT-4的表现也较差。
研究表明,GPT-4能够自主开发基于影像组学的机器学习模型,并在某些情况下达到与手工构建模型相当的性能。然而,由于数据集的不平衡性,GPT-4在处理某些胶质瘤类型时表现较差,表明其在处理端到端机器学习流程时仍存在局限性。尽管如此,GPT-4的自动化能力为临床医生提供了便捷的工具,降低了机器学习模型开发的技术门槛。
该研究为胶质瘤的分子分型提供了一种非侵入性的预测方法,展示了GPT-4在医学影像分析中的应用前景。尽管GPT-4在处理不平衡数据集时存在局限性,但其自动化能力为未来的医学研究提供了新的方向。通过进一步优化模型和数据集,GPT-4有望在临床实践中发挥更大的作用。
研究还讨论了GPT-4在临床应用中面临的挑战,包括数据隐私、模型可解释性和伦理问题。未来的研究需要进一步探索如何在不影响数据安全的前提下,充分利用GPT-4的自动化能力。