评估大型语言模型在基因集功能发现中的应用

基于大语言模型探索基因集合功能发现:GPT-4的表现优异 学术背景 在功能基因组学(functional genomics)领域,基因集合富集分析(gene set enrichment analysis)是理解基因功能及其相关生物学过程的重要方法。然而,当前的富集分析主要依赖于文献整理的基因功能数据库,例如Gene Ontology (GO)等,这些数据库存在一定的局限性:数据不完整且更新速度有限。这导致了许多基因集合无法通过传统工具有效解析,这些未曾被明确标注的基因集合正是潜在产生重要生物学新见解的源泉。 在这种背景下,近年来生成式人工智能(generative artificial intelligence),尤其是诸如GPT-4的“大语言模型”(large language mode...