评估大型语言模型在基因集功能发现中的应用

基于大语言模型探索基因集合功能发现:GPT-4的表现优异 学术背景 在功能基因组学(functional genomics)领域,基因集合富集分析(gene set enrichment analysis)是理解基因功能及其相关生物学过程的重要方法。然而,当前的富集分析主要依赖于文献整理的基因功能数据库,例如Gene Ontology (GO)等,这些数据库存在一定的局限性:数据不完整且更新速度有限。这导致了许多基因集合无法通过传统工具有效解析,这些未曾被明确标注的基因集合正是潜在产生重要生物学新见解的源泉。 在这种背景下,近年来生成式人工智能(generative artificial intelligence),尤其是诸如GPT-4的“大语言模型”(large language mode...

AutoAlign: 由大型语言模型驱动的全自动知识图谱对齐

AutoAlign:由大规模语言模型驱动的全自动、高效知识图谱对齐方法 知识图谱(Knowledge Graph,简称KG)已经被广泛应用于问答系统、对话系统和推荐系统等多个领域。然而,不同的知识图谱中可能存在同一现实实体以不同形式存储的问题,这导致知识共同体和信息互补非常困难,尤其在实际应用中,这些知识图谱的合并是一项核心任务。这涉及实体对齐(Entity Alignment),即识别不同知识图谱中代表相同实体的实体对。然而,现有方法通常需要手工制作的种子对齐(Seed Alignments),其获取成本高、可移植性差,并且人工干预可能引入偏差,影响对齐效果。 为了应对上述挑战,来自Tsinghua University、University of Melbourne、Universita...

将大型语言模型和知识图谱统一起来

统一大语言模型与知识图谱 背景 近年来,自然语言处理和人工智能领域涌现了大量研究成果,其中,大语言模型(Large Language Models, LLMS)如 ChatGPT 和 GPT-4 表现出色。然而,尽管这些模型具有出色的泛化能力,常常因其黑箱性质无法有效捕捉和访问事实知识而受到批评。另一方面,知识图谱(Knowledge Graphs, KGs)如 Wikipedia 和 Huapu 通过结构化形式存储了大量事实知识,但构建和演化知识图谱的过程却非常复杂。因此,研究人员提出将大语言模型与知识图谱相结合,利用两者的优势以实现互补。 来源 本文发表在《IEEE Transactions on Knowledge and Data Engineering》2024年7月第36卷第7期...

探索大型语言模型的道德和法律推理心理

当今,大型语言模型(LLM)在多个领域展现出专家级的表现,这引发了人们对其内在推理过程的浓厚兴趣。理解LLM是如何产生这些惊人的结果,对于未来人工智能代理的发展和确保其与人类价值观相一致都具有重要意义。然而,现有LLM的架构使得解释其内在过程颇为困难。因此,研究人员开始借鉴心理学研究中常用的方法来探索LLM的推理模式,产生了”机器心理学”这一新兴研究领域。 本文作者 本论文的作者来自不同机构: - Guilherme F.C.F. Almeida,Insper教育与研究学院,巴西 - José Luiz Nunes,天主教里约大学信息学系,巴西; FGV里约法学院,巴西 - Neele Engelmann,波鸿鲁尔大学,德国;人机中心,马克斯·普朗克人类发展研究所,德国 - Alex Wie...