基于效用和动态定位变换程序的三向决策方法在圆形q-rung orthopair模糊集中用于大型语言模型的排序和分级

学术背景 随着人工智能(AI)和自然语言处理(Natural Language Processing, NLP)的快速发展,大型语言模型(Large Language Models, LLMs)在学术界和工业界都取得了显著进展。然而,尽管LLMs在多个NLP任务中表现出色,但尚未有单一模型能够同时满足所有任务需求。这种多样化的任务需求和评估标准的复杂性,使得LLMs的评估成为一个多准则决策(Multi-Criteria Decision-Making, MCDM)问题。传统的MCDM方法虽然能够进行排名,但在处理不确定性、任务优先级和数据变异性等方面存在局限性,尤其是在处理二元数据时,难以有效进行分级。 为了解决这一问题,本文提出了一种基于效用和动态定位变换的三支决策(Three-Way D...

大型语言模型作为情感支持对话系统的全面比较研究

学术背景 近年来,随着大型语言模型(LLMs, Large Language Models)的快速发展,其在自然语言处理(NLP, Natural Language Processing)领域的应用越来越广泛。LLMs 如 ChatGPT 和 LLaMA 等,展现了强大的语言生成和理解能力,甚至在情感表达和同理心方面也表现出色。情感支持对话系统(ESDS, Emotional Support Dialogue Systems)旨在通过对话传达理解、同情、关怀和支持,帮助他人应对情感困扰、压力或挑战。然而,尽管 LLMs 在情感对话中展现了潜力,但它们在提供有效情感支持方面的能力尚未得到全面评估。 本研究旨在探讨 LLMs 是否能够作为情感支持对话系统的核心框架,并评估其在情感支持策略和语言使...

更小但更好:用更小的大型语言模型统一布局生成

统一布局生成研究新突破:更小但更强的大语言模型 研究背景与问题提出 布局生成(Layout Generation)是计算机视觉和人机交互领域的重要研究方向,旨在通过算法自动生成符合特定需求的图形界面或排版设计。例如,科学文章、应用程序界面(App UI)、杂志页面以及幻灯片的设计都需要高效且灵活的布局生成方法。然而,传统方法通常针对单一任务或单一领域进行优化,缺乏跨任务和跨领域的通用性。随着深度学习技术的发展,基于Transformer架构的方法逐渐成为主流,但仍面临模型复杂度高、计算成本大等问题。 近年来,大语言模型(Large Language Models, LLMs)在自然语言处理(NLP)领域取得了显著进展,其强大的推理能力为解决复杂任务提供了新的可能性。然而,将LLMs应用于统一...

假新闻云中的一线希望:大型语言模型能否帮助检测虚假信息?

大型语言模型如何应对虚假信息?——基于LLMs的深度研究 在当今信息传播速度飞快的数字时代,虚假信息(misinformation)和假新闻(fake news)的传播已成为社会的重大挑战。互联网和社交媒体的普及使得信息共享的门槛大幅降低,任何人都可以在未经验证的情况下传播内容,而社交平台的算法又倾向于优先展示争议性或引发强烈情绪的内容,从而加速了误导性信息的扩散。此外,随着生成式人工智能(generative artificial intelligence)的发展,特别是大型语言模型(Large Language Models, LLMs)的普及,这些模型不仅可以生成高质量的自然语言,还可能被用于伪造信息,使得传统的虚假信息检测方法难以应对。 在此背景下,《Silver Lining in...

评估大型语言模型在基因集功能发现中的应用

基于大语言模型探索基因集合功能发现:GPT-4的表现优异 学术背景 在功能基因组学(functional genomics)领域,基因集合富集分析(gene set enrichment analysis)是理解基因功能及其相关生物学过程的重要方法。然而,当前的富集分析主要依赖于文献整理的基因功能数据库,例如Gene Ontology (GO)等,这些数据库存在一定的局限性:数据不完整且更新速度有限。这导致了许多基因集合无法通过传统工具有效解析,这些未曾被明确标注的基因集合正是潜在产生重要生物学新见解的源泉。 在这种背景下,近年来生成式人工智能(generative artificial intelligence),尤其是诸如GPT-4的“大语言模型”(large language mode...

AutoAlign: 由大型语言模型驱动的全自动知识图谱对齐

AutoAlign:由大规模语言模型驱动的全自动、高效知识图谱对齐方法 知识图谱(Knowledge Graph,简称KG)已经被广泛应用于问答系统、对话系统和推荐系统等多个领域。然而,不同的知识图谱中可能存在同一现实实体以不同形式存储的问题,这导致知识共同体和信息互补非常困难,尤其在实际应用中,这些知识图谱的合并是一项核心任务。这涉及实体对齐(Entity Alignment),即识别不同知识图谱中代表相同实体的实体对。然而,现有方法通常需要手工制作的种子对齐(Seed Alignments),其获取成本高、可移植性差,并且人工干预可能引入偏差,影响对齐效果。 为了应对上述挑战,来自Tsinghua University、University of Melbourne、Universita...

将大型语言模型和知识图谱统一起来

统一大语言模型与知识图谱 背景 近年来,自然语言处理和人工智能领域涌现了大量研究成果,其中,大语言模型(Large Language Models, LLMS)如 ChatGPT 和 GPT-4 表现出色。然而,尽管这些模型具有出色的泛化能力,常常因其黑箱性质无法有效捕捉和访问事实知识而受到批评。另一方面,知识图谱(Knowledge Graphs, KGs)如 Wikipedia 和 Huapu 通过结构化形式存储了大量事实知识,但构建和演化知识图谱的过程却非常复杂。因此,研究人员提出将大语言模型与知识图谱相结合,利用两者的优势以实现互补。 来源 本文发表在《IEEE Transactions on Knowledge and Data Engineering》2024年7月第36卷第7期...

探索大型语言模型的道德和法律推理心理

当今,大型语言模型(LLM)在多个领域展现出专家级的表现,这引发了人们对其内在推理过程的浓厚兴趣。理解LLM是如何产生这些惊人的结果,对于未来人工智能代理的发展和确保其与人类价值观相一致都具有重要意义。然而,现有LLM的架构使得解释其内在过程颇为困难。因此,研究人员开始借鉴心理学研究中常用的方法来探索LLM的推理模式,产生了”机器心理学”这一新兴研究领域。 本文作者 本论文的作者来自不同机构: - Guilherme F.C.F. Almeida,Insper教育与研究学院,巴西 - José Luiz Nunes,天主教里约大学信息学系,巴西; FGV里约法学院,巴西 - Neele Engelmann,波鸿鲁尔大学,德国;人机中心,马克斯·普朗克人类发展研究所,德国 - Alex Wie...