学习语义一致性用于音频-视觉零样本学习

学术背景 在人工智能领域,零样本学习(Zero-Shot Learning, ZSL)是一项极具挑战性的任务,其目标是通过已见类别的知识来识别未见类别的样本。音频-视觉零样本学习(Audio-Visual Zero-Shot Learning, AVZSL)作为零样本学习的一个分支,旨在通过结合音频和视觉信息来实现对未见类别的分类。然而,现有的许多方法往往过于关注学习强表征,而忽略了音频和视觉之间的语义一致性以及数据本身的层次结构。这种忽略可能导致模型在测试时无法有效分类未见类别,从而限制了其在实际应用中的表现。 为了解决这一问题,来自Guizhou University、Shanghai Jiao Tong University和Oklahoma State University的研究团队...

利用大语言模型的推荐系统方法论与方法的比较分析

学术背景 随着互联网信息的爆炸式增长,推荐系统(Recommender Systems, RSs)在现代数字生活中扮演着不可或缺的角色。无论是Netflix的电影推荐,还是社交媒体的个性化新闻推送,推荐系统都在重塑用户的在线体验。然而,传统的推荐系统面临诸多挑战,如数据稀疏性(data sparsity)、冷启动问题(cold-start)、可扩展性(scalability)和缺乏可解释性(lack of explainability)等。近年来,大语言模型(Large Language Models, LLMs)在自然语言处理(Natural Language Processing, NLP)领域取得了巨大进展,这促使研究者探索如何将这些模型应用于推荐系统,以利用其强大的文本表示能力和丰富...

基于Aczel-Alsina T-范数和T-余范的直觉犹豫模糊信息幂聚合算子及其在物流服务提供商选择中的应用

学术背景 在现代供应链管理中,物流服务商的选择是一个复杂且关键的问题。企业需要评估和选择能够高效管理和执行物流任务的第三方企业或组织。然而,现实中的决策过程往往涉及大量的不确定性和模糊性,传统的决策方法难以有效处理这些复杂信息。为了解决这一问题,模糊集理论(Fuzzy Set Theory, FST)及其扩展形式,如直觉模糊集(Intuitionistic Fuzzy Sets, IFS)和犹豫模糊集(Hesitant Fuzzy Sets, HFS),被广泛应用于多属性决策(Multi-Attribute Decision Making, MADM)问题中。 近年来,直觉犹豫模糊集(Intuitionistic Hesitant Fuzzy Sets, IHFS)作为一种新的模糊信息表示工...

基于梯形值直觉模糊数的Dombi加权几何聚合算子及其在多属性群决策中的应用

学术背景 在现代工程和管理领域,决策问题常常伴随着不确定性和模糊性。传统的模糊集理论在处理这些问题时存在一定的局限性,尤其是在处理复杂的多属性群决策(Multi-Attribute Group Decision-Making, MAGDM)问题时。直觉模糊集(Intuitionistic Fuzzy Set, IFS)作为一种扩展的模糊集理论,能够更好地捕捉决策过程中的不确定性和模糊性。然而,现有的直觉模糊数(Intuitionistic Fuzzy Numbers, IFNs)在处理某些复杂问题时仍然存在不足,尤其是当涉及到梯形直觉模糊数(Trapezoidal-Valued Intuitionistic Fuzzy Numbers, TrVIFNs)时。 为了解决这一问题,本文提出了一种...

混合机器学习技术在露天矿山爆破峰值粒子速度预测中的系统综述

露天矿山爆破作业在矿物提取中至关重要,但同时也伴随着显著的环境和结构风险。爆破过程中产生的峰值粒子速度(Peak Particle Velocity, PPV)是评估爆破振动对周围结构和环境影响的关键指标。准确的PPV预测对于优化爆破实践、减少环境破坏和确保结构安全具有重要意义。传统的预测方法在处理非线性关系和高维数据时存在局限性,而机器学习(Machine Learning, ML)技术,特别是混合机器学习方法,展现出在PPV预测中的巨大潜力。本文旨在系统综述混合机器学习技术在露天矿山爆破PPV预测中的应用,探讨其优势、挑战及未来研究方向。 论文来源 本文由Gundaveni Shylaja和Ragam Prashanth共同撰写,两位作者均来自VIT-AP University的计算机科...

基于YOLOv8的实时密集人群异常行为检测增强框架

学术背景 随着公共安全需求的日益增加,尤其是在大型宗教活动如麦加朝觐(Hajj)期间,密集人群中的异常行为检测成为了一个至关重要的课题。现有的检测方法在面对遮挡、光照变化和统一着装等复杂条件时,往往表现不佳,导致检测精度下降。为了应对这些挑战,研究者们致力于开发更为先进的计算机视觉技术,以提高实时监测的准确性和效率。 本研究的核心在于提出一种改进的YOLOv8模型——Crowd Anomaly Detection Framework (CADF),通过集成Soft-NMS(非极大值抑制的软版本)技术,显著提升了在复杂环境下的检测精度。该研究不仅针对Hajj朝觐的特殊场景进行了优化,还在多个公开数据集上进行了验证,展示了其广泛的适用性和鲁棒性。 论文来源 本论文由Rabia Nasir、Zak...

基于模糊粗糙迭代计算模型的单细胞RNA-seq数据基因选择

背景介绍 单细胞RNA测序(single cell RNA-seq, scRNA-seq)技术近年来在生物医学研究中得到了广泛应用,它能够揭示单个细胞中基因表达的异质性,为理解细胞类型、细胞状态以及疾病机制提供了重要工具。然而,scRNA-seq数据具有小样本、高维度、高噪声等特点,这使得在聚类和分类之前进行基因选择成为必要步骤。传统的统计分析和机器学习方法在处理高维数据时往往面临“维度灾难”问题,因此,如何有效地从海量基因中选择出具有代表性的基因,成为当前研究的热点之一。 为了解决这一问题,本文作者提出了一种基于模糊粗糙迭代计算模型(Fuzzy Rough Iterative Computation Model, FRIC-Model)的基因选择方法。该方法通过引入模糊对称关系(fuzzy...

可扩展的多模态表示学习网络

学术背景 在人工智能领域,多模态表示学习(Multi-modal Representation Learning, MMRL)是一种强大的范式,旨在将来自不同模态的输入映射到一个共享的表示空间中。例如,在社交网络中,用户通常会同时分享图像和文本信息。通过多模态表示学习,模型可以更好地理解文本中的某些词汇或概念与图像中的视觉模式之间的关系。这种范式在医疗保健、情感识别等多个领域得到了广泛应用,因为数据通常以多种形式存在,而多模态信息的融合可以增强系统的整体理解和决策能力。 然而,现有的多模态表示学习方法面临两个主要挑战:高阶信息保留和样本外数据泛化。首先,现有的方法主要考虑成对的标准图结构,忽略了高阶关系可能带来的潜在洞察。其次,大多数现有的图基于多模态表示学习框架假设在推理阶段已经收集了完整...

深度学习中的损失函数与性能指标:全面综述

深度学习(Deep Learning)作为人工智能领域的重要分支,近年来在计算机视觉、自然语言处理等多个领域取得了显著进展。然而,深度学习的成功在很大程度上依赖于损失函数(Loss Function)和性能指标(Performance Metrics)的选择。损失函数用于衡量模型预测与真实值之间的差异,并指导模型的优化过程;而性能指标则用于评估模型在未见数据上的表现。尽管损失函数和性能指标在深度学习中至关重要,但面对众多的选择,研究者和从业者往往难以确定最适合其特定任务的方法。 为此,本文旨在对深度学习中最常用的损失函数和性能指标进行全面回顾,帮助研究者和从业者更好地理解和选择适合其任务的工具。文章不仅涵盖了经典的回归和分类任务,还深入探讨了计算机视觉、自然语言处理(NLP)以及检索增强生成...

人工智能驱动的云计算作业调度:全面综述

学术背景 随着云计算技术的快速发展,动态和异构的云环境对高效的作业调度需求日益增长。传统的调度算法在简单系统中表现良好,但在现代复杂的云基础设施中已无法满足需求。云环境的资源异构性、能源消耗和实时适应性等问题,促使研究者探索基于人工智能(AI)的解决方案。AI驱动的作业调度技术通过机器学习、优化技术、启发式技术和混合AI模型,提供了更高的适应性、可扩展性和能源效率。本文旨在全面回顾AI驱动的作业调度技术,分析现有方法的优缺点,并探讨如何通过AI克服传统算法的不足。 论文来源 本文由Yousef Sanjalawe、Salam Al-E’mari、Salam Fraihat和Sharif Makhadmeh共同撰写,发表在《Artificial Intelligence Review》期刊上,...