学习语义一致性用于音频-视觉零样本学习

学术背景 在人工智能领域,零样本学习(Zero-Shot Learning, ZSL)是一项极具挑战性的任务,其目标是通过已见类别的知识来识别未见类别的样本。音频-视觉零样本学习(Audio-Visual Zero-Shot Learning, AVZSL)作为零样本学习的一个分支,旨在通过结合音频和视觉信息来实现对未见类别的分类。然而,现有的许多方法往往过于关注学习强表征,而忽略了音频和视觉之间的语义一致性以及数据本身的层次结构。这种忽略可能导致模型在测试时无法有效分类未见类别,从而限制了其在实际应用中的表现。 为了解决这一问题,来自Guizhou University、Shanghai Jiao Tong University和Oklahoma State University的研究团队...

快速机器学习在建筑管理系统中的应用

学术背景 随着全球能源危机的加剧和环境保护意识的提升,建筑管理系统(Building Management Systems, BMS)的智能化与高效化成为了学术界和工业界关注的焦点。传统的BMS依赖于基于规则的控制方法,无法动态适应环境变化,如能源价格波动和气象条件的变化。近年来,机器学习(Machine Learning, ML)和人工智能(Artificial Intelligence, AI)技术的快速发展为BMS的智能化提供了新的可能性。然而,现有的BMS在实时数据处理和决策响应方面仍存在不足,尤其是在资源受限的环境中,如何实现低延迟、高吞吐量的ML模型部署成为了一个亟待解决的问题。 为此,Mohammed Mshragi和Ioan Petri等学者在2025年发表了一篇题为《快速机...

人工智能在化学交换饱和转移磁共振成像中的应用

学术背景 化学交换饱和转移(Chemical Exchange Saturation Transfer, CEST)磁共振成像(MRI)是一种先进的非侵入性成像技术,能够提供活体组织的详细分子信息。CEST MRI通过选择性饱和特定代谢物的可交换质子,并将这种饱和转移到水分子中,从而实现对低浓度蛋白质和代谢物的检测和定量。尽管CEST MRI在神经退行性疾病和癌症等疾病的诊断中显示出巨大潜力,但其在临床中的应用仍面临诸多技术挑战,例如数据采集时间长、图像处理复杂以及解释难度大。这些问题限制了CEST MRI从研究环境向临床实践的过渡。 近年来,人工智能(Artificial Intelligence, AI)在医学影像领域的应用日益广泛,尤其是在处理大规模数据和提供精确诊断方面表现出色。AI...

利用大语言模型的推荐系统方法论与方法的比较分析

学术背景 随着互联网信息的爆炸式增长,推荐系统(Recommender Systems, RSs)在现代数字生活中扮演着不可或缺的角色。无论是Netflix的电影推荐,还是社交媒体的个性化新闻推送,推荐系统都在重塑用户的在线体验。然而,传统的推荐系统面临诸多挑战,如数据稀疏性(data sparsity)、冷启动问题(cold-start)、可扩展性(scalability)和缺乏可解释性(lack of explainability)等。近年来,大语言模型(Large Language Models, LLMs)在自然语言处理(Natural Language Processing, NLP)领域取得了巨大进展,这促使研究者探索如何将这些模型应用于推荐系统,以利用其强大的文本表示能力和丰富...

人工智能驱动的决策模型在分散式能源存储投资中的应用

学术背景 随着全球能源结构向可再生能源转型,分散式能源存储(decentralized energy storage)的重要性日益凸显。与传统的集中式能源存储系统不同,分散式能源存储将能源生产和存储过程本地化,减少了大规模系统故障的风险,并提高了能源供应的连续性和灵活性。然而,分散式能源存储项目的复杂性和资源有限性使得企业难以确定战略优先级,这可能导致投资失败或效率低下。 为了解决这一问题,作者们提出了一种基于人工智能(AI)驱动的决策模型,旨在为分散式能源存储投资提供有效的战略指导。该研究不仅关注如何优化投资决策,还通过引入信息增益(information gain)和大规模专家选择技术,提高了决策的一致性和效率。 论文来源 这篇论文由Gang Kou、Hasan Dinçer、Edanu...

基于Aczel-Alsina T-范数和T-余范的直觉犹豫模糊信息幂聚合算子及其在物流服务提供商选择中的应用

学术背景 在现代供应链管理中,物流服务商的选择是一个复杂且关键的问题。企业需要评估和选择能够高效管理和执行物流任务的第三方企业或组织。然而,现实中的决策过程往往涉及大量的不确定性和模糊性,传统的决策方法难以有效处理这些复杂信息。为了解决这一问题,模糊集理论(Fuzzy Set Theory, FST)及其扩展形式,如直觉模糊集(Intuitionistic Fuzzy Sets, IFS)和犹豫模糊集(Hesitant Fuzzy Sets, HFS),被广泛应用于多属性决策(Multi-Attribute Decision Making, MADM)问题中。 近年来,直觉犹豫模糊集(Intuitionistic Hesitant Fuzzy Sets, IHFS)作为一种新的模糊信息表示工...

基于梯形值直觉模糊数的Dombi加权几何聚合算子及其在多属性群决策中的应用

学术背景 在现代工程和管理领域,决策问题常常伴随着不确定性和模糊性。传统的模糊集理论在处理这些问题时存在一定的局限性,尤其是在处理复杂的多属性群决策(Multi-Attribute Group Decision-Making, MAGDM)问题时。直觉模糊集(Intuitionistic Fuzzy Set, IFS)作为一种扩展的模糊集理论,能够更好地捕捉决策过程中的不确定性和模糊性。然而,现有的直觉模糊数(Intuitionistic Fuzzy Numbers, IFNs)在处理某些复杂问题时仍然存在不足,尤其是当涉及到梯形直觉模糊数(Trapezoidal-Valued Intuitionistic Fuzzy Numbers, TrVIFNs)时。 为了解决这一问题,本文提出了一种...

混合机器学习技术在露天矿山爆破峰值粒子速度预测中的系统综述

露天矿山爆破作业在矿物提取中至关重要,但同时也伴随着显著的环境和结构风险。爆破过程中产生的峰值粒子速度(Peak Particle Velocity, PPV)是评估爆破振动对周围结构和环境影响的关键指标。准确的PPV预测对于优化爆破实践、减少环境破坏和确保结构安全具有重要意义。传统的预测方法在处理非线性关系和高维数据时存在局限性,而机器学习(Machine Learning, ML)技术,特别是混合机器学习方法,展现出在PPV预测中的巨大潜力。本文旨在系统综述混合机器学习技术在露天矿山爆破PPV预测中的应用,探讨其优势、挑战及未来研究方向。 论文来源 本文由Gundaveni Shylaja和Ragam Prashanth共同撰写,两位作者均来自VIT-AP University的计算机科...

基于YOLOv8的实时密集人群异常行为检测增强框架

学术背景 随着公共安全需求的日益增加,尤其是在大型宗教活动如麦加朝觐(Hajj)期间,密集人群中的异常行为检测成为了一个至关重要的课题。现有的检测方法在面对遮挡、光照变化和统一着装等复杂条件时,往往表现不佳,导致检测精度下降。为了应对这些挑战,研究者们致力于开发更为先进的计算机视觉技术,以提高实时监测的准确性和效率。 本研究的核心在于提出一种改进的YOLOv8模型——Crowd Anomaly Detection Framework (CADF),通过集成Soft-NMS(非极大值抑制的软版本)技术,显著提升了在复杂环境下的检测精度。该研究不仅针对Hajj朝觐的特殊场景进行了优化,还在多个公开数据集上进行了验证,展示了其广泛的适用性和鲁棒性。 论文来源 本论文由Rabia Nasir、Zak...

基于模糊粗糙迭代计算模型的单细胞RNA-seq数据基因选择

背景介绍 单细胞RNA测序(single cell RNA-seq, scRNA-seq)技术近年来在生物医学研究中得到了广泛应用,它能够揭示单个细胞中基因表达的异质性,为理解细胞类型、细胞状态以及疾病机制提供了重要工具。然而,scRNA-seq数据具有小样本、高维度、高噪声等特点,这使得在聚类和分类之前进行基因选择成为必要步骤。传统的统计分析和机器学习方法在处理高维数据时往往面临“维度灾难”问题,因此,如何有效地从海量基因中选择出具有代表性的基因,成为当前研究的热点之一。 为了解决这一问题,本文作者提出了一种基于模糊粗糙迭代计算模型(Fuzzy Rough Iterative Computation Model, FRIC-Model)的基因选择方法。该方法通过引入模糊对称关系(fuzzy...