基于注意力机制的多层子词联合学习的中文词嵌入研究

学术背景 近年来,中文词向量(Chinese Word Embedding)在自然语言处理(Natural Language Processing, NLP)领域引起了广泛关注。与英语不同,中文的字符结构复杂且多样,这为语义表示带来了独特的挑战。传统的词向量模型(如Word2Vec)在处理中文时,往往无法充分捕捉汉字内部的细微语义信息,尤其是忽略了不同层次的子词信息对语义的贡献差异。例如,汉字由笔画、部首、拼音等多个子成分构成,这些子成分在不同语境下对语义的理解起着重要作用。然而,现有的模型在处理这些信息时,往往采用统一的方式,未能有效区分各子成分的权重。 为了解决这一问题,本文提出了一种基于权重的中文词向量模型,该模型将中文词的内部结构分为六个层次的子词信息:词、字、部件、拼音、笔画和结构...

用于无人机视角下小目标检测的多尺度特征融合网络

背景介绍 随着无人机(UAV)技术的快速发展,无人机拍摄的低空遥感图像在灾害管理、搜索与救援等任务中得到了广泛应用。然而,无人机图像中的小目标检测(small object detection)仍然是一个具有挑战性的问题。由于小目标在图像中仅占少数像素,且分布不规则,现有的目标检测算法在这些场景中的表现往往不尽如人意。特别是,尽管一些现有的检测器引入了多尺度特征融合(multi-scale feature fusion)模块以提高检测精度,但这些传统方法常常忽略了目标与背景之间的权重关系,导致小目标在深层特征图中的重要性被削弱。此外,广泛使用的交并比(Intersection over Union, IoU)度量及其变体对小目标的位置误差特别敏感,这显著影响了基于锚框(anchor-base...

基于共享单元和多通道注意力机制的circRNA与疾病关联预测

背景介绍 近年来,环状RNA(circRNA)作为一种新型的非编码RNA分子,在疾病的发生、发展和治疗中扮演着重要角色。circRNA具有独特的环状结构,不易被核酸酶降解,因此被认为是潜在的生物标志物和治疗靶点。然而,通过实验方法研究circRNA与疾病的关联不仅耗时且成本高昂,这限制了相关研究的进展。为了解决这一问题,研究人员开始开发计算模型,通过生物信息学方法预测circRNA与疾病的关联,从而为实验研究提供指导。 尽管多视图学习方法在预测circRNA与疾病关联方面得到了广泛应用,但现有方法往往未能充分利用不同视图之间的潜在信息,且忽略了不同视图对预测结果的重要性差异。因此,哈尔滨工业大学和电子科技大学的团队提出了一种结合共享单元和多通道注意力机制的新方法,名为MSMCDA(Multi...

基于注意力引导的卷积神经网络框架用于3D MRI扫描的胶质瘤分割和分级

注意引导的CNN框架用于3D MRI扫描的胶质瘤分割和评级研究 胶质瘤是人类最致命的脑肿瘤形式,及时诊断这些肿瘤是有效肿瘤治疗的重要一步。磁共振成像(MRI)通常提供对脑部病变的无创检查。然而,手动检查MRI扫描中的肿瘤需要大量时间,并且容易出错。因此,自动诊断肿瘤在胶质瘤的临床管理和外科干预中起着至关重要的作用。在这项研究中,我们提出了一个基于卷积神经网络(CNN)的框架,用于从3D MRI扫描中无创分级肿瘤。 背景介绍 胶质瘤是常见且致命的脑肿瘤,根据其侵袭性和恶性程度可以分为四级。低级别肿瘤(I-III级)通常较不具侵袭性且对治疗反应较好。然而,高级别肿瘤(IV级)具有高度侵袭性,例如胶质母细胞瘤,其治疗效果较差,仅有5%的患者能存活5年。 为了使用医疗影像开展胶质瘤的研究,研究者通常...