ImmunoTAR:整合性优先排序癌症免疫治疗的细胞表面靶点

癌症是全球范围内导致死亡的主要原因之一。尽管近年来免疫治疗取得了显著进展,如嵌合抗原受体T细胞(CAR-T)疗法和抗体药物偶联物(ADCs)的成功应用,但如何有效识别癌症特异性表面蛋白靶点仍然是当前研究的重大挑战。表面蛋白靶点的识别对于开发精准且低毒的免疫疗法至关重要。现有的技术,如RNA测序和蛋白质组学,虽然能够帮助研究人员分析这些靶点,但仍然缺乏系统化的方法来优先选择最合适的免疫治疗靶点。 为此,来自Children’s Hospital of Philadelphia、Drexel University、BC Cancer Research Institute等机构的科研团队开发了一种名为ImmunoTAR的计算工具,旨在通过整合多种公共数据库的数据,系统化地优先选择免疫治疗靶点。该工...

基于信息熵增强BERT和多向GRU的S-硫化位点预测方法

背景介绍 蛋白质翻译后修饰(Post-Translational Modifications, PTMs)是调节细胞活动的关键机制,包括基因转录、DNA修复和蛋白质相互作用等。其中,半胱氨酸(Cysteine)作为稀有氨基酸,通过其硫醇基团(Thiol Group)参与多种PTMs,尤其是在氧化还原平衡和信号传递过程中发挥着重要作用。S-硫酰化(S-Sulfhydration)是一种重要的PTM,与心血管疾病和神经系统疾病的发生和发展密切相关。然而,S-硫酰化的具体机制仍不明确,尤其是在位点识别方面存在较大的挑战。 传统的S-硫酰化位点识别方法,如生物素转换法(Biotin Conversion Method)和马来酰亚胺荧光法(Maleimide Fluorescence Method),...

COME:基于对比映射学习的单细胞RNA测序数据空间重建方法

单细胞RNA测序(scRNA-seq)技术能够以单细胞分辨率进行高通量转录组分析,极大地推动了细胞生物学的研究。然而,scRNA-seq技术的一个显著局限性是,它需要将组织解离,导致细胞在组织中的原始空间位置信息丢失。空间转录组学(Spatial Transcriptomics, ST)技术能够提供精确的空间基因表达图谱,但其在基因检测数量、成本以及细胞类型注释的精细度方面存在限制。因此,如何在scRNA-seq数据中恢复空间信息,成为了当前研究的一个重要挑战。 为了解决这一问题,研究人员提出了通过细胞对应学习(cell correspondence learning)在scRNA-seq和ST数据之间传递知识的方法,从而恢复scRNA-seq数据中的空间信息。然而,现有的方法在建模局部和全...

基于共享单元和多通道注意力机制的circRNA与疾病关联预测

背景介绍 近年来,环状RNA(circRNA)作为一种新型的非编码RNA分子,在疾病的发生、发展和治疗中扮演着重要角色。circRNA具有独特的环状结构,不易被核酸酶降解,因此被认为是潜在的生物标志物和治疗靶点。然而,通过实验方法研究circRNA与疾病的关联不仅耗时且成本高昂,这限制了相关研究的进展。为了解决这一问题,研究人员开始开发计算模型,通过生物信息学方法预测circRNA与疾病的关联,从而为实验研究提供指导。 尽管多视图学习方法在预测circRNA与疾病关联方面得到了广泛应用,但现有方法往往未能充分利用不同视图之间的潜在信息,且忽略了不同视图对预测结果的重要性差异。因此,哈尔滨工业大学和电子科技大学的团队提出了一种结合共享单元和多通道注意力机制的新方法,名为MSMCDA(Multi...

基于APNet的稀疏深度学习模型在COVID-19严重程度驱动因素发现中的应用

学术背景 COVID-19大流行对全球公共卫生系统造成了巨大冲击,尽管目前疫情已有所缓解,但其复杂的免疫病理机制、长期后遗症(如“长新冠”)以及未来可能出现的类似威胁,仍然推动着相关研究的深入。特别是重症COVID-19患者,常伴随“细胞因子风暴”、急性呼吸窘迫综合征(ARDS)、多器官衰竭等严重症状,亟需更精准的预测模型和生物标志物来指导临床决策。 传统的机器学习(ML)和深度学习(DL)模型在高通量组学数据分析中表现出色,但往往缺乏生物可解释性,难以揭示非线性蛋白质动态(如翻译后修饰)和复杂的信号通路调控机制。为了解决这一问题,作者开发了APNet(Activity PASNet),一种结合了差异活性分析和生物信息驱动的稀疏深度学习模型,旨在通过可解释的预测发现COVID-19重症的驱动...

SP-DTI:基于亚口袋信息的Transformer模型用于药物-靶点相互作用预测

学术背景 药物-靶点相互作用(Drug-Target Interaction, DTI)预测是药物发现中的关键环节,能够显著降低实验筛选的成本和时间。然而,尽管深度学习技术已经提升了DTI预测的准确性,现有方法仍面临两大挑战:泛化能力不足和亚口袋级相互作用的忽视。首先,现有模型在未见过的蛋白质和跨域设置下性能显著下降;其次,当前的分子关系学习往往忽略了亚口袋级别的相互作用,而这些相互作用对于理解结合位点的细节至关重要。为了解决这些问题,研究人员提出了一种名为SP-DTI的新型模型,通过引入亚口袋分析和预训练语言模型,提升了DTI预测的准确性和泛化能力。 论文来源 这篇论文由Sizhe Liu、Yuchen Liu、Haofeng Xu、Jun Xia和Stan Z. Li共同撰写。他们分别来...

基于CNN与扩张采样自注意力和特征交互Transformer的ABVS乳腺肿瘤分割

基于CNN与Dilated Sampling Self-Attention的ABVS乳腺肿瘤分割研究 学术背景 乳腺癌是全球范围内第二大常见癌症,早期和准确的检测对于改善患者预后和降低死亡率至关重要。尽管目前有多种成像技术(如X线乳腺摄影、磁共振成像和手持超声)被用于乳腺癌的早期筛查,但这些技术往往面临分辨率有限或操作依赖性强等问题。为了解决这些问题,自动化乳腺容积扫描仪(Automated Breast Volume Scanner, ABVS)应运而生。ABVS能够自动获取整个乳房的全面视图,但其图像分析仍然具有挑战性,主要由于乳腺肿瘤在大小、形状和位置上的显著差异。近年来,深度学习在医学图像分析中取得了显著进展,尤其是卷积神经网络(CNN)和变换器(Transformer)在肿瘤分割和...

基于反事实推理的多模态公众演讲焦虑检测通用去偏框架

学术背景与问题引入 在当今教育领域,公共演讲焦虑(Public Speaking Anxiety, PSA)是一个普遍存在的现象,尤其是在非母语学习者中。这种焦虑不仅影响学习者的表达能力,还可能阻碍其个人发展。为了帮助学习者克服这一问题,研究者们开始探索如何通过多模态数据(如视频、音频和文本)自动检测演讲焦虑状态。然而,现有的多模态公共演讲焦虑检测(Multimodal Public Speaking Anxiety Detection, MPSAD)模型在训练过程中容易受到多种潜在偏差的影响,例如上下文偏差(context bias)、标签偏差(label bias)和关键词偏差(keyword bias)。这些偏差会导致模型过度依赖某些表面特征,而未能充分利用多模态信息,从而降低检测的准...

基于双提示的排练式持续学习方法:DUPT

学术背景 在机器学习和神经网络领域,持续学习(Continual Learning)是一个重要的研究方向。持续学习的目标是让模型能够在一系列任务中不断学习新知识,同时避免遗忘已经学到的旧知识。然而,现有的持续学习方法面临一个主要挑战:灾难性遗忘(Catastrophic Forgetting)。灾难性遗忘指的是模型在学习新任务时,会迅速遗忘之前学到的知识,导致旧任务的性能大幅下降。这一问题在现实应用中尤为突出,因为许多任务需要模型在不断变化的环境中持续学习和适应。 为了解决这一问题,研究者们提出了多种方法,其中基于回放的方法(Rehearsal-based Methods)是一种常见的解决方案。这类方法通过存储旧任务的代表性样本,并在学习新任务时回放这些样本来巩固旧知识。然而,现有的回放方法...

复杂量化最小误差熵与基准点:理论及模型回归中的应用

复杂量化最小误差熵与基准点的理论及应用:模型回归中的突破 学术背景 在机器学习和信号处理领域,非高斯噪声的存在往往会对模型的性能产生不利影响。传统的均方误差(Mean Squared Error, MSE)虽然在理论上和计算上具有简单性,但在面对非高斯噪声时,其可靠性受到严重挑战。为了解决这一问题,研究者们提出了多种优化准则,其中最小误差熵(Minimum Error Entropy, MEE)因其在抑制脉冲噪声和异常值方面的优异表现而备受关注。然而,原始的MEE算法由于需要对误差样本进行双重求和,计算复杂度较高,限制了其在大规模数据集中的应用。 为了降低计算负担,Zheng等人提出了量化最小误差熵(Quantized MEE, QMEE),通过量化技术显著提高了计算效率。在此基础上,本研究...