基于深度学习的多模态数据整合在乳腺癌无病生存预测中的应用

乳腺癌是全球女性中最常见的恶性肿瘤之一,尽管早期干预和适当治疗已经显著提高了患者的生存率,但仍有约30%的病例会复发并发生远处转移,导致5年生存率低于23%。传统的临床预测方法,如生物标志物、临床影像和分子检测,虽然具有一定的价值,但其敏感性低、成本高、可用性有限,且存在患者内部的异质性等问题。因此,开发新的方法来可靠地预测术后乳腺癌患者的复发风险和生存率,以便及时干预和改善整体预后,成为当前研究的迫切需求。 近年来,人工智能(AI)技术的快速发展为乳腺癌的预后预测提供了新的可能性。深度学习作为一种强大的AI技术,能够从复杂的多模态数据中提取有价值的信息,结合病理图像、分子数据和临床信息,有望显著提高乳腺癌无病生存(Disease-Free Survival, DFS)的预测准确性。然而,现...

MMNC——一种多模态可解释的非编码RNA分类方法

非编码RNA(ncRNA)在细胞过程和疾病发展中扮演着关键角色。尽管基因组测序项目揭示了大量非编码基因的存在,但ncRNA的功能和分类仍然是一个复杂且具有挑战性的问题。ncRNA的多样性、复杂性和功能性使其成为生物医学研究的重要对象,尤其是在生物标志物和治疗靶点的发现中。然而,现有的ncRNA分类工具大多仅依赖于单一或两种数据类型(如序列或二级结构),忽略了其他可能提供重要信息的数据源。此外,现有方法通常缺乏可解释性,难以揭示不同ncRNA类别的特征。 为了解决这些问题,来自Université Paris-Saclay和Institut Curie的研究团队提出了一种名为MMNC(Multi-Modal Interpretable Representation for Non-Coding...

基于深度学习的酶筛选工具DeepES在孤儿酶基因识别中的应用

学术背景 随着测序技术的飞速发展,科学家们已经能够获得大量的蛋白质序列数据,其中包括许多酶序列。然而,尽管像京都基因与基因组百科全书(KEGG)和BRENDA这样的大型酶数据库已经建立,许多酶的序列信息仍然缺失。这些缺乏序列信息的酶被称为“孤儿酶”(orphan enzymes)。孤儿酶的存在严重阻碍了基于序列相似性的功能注释,导致在理解序列与酶促反应之间关系时存在巨大空白。 孤儿酶的问题不仅限于序列信息的缺失,还影响了我们对生物过程的理解。例如,人类肠道微生物群中的许多代谢过程,如短链脂肪酸(short-chain fatty acid, SCFA)的生产,与肠道炎症和癌症进展密切相关。然而,许多这些反应涉及孤儿酶,导致相关基因无法被识别。因此,开发一种不依赖于序列相似性的方法来预测酶活性...

基于Transformer模型的DNA序列比对方法研究

学术背景 DNA序列比对是基因组学中的一项核心任务,旨在将短DNA片段(reads)定位到参考基因组上的最可能位置。传统方法通常分为两个步骤:首先对基因组进行索引,然后通过高效搜索定位reads的可能位置。然而,随着基因组数据的爆炸式增长,尤其是面对长达数十亿碱基的参考基因组时,传统的比对方法在计算效率和准确性上面临巨大挑战。近年来,Transformer模型在自然语言处理(NLP)领域的成功启发了研究人员将其应用于DNA序列分析。尽管已有研究表明Transformer模型在短DNA序列分类任务中表现优异,但序列比对任务需要在整个基因组范围内进行搜索,这对模型的全局搜索能力提出了更高要求。 为此,本研究提出了一种名为“embed-search-align”(ESA)的新框架,旨在通过Tran...

使用Transformer高效增强冷冻电镜密度图的研究:CryoTen

学术背景 冷冻电子显微镜(Cryo-EM)是解析大分子(如蛋白质)结构的重要实验技术。然而,Cryo-EM的有效性常常受到实验条件(如低对比度和构象异质性)导致的噪声和密度值缺失的制约。尽管现有的全局和局部图像锐化技术被广泛用于改善Cryo-EM密度图,但在高效提升其质量以构建更精确的蛋白质结构方面仍面临挑战。为了解决这一问题,研究人员开发了CryoTen,一种基于3D UNETR++风格Transformer的模型,旨在有效增强Cryo-EM密度图的质量。 论文来源 这篇论文由Joel Selvaraj、Liguo Wang和Jianlin Cheng共同撰写。Joel Selvaraj和Jianlin Cheng来自美国密苏里大学电气工程与计算机科学系,而Liguo Wang则来自布鲁克...

基于信息熵增强BERT和多向GRU的S-硫化位点预测方法

背景介绍 蛋白质翻译后修饰(Post-Translational Modifications, PTMs)是调节细胞活动的关键机制,包括基因转录、DNA修复和蛋白质相互作用等。其中,半胱氨酸(Cysteine)作为稀有氨基酸,通过其硫醇基团(Thiol Group)参与多种PTMs,尤其是在氧化还原平衡和信号传递过程中发挥着重要作用。S-硫酰化(S-Sulfhydration)是一种重要的PTM,与心血管疾病和神经系统疾病的发生和发展密切相关。然而,S-硫酰化的具体机制仍不明确,尤其是在位点识别方面存在较大的挑战。 传统的S-硫酰化位点识别方法,如生物素转换法(Biotin Conversion Method)和马来酰亚胺荧光法(Maleimide Fluorescence Method),...

基于APNet的稀疏深度学习模型在COVID-19严重程度驱动因素发现中的应用

学术背景 COVID-19大流行对全球公共卫生系统造成了巨大冲击,尽管目前疫情已有所缓解,但其复杂的免疫病理机制、长期后遗症(如“长新冠”)以及未来可能出现的类似威胁,仍然推动着相关研究的深入。特别是重症COVID-19患者,常伴随“细胞因子风暴”、急性呼吸窘迫综合征(ARDS)、多器官衰竭等严重症状,亟需更精准的预测模型和生物标志物来指导临床决策。 传统的机器学习(ML)和深度学习(DL)模型在高通量组学数据分析中表现出色,但往往缺乏生物可解释性,难以揭示非线性蛋白质动态(如翻译后修饰)和复杂的信号通路调控机制。为了解决这一问题,作者开发了APNet(Activity PASNet),一种结合了差异活性分析和生物信息驱动的稀疏深度学习模型,旨在通过可解释的预测发现COVID-19重症的驱动...

SP-DTI:基于亚口袋信息的Transformer模型用于药物-靶点相互作用预测

学术背景 药物-靶点相互作用(Drug-Target Interaction, DTI)预测是药物发现中的关键环节,能够显著降低实验筛选的成本和时间。然而,尽管深度学习技术已经提升了DTI预测的准确性,现有方法仍面临两大挑战:泛化能力不足和亚口袋级相互作用的忽视。首先,现有模型在未见过的蛋白质和跨域设置下性能显著下降;其次,当前的分子关系学习往往忽略了亚口袋级别的相互作用,而这些相互作用对于理解结合位点的细节至关重要。为了解决这些问题,研究人员提出了一种名为SP-DTI的新型模型,通过引入亚口袋分析和预训练语言模型,提升了DTI预测的准确性和泛化能力。 论文来源 这篇论文由Sizhe Liu、Yuchen Liu、Haofeng Xu、Jun Xia和Stan Z. Li共同撰写。他们分别来...

基于CNN与扩张采样自注意力和特征交互Transformer的ABVS乳腺肿瘤分割

基于CNN与Dilated Sampling Self-Attention的ABVS乳腺肿瘤分割研究 学术背景 乳腺癌是全球范围内第二大常见癌症,早期和准确的检测对于改善患者预后和降低死亡率至关重要。尽管目前有多种成像技术(如X线乳腺摄影、磁共振成像和手持超声)被用于乳腺癌的早期筛查,但这些技术往往面临分辨率有限或操作依赖性强等问题。为了解决这些问题,自动化乳腺容积扫描仪(Automated Breast Volume Scanner, ABVS)应运而生。ABVS能够自动获取整个乳房的全面视图,但其图像分析仍然具有挑战性,主要由于乳腺肿瘤在大小、形状和位置上的显著差异。近年来,深度学习在医学图像分析中取得了显著进展,尤其是卷积神经网络(CNN)和变换器(Transformer)在肿瘤分割和...

利用深度学习量化与神经认知变化相关的大脑老化速度

随着全球老龄化问题的加剧,神经退行性疾病(如阿尔茨海默病,Alzheimer’s Disease, AD)的发病率逐年上升。大脑老化(Brain Aging, BA)是神经退行性疾病的重要风险因素之一,但其与生理年龄(Chronological Age, CA)并不完全一致。传统的大脑老化评估方法主要依赖于DNA甲基化时钟,然而,这种方法无法直接反映大脑组织的老化情况,因为血脑屏障(Blood-Brain Barrier)将血液中的细胞与脑细胞分隔开来。因此,如何通过非侵入性手段准确评估大脑老化速度(Pace of Brain Aging, P)成为了一个重要的研究课题。 本研究旨在通过深度学习技术,利用纵向磁共振成像(Longitudinal MRI)数据,开发一种能够量化大脑老化速度的模...