前蛋白转化酶Furin作为新的动脉瘤易感基因影响TGF-β信号传导

学术背景 主动脉瘤(Aortic Aneurysm, AA)是一种主动脉异常扩张的疾病,常见于腹主动脉和胸主动脉。主动脉瘤在65岁以上人群中发病率较高,若未及时诊断和治疗,可能导致致命的破裂。尽管年龄、吸烟、高血压和男性性别被认为是重要的风险因素,但这些因素既非必要也不充分,表明遗传易感性在疾病发生中起着关键作用。目前,大多数主动脉瘤病例,甚至家族性主动脉瘤,尚未找到已知的致病基因变异。仅有约2%的非选择性腹主动脉瘤患者和5%的非选择性胸主动脉瘤患者在已知的主动脉瘤基因中携带(可能)致病性变异。这表明,大多数主动脉瘤具有复杂的遗传背景,可能涉及多个基因的相互作用。 转化生长因子β(Transforming Growth Factor-β, TGF-β)信号通路在主动脉瘤的发生中起着重要作用。...

基于尺度空间显著性的Hi-C数据分析方法

在基因组学领域,理解基因组的空间组织对于揭示基因调控机制至关重要。Hi-C技术作为一种全基因组染色体构象捕获技术,能够揭示基因组的三维结构,特别是染色质环(chromatin loops)在基因调控中的关键作用。然而,现有的Hi-C数据分析方法通常只能识别共享的染色质环,而难以检测细胞类型特异性的染色质环。这限制了我们对不同细胞类型中基因调控机制的理解。为了解决这一问题,Rui Liu等人提出了一种新的算法——SSSHiC(Significance in Scale Space for Hi-C Data),旨在通过尺度空间分析来识别细胞类型特异性的染色质环,从而更好地理解基因调控的细胞特异性。 论文来源 这篇论文由Rui Liu、Zhengwu Zhang、Hyejung Won和J. S...

MMNC——一种多模态可解释的非编码RNA分类方法

非编码RNA(ncRNA)在细胞过程和疾病发展中扮演着关键角色。尽管基因组测序项目揭示了大量非编码基因的存在,但ncRNA的功能和分类仍然是一个复杂且具有挑战性的问题。ncRNA的多样性、复杂性和功能性使其成为生物医学研究的重要对象,尤其是在生物标志物和治疗靶点的发现中。然而,现有的ncRNA分类工具大多仅依赖于单一或两种数据类型(如序列或二级结构),忽略了其他可能提供重要信息的数据源。此外,现有方法通常缺乏可解释性,难以揭示不同ncRNA类别的特征。 为了解决这些问题,来自Université Paris-Saclay和Institut Curie的研究团队提出了一种名为MMNC(Multi-Modal Interpretable Representation for Non-Coding...

基于多密钥同态加密的基因组计算隐私保护框架

基因组分析的隐私保护框架:基于多密钥同态加密的研究 学术背景 随着基因组测序成本的降低,基因组数据的广泛可用性为个性化医疗(也称为基因组医学)开辟了新的可能性。然而,基因组数据包含大量敏感信息,如疾病易感性、祖先信息和身体特征,这些信息的隐私问题成为了医学研究和数据共享的重大障碍。尽管研究人员已经提出了多种隐私保护技术,但现有的基于密码学的方法在互操作性、可扩展性、隐私保护程度以及多方分析支持方面仍存在不足。这些局限性限制了基因组数据的潜力,阻碍了其在医学研究中的应用。因此,开发一种既能保护隐私又能支持多方基因组数据处理的加密技术成为了迫切需求。 论文来源 这篇论文由Mina Namazi、Mohammadali Farahpoor、Erman Ayday和Fernando Pérez-Go...

基于Transformer模型的DNA序列比对方法研究

学术背景 DNA序列比对是基因组学中的一项核心任务,旨在将短DNA片段(reads)定位到参考基因组上的最可能位置。传统方法通常分为两个步骤:首先对基因组进行索引,然后通过高效搜索定位reads的可能位置。然而,随着基因组数据的爆炸式增长,尤其是面对长达数十亿碱基的参考基因组时,传统的比对方法在计算效率和准确性上面临巨大挑战。近年来,Transformer模型在自然语言处理(NLP)领域的成功启发了研究人员将其应用于DNA序列分析。尽管已有研究表明Transformer模型在短DNA序列分类任务中表现优异,但序列比对任务需要在整个基因组范围内进行搜索,这对模型的全局搜索能力提出了更高要求。 为此,本研究提出了一种名为“embed-search-align”(ESA)的新框架,旨在通过Tran...

单细胞拷贝数变异与事件历史重建的SCICONE模型

肿瘤的发展过程中,基因组拷贝数变异(Copy Number Alterations, CNAs)是驱动肿瘤异质性和进化的重要因素。理解这些变异对于开发个性化的癌症诊断和治疗方法至关重要。单细胞测序技术提供了最高分辨率的拷贝数分析,能够深入到单个细胞水平。然而,低读深(low read-depth)的全基因组测序数据给拷贝数变异的检测带来了巨大的统计和计算挑战。现有的计算方法大多忽略了细胞之间的进化关系,导致检测结果不够准确。因此,开发一种能够结合细胞进化历史的拷贝数检测方法成为当前研究的迫切需求。 论文来源 本论文由ETH Zurich(瑞士联邦理工学院)和SIB Swiss Institute of Bioinformatics(瑞士生物信息学研究所)的研究团队共同完成,主要作者包括Jac...

GCLink:一种用于基因调控网络推断的图对比链接预测框架

研究背景 基因调控网络(Gene Regulatory Networks, GRNs)是理解细胞内复杂生物过程的关键工具。它揭示了转录因子(Transcription Factors, TFs)与靶基因之间的相互作用,从而控制基因的转录过程,进而调控细胞行为。随着单细胞RNA测序(single-cell RNA-sequencing, scRNA-seq)技术的发展,研究者能够在单细胞分辨率下获取基因表达数据,这为GRNs的推断提供了前所未有的机会。然而,scRNA-seq数据的稀疏性和高变异性为GRNs的推断带来了巨大挑战。 现有的GRN推断方法主要分为两类:基于相关性或互信息的无监督学习方法,以及基于机器学习的监督学习方法。尽管这些方法在某些情况下表现出色,但它们往往依赖于成对基因的相关...

单细胞转录组学中的轨迹对齐:Tragedy方法的创新与应用

单细胞转录组测序(single-cell RNA sequencing, scRNA-seq)技术的出现,为研究细胞发育和分化过程中的基因表达动态提供了前所未有的分辨率。然而,由于生物过程的复杂性,不同条件下的细胞发育轨迹往往是不对称的,这给数据的整合和比较带来了挑战。现有的方法通常依赖于将不同条件下的样本整合后再进行聚类分析或推断共享轨迹,但这些方法在处理不对称轨迹时往往效果不佳,可能会掩盖关键的差异表达基因(differentially expressed genes, DEGs)。 为了解决这一问题,研究人员开发了一种新的方法——Trajectory Alignment of Gene Expression Dynamics (Tragedy)。Tragedy方法能够在不进行数据集整合...

大规模基因组测序研究中的高效存储与回归计算

随着大规模人口生物样本库的日益普及,全基因组测序(Whole Genome Sequencing, WGS)数据在人类健康和疾病研究中的潜力得到了显著提升。然而,WGS数据的庞大计算和存储需求给研究机构,尤其是资金不足的机构或发展中国家的研究人员带来了巨大挑战。这种资源分配的不平等限制了前沿遗传学研究的公平性。为了解决这一问题,Manuel A. Rivas和Christopher Chang等人开发了新的算法和回归方法,显著减少了WGS研究的计算时间和存储需求,特别是针对罕见变异的处理。 论文来源 这篇论文由Manuel A. Rivas和Christopher Chang共同撰写。Rivas来自斯坦福大学生物医学数据科学系,Chang则供职于Grail Inc.。该论文于2025年2月1...

胶质母细胞瘤患者血管毒性的临床和遗传标志物:NRG肿瘤学RTOG-0825的见解

胶质母细胞瘤患者血管毒性的临床与遗传标志物研究:NRG Oncology RTOG-0825的启示 学术背景 胶质母细胞瘤(Glioblastoma, GBM)是一种高度侵袭性的脑癌,占恶性原发性脑肿瘤的近80%。尽管标准治疗包括手术切除、放疗和化疗,但患者的生存期仍然较短,中位生存期仅为12-15个月。治疗过程中,血管毒性(如血栓形成和高血压)是常见的副作用,可能导致治疗中断或死亡。特别是,血栓形成与GBM患者的生存率下降相关,而高血压则与较长的无进展生存期和总生存期相关。因此,识别这些血管毒性的风险因素对于改善临床决策和治疗效果至关重要。 本研究旨在通过临床和遗传标志物,探索GBM患者在治疗期间发生血栓形成和高血压的风险因素,并评估这些标志物在预测血管毒性中的作用。 论文来源 本研究由J...