大规模基因组测序研究中的高效存储与回归计算

随着大规模人口生物样本库的日益普及,全基因组测序(Whole Genome Sequencing, WGS)数据在人类健康和疾病研究中的潜力得到了显著提升。然而,WGS数据的庞大计算和存储需求给研究机构,尤其是资金不足的机构或发展中国家的研究人员带来了巨大挑战。这种资源分配的不平等限制了前沿遗传学研究的公平性。为了解决这一问题,Manuel A. Rivas和Christopher Chang等人开发了新的算法和回归方法,显著减少了WGS研究的计算时间和存储需求,特别是针对罕见变异的处理。 论文来源 这篇论文由Manuel A. Rivas和Christopher Chang共同撰写。Rivas来自斯坦福大学生物医学数据科学系,Chang则供职于Grail Inc.。该论文于2025年2月1...

大规模全基因组测序研究中的多性状稀有变异分析统计框架

多重性状罕见变异分析的新框架:Multistaar 研究背景与问题阐述 随着下一代测序技术的进步和全基因组测序(Whole-Genome Sequencing, WGS)成本的降低,研究者们能够更深入地探讨罕见变异对复杂人类性状的影响。然而,单个性状分析方法在检测罕见变异关联时往往缺乏足够的统计功效,尤其是在面对多民族样本和复杂遗传结构的情况下。此外,许多遗传变异具有多重效应(pleiotropy),即一个基因可以影响多个性状,因此需要一种能同时分析多个性状的方法来提高检测能力。 现有的多性状罕见变异分析方法虽然显示了比单个性状分析更高的统计功效,但在处理大规模WGS数据时面临计算瓶颈,并且未能充分利用功能注释信息,导致解释力和统计功效的损失。为了解决这些问题,研究人员开发了一种新的统计框架...