人类基因组中的广泛特殊阴阳单倍型

人类基因组中普遍存在的独特阴阳单倍型

研究背景

在基因组学的研究中,阴阳单倍型(yin yang haplotypes)指的是在每个位点上均不同的两种单倍型对。此前已有一些独立的报告指出存在独特的阴阳单倍型,但并未进行系统性的搜索。因此,为了更好地理解阴阳单倍型在整个基因组中的分布和形成机制,本研究对整个基因组进行了详细而系统的搜索。

研究来源

本文由David Curtis和William Amos撰写,分别来自UCL Genetics Institute和Department of Zoology, University of Cambridge。本文于2023年6月12日在线发表在European Journal of Human Genetics上。

研究流程

样本获取与准备: - 使用从1000 Genomes项目下载的2504个高覆盖率全基因组数据。 - 数据涵盖26个种群,分为5个超级种群:非洲(afr)、美洲(amr)、东亚(eas)、欧洲(eur)和南亚(sas)。

数据处理: - 提取了所有次要等位基因频率(minor allele frequency, maf)>= 0.1的二等位性自体染色体和X染色体SNPs。 - 计算每对变体的平均基因型距离,用于识别具有完整或几乎完整LD(连锁不平衡)的SNPs群。

阴阳单倍型识别: - 搜索所有变体链,确保每对变体的平均基因型距离不超过0.0015,且每对变体间隔不超过9个其它变体。 - 将这些变体链定义为独特的阴阳单倍型,每条链必须包含至少20个这样的变体。

过滤和确认: - 排除重复序列以及覆盖已知替代序列或patches的假定阴阳单倍型。 - 对于每个SNP,获取其RR、RA或AA基因型的个体数。 - 通过高读数深度和等位基因平衡的标准差来识别并排除可能的重复序列。

后续分析: - 计算所有阴阳单倍型的重组率和背景变异。 - 评估阴阳单倍型中变体的祖先来源,使用黑猩猩、尼安德特人和现代人类的全基因组序列数据。 - 执行基因和基因本体分析,寻找阴阳单倍型与特定表型的关联。

主要发现

阴阳单倍型的分布和特征

  • 研究发现了5114个独特的阴阳单倍型,每个平均包含34.8个SNPs,跨度平均为15.7 kb,共覆盖了80 mb,占人类基因组的约2.6%。
  • 重组率在阴阳单倍型内平均为0.061 cm/mb,显著低于基因组平均重组率。
  • 每个超级种群的单核苷酸多态性(SNPs)的密度和异质性在阴阳单倍型内和其他基因组区域间差异不大,但阴阳单倍型内的异质性略高。

祖先来源和形成机制

  • 阴阳单倍型的变体在黑猩猩和尼安德特人基因组中大多仅以部分形式存在,表明这些单倍型是逐渐形成的,而不是通过一次突变事件出现的。
  • 研究发现一些单倍型在黑猩猩和尼安德特人中具有完全一致的祖先等位基因,暗示这些单倍型在现代人类中形成的时间点。
  • 部分单倍型表现出混合的祖先来源,提供了阴阳单倍型通过早期单倍型间的重组事件形成的证据。

基因和表型关联

  • 约42.5%的阴阳单倍型与至少一个基因重叠,但并未表现出明显的基因本体富集。
  • 研究在阴阳单倍型的主导SNP与多种表型之间的关联,但因为缺乏足够的样本和控制群体的变异性,难以得出结论。

研究的科学价值和应用价值

本研究表明,独特的阴阳单倍型在整个基因组中并不罕见,并覆盖了人类基因组的相当一部分。尽管其形成机制尚不清楚,但阴阳单倍型的存在可能会挑战现有的遗传变异及其在种群中的传播模型。此外,由于这些单倍型由连续的DNA序列构成,能完整地被继承,因此在研究染色体区域在遗传历史中的分布时具有重要的标记作用。

研究亮点

  1. 普遍存在: 研究系统性地发现了在人类基因组中普遍存在的独特阴阳单倍型,覆盖了基因组的2.6%。
  2. 低重组率: 阴阳单倍型内的重组率远低于基因组平均重组率,表明重组事件在这些区域受到抑制。
  3. 祖先来源: 通过比较黑猩猩和尼安德特人的基因组数据,揭示了单倍型的渐进形成机制。
  4. 表型关联: 尽管找到了一些表型关联,但需要更多的样本和控制群体变异来得出更明确的结论。

研究的潜在挑战和进一步方向

虽然研究揭示了阴阳单倍型的存在和初步特征,但其形成机制和功能意义尚需进一步研究。未来的工作可以集中在: - 鉴定影响这些区域重组率的特定分子机制。 - 扩大样本量和种群多样性,进一步验证阴阳单倍型与表型和功能的关联。 - 使用更高分辨率的全基因组测序技术,进一步确认和探究阴阳单倍型的精确结构和功能。

本文为基因组学研究提供了新的视角,并为未来的研究奠定了基础。