ジェノタイプ表現グラフを使用したバイオバンク規模データの効率的な分析

ジェノタイプ表現グラフ(GRG)に基づく研究:バイオデータ分析効率の向上を実現する新たなフレームワーク 学術的背景と研究の動機 シーケンシング技術の急速な進歩に伴い、特に人間の疾病関連研究分野において、大規模なゲノムデータの収集がますます一般的になってきています。2023年末には、英国バイオバンク(UK Biobank)がそのクラウドコンピューティングプラットフォーム上で約50万件の全ゲノムデータをリリースし、そのうち20万件が位相(phased)処理が完了しました。このような膨大なデータセットは研究に前例のない機会を提供しますが、同時に新たな課題ももたらします。すなわち、これほど大規模なゲノムデータを効率的に符号化し分析するにはどうすればよいかという課題です。伝統的な2次元の表形式データ構...