共有ペプチドを用いたプロテオミクス実験におけるタンパク質および翻訳後修飾の相対定量:重みベースのアプローチ
プロテオミクス研究において、質量分析(Mass Spectrometry, MS)はタンパク質の豊度や構造変化を分析するために広く使用されています。しかし、タンパク質の定量分析には重要な課題があります。多くのタンパク質が同じペプチド(shared peptides)を共有しているため、これらのペプチドが複数のタンパク質配列に現れることがあります。従来の方法は通常、ユニークペプチド(unique peptides)のみに依存してタンパク質を定量しており、共有ペプチドの情報を無視しているため、定量結果に偏りや不正確さが生じる可能性があります。特に、タンパク質アイソフォーム(protein isoforms)や翻訳後修飾(post-translational modifications, PTMs)を研究する際、共有ペプチドの存在により定量分析がさらに複雑になります。
この問題を解決するため、研究者たちは新しい統計手法を提案し、共有ペプチドの定量情報を活用して、タンパク質の豊度やPTMsのサイト占有率をより正確に推定することを目指しました。この手法は、共有ペプチドの定量パターンを個々のタンパク質または修飾サイトの豊度の凸結合(convex combination)としてモデル化し、各ソースの豊度とその重みを推定することで、定量分析の精度を向上させます。
論文の出所
この研究は、ポーランドのヴロツワフ大学(University of Wrocław)、ベルギーのハッセルト大学(Hasselt University)、アメリカのノースイースタン大学(Northeastern University)、Genentech社、およびPfizer社など、複数の機関の研究者チームによって共同で行われました。論文の主な著者にはMateusz Staniak、Ting Huang、Amanda M. Figueroa-Navedoなどが含まれ、連絡著者はOlga Vitekです。この論文は2025年にBioinformatics誌に掲載され、タイトルは《Relative quantification of proteins and post-translational modifications in proteomic experiments with shared peptides: a weight-based approach》です。
研究の流れと結果
1. 研究デザイン
この研究では、共有ペプチドが存在する場合に、複数のタンパク質またはPTMサイトの豊度を同時に推定するための新しい統計モデルを提案しました。この手法は、質量分析実験の定量情報、特に同位体標識(isobaric labeling)技術(例:TMT, Tandem Mass Tags)を使用した実験データに基づいています。研究チームは、この手法を実装するためのオープンソースのRパッケージmsstatsweightedsummaryを開発しました。
2. モデルの構築
このモデルの核心は、共有ペプチドの定量パターンを複数のタンパク質またはPTMサイトの豊度の加重結合としてモデル化することです。具体的には、各ペプチドについて、異なるタンパク質またはPTMサイトに対する寄与の重みを推定し、これらの重みに基づいて各タンパク質またはPTMサイトの豊度を計算します。モデルの形式は以下の通りです:
[ x{cf} = \mu + \sum{k \in V(f)} \text{weight}_{fk} (\text{protein}k + \text{channel}{kc}) + \text{feature}f + \epsilon{cf} ]
ここで、(x_{cf})はペプチド(f)のチャネル(c)における対数強度を表し、(\mu)は全体的な豊度の平均値、(\text{protein}k)はタンパク質(k)の豊度、(\text{channel}{kc})はチャネル(c)がタンパク質(k)に与える影響、(\text{feature}f)はペプチド(f)の特異的効果、(\epsilon{cf})はランダム誤差を表します。
3. 最適化と実装
モデルパラメータを推定するため、研究チームは反復最適化アルゴリズムを採用しました。まず、ユニークペプチドに基づいてタンパク質の初期豊度を推定し、その後、共有ペプチドの重みとタンパク質の豊度を段階的に更新し、重みが収束するまで繰り返します。この手法では、外れ値に対処するためにHuber損失関数(Huber loss)を使用し、モデルの頑健性を確保しました。
4. 実験結果
研究チームは、シミュレーションデータと実際の実験データを用いてこの手法の有効性を検証しました。シミュレーションデータでは、この手法は対数倍変化(log2-fold change)推定の精度を大幅に向上させ、特にタンパク質が少数のユニークペプチドしか持たない場合に効果的でした。実際の実験では、この手法はタンパク質分解研究、サーモプロテオーム安定性分析、PTM定量分析など、さまざまな生物学的研究において適用され、その幅広い有用性が証明されました。
4.1 タンパク質分解研究
タンパク質分解研究では、研究チームはBETブロモドメインタンパク質(BET bromodomain proteins)の分解動態を分析しました。共有ペプチドの情報を使用することで、この手法は異なるタンパク質の分解速度をうまく区別し、実際の応用における有効性を実証しました。
4.2 サーモプロテオーム分析
サーモプロテオーム分析では、研究チームは異なる温度下でのタンパク質の安定性を比較しました。共有ペプチドの定量情報を導入することで、この手法はタンパク質の熱安定性変化の検出感度を向上させ、特にタンパク質が少数のユニークペプチドしか持たない場合に効果的でした。
4.3 PTM定量分析
PTM定量分析では、研究チームはリン酸化サイトの変化を研究しました。共有ペプチドの定量情報をモデルに組み込むことで、この手法は異なるリン酸化サイトの変化パターンをうまく区別し、PTM定量分析の精度を向上させました。
5. 結論
この研究では、共有ペプチドに基づく加重統計手法を提案し、タンパク質およびPTM定量分析の精度を大幅に向上させました。この手法は、共有ペプチドの定量パターンをモデル化することで、共有ペプチドが存在する場合の従来の手法の定量バイアスを解決し、プロテオミクス研究に新たなツールを提供しました。
研究のハイライト
- 革新的な手法:この研究は、共有ペプチドに基づく加重統計モデルを初めて提案し、プロテオミクス定量分析の空白を埋めました。
- 幅広い適用性:この手法はタンパク質定量だけでなく、PTMサイトの定量分析にも適用可能であり、幅広い応用が期待されます。
- オープンソースツール:研究チームはオープンソースのRパッケージmsstatsweightedsummaryを開発し、他の研究者がこの手法を利用・拡張することを容易にしました。
研究の意義
この研究は、プロテオミクス定量分析に新たな視点と手法を提供し、特に共有ペプチドを扱う際に定量結果の正確性と信頼性を大幅に向上させました。この手法の応用により、タンパク質の機能と制御メカニズムの理解がさらに深まり、プロテオミクスが生物医学研究においてより広く活用されることが期待されます。