DeepRNA-Twist:言語モデル誘導型RNAねじれ角予測とアテンション-インセプションネットワーク

一、学術的背景と研究動機 生命科学およびバイオインフォマティクスの急速な発展に伴い、RNA分子構造とその機能に関する研究はホットな分野となっている。RNAは単なる遺伝情報の伝達者に留まらず、調節・触媒など数多くの生理過程で重要な役割を果たしている。RNA分子の三次元構造はその生物学的機能に直接影響し、RNA構造の精密な解析は基礎科学、創薬、疾患メカニズム研究などにとって極めて重要である。しかし、RNAの配列から構造への変換はタンパク質よりもはるかに複雑であり、RNAの骨格には7つの主鎖ねじれ角(α, β, γ, δ, ε, ζ, χ)があり、さらに複雑な擬似ねじれ角(η, θ)や非標準塩基対、多重ループ、三重相互作用など多様な構造要因が加わることで、高精度なRNA三次元構造予測が非常に困難と...

Deep scSTAR: 単細胞RNAシーケンシングおよび空間トランスクリプトミクスデータからの表現型関連特徴の抽出と強化のための深層学習の活用

近年、シングルセルRNAシーケンシング(scRNA-seq)及び空間トランスクリプトミクス(spatial transcriptomics, ST)などの先端技術は、生命科学・臨床医学の発展を飛躍的に促進してきました。これらの技術は細胞異質性を明らかにし、疾患、発生、免疫などの重要領域に新たな知見をもたらしました。しかし、大規模シングルセルデータは技術ノイズが強く、バッチ効果(batch effects)が複雑で、生物学的シグナルが多様かつ雑然としているため、「表現型に関連した特徴の正確な抽出と強調」が最大の課題の一つとなっています。多くの従来手法はノイズ除去や統合を主目的としていますが、同時に研究の鍵となる表現型決定シグナルを弱めたり、消失させたりしてしまい、疾患機構や細胞間相互作用の理解...

YOLOv8を使用したリアルタイム密集群衆異常行動検出の強化フレームワーク

学術的背景 公共安全の需要が日増しに高まる中、特にメッカ巡礼(Hajj)のような大規模な宗教行事において、密集した群衆の中での異常行動の検出は重要な課題となっています。既存の検出方法は、遮蔽、照明の変化、統一された服装などの複雑な条件下でしばしば性能が低下し、検出精度が低下する傾向があります。これらの課題に対応するため、研究者たちは、リアルタイム監視の精度と効率を向上させるためのより先進的なコンピュータビジョン技術の開発に取り組んでいます。 本研究の核心は、改良されたYOLOv8モデルであるCrowd Anomaly Detection Framework (CADF)を提案し、Soft-NMS(非極大値抑制のソフト版)技術を統合することで、複雑な環境下での検出精度を大幅に向上させた点にあり...

深層学習における損失関数と性能指標の包括的調査

ディープラーニング(Deep Learning)は、人工知能分野の重要な一分野として、近年コンピュータビジョンや自然言語処理など多くの分野で顕著な進展を遂げています。しかし、ディープラーニングの成功は、損失関数(Loss Function)と性能指標(Performance Metrics)の選択に大きく依存しています。損失関数は、モデルの予測と真の値との差異を測定し、モデルの最適化プロセスを導くために使用されます。一方、性能指標は、未見のデータに対するモデルの性能を評価するために使用されます。損失関数と性能指標はディープラーニングにおいて極めて重要ですが、多くの選択肢があるため、研究者や実務者は特定のタスクに最適な方法を決定することが難しいことがしばしばあります。 このため、本稿では、ディ...

WoTにおけるセキュリティ脅威の検出における課題:系統的文献レビュー

インターネット・オブ・シングス(Internet of Things, IoT)とWeb of Things(Wot)の急速な発展に伴い、セキュリティ問題が顕在化しています。特に、サービス拒否攻撃(Denial of Service, DoS)の頻発により、Wotシステムの安全性は緊急の課題となっています。Wotは、IoTデバイスをWeb技術と統合することで、デバイスとインターネットのシームレスな接続を実現していますが、これにより新たなセキュリティ上の課題も生じています。Wotデバイスの異種性と開放性のため、従来のセキュリティメカニズムでは複雑な攻撃シナリオに対応することが困難です。したがって、本論文では、システマティック・レビュー(Systematic Literature Review,...

深層学習に基づくマルチモーダルデータ統合による乳がん無病生存予測の向上

乳がんは世界の女性の中で最も一般的な悪性腫瘍の一つです。早期介入と適切な治療により、患者の生存率は大幅に向上しましたが、依然として約30%の症例が再発し、遠隔転移を起こし、5年生存率は23%以下となっています。従来の臨床予測方法、例えばバイオマーカー、臨床画像、分子検査などは一定の価値を持っていますが、感度が低く、コストが高く、利用可能性が限られており、患者内の異質性などの問題もあります。そのため、術後乳がん患者の再発リスクと生存率を正確に予測し、タイムリーな介入と全体的な予後改善を可能にする新しい方法の開発が、現在の研究における緊急の課題となっています。 近年、人工知能(AI)技術の急速な発展により、乳がんの予後予測に新たな可能性がもたらされています。ディープラーニングは強力なAI技術とし...

非コードRNAの分類とクラス注釈のための多モーダル解釈可能表現

非コードRNA(ncRNA)は、細胞プロセスや疾患の発症において重要な役割を果たしています。ゲノムシーケンシングプロジェクトによって大量の非コード遺伝子が明らかになりましたが、ncRNAの機能と分類は依然として複雑で挑戦的な問題です。ncRNAの多様性、複雑性、および機能性は、バイオマーカーや治療ターゲットの発見において、特に生物医学研究の重要な対象となっています。しかし、既存のncRNA分類ツールの多くは、単一または2種類のデータタイプ(例えば配列や二次構造)に依存しており、他の重要な情報源を無視しています。さらに、既存の手法は解釈可能性に欠けることが多く、異なるncRNAクラスの特徴を明らかにするのが困難です。 これらの問題を解決するため、Université Paris-Saclayと...

Transformerモデルを用いたDNA配列アラインメントの研究

学術的背景 DNAシーケンスアラインメントは、ゲノム解析における中心的な課題であり、短いDNA断片(リード)を参照ゲノム上の最も可能性の高い位置にマッピングすることを目的としています。従来の方法は通常、2つのステップに分かれています。まずゲノムをインデックス化し、次に効率的な検索を行ってリードの可能性のある位置を特定します。しかし、ゲノムデータの爆発的な増加、特に数十億塩基対の参照ゲノムを扱う場合、従来のアラインメント方法は計算効率と精度の面で大きな課題に直面しています。近年、Transformerモデルが自然言語処理(NLP)分野で成功を収めたことから、研究者はこれをDNAシーケンス解析に応用しようとしています。これまでの研究では、Transformerモデルが短いDNAシーケンスの分類タ...

トランスフォーマーを用いたCryo-EM密度マップの効率的な強化

学術的背景 低温電子顕微鏡(Cryo-EM)は、タンパク質などの巨大分子の構造を解析するための重要な実験技術です。しかし、Cryo-EMの有効性は、低コントラストや構造の異質性などの実験条件によって引き起こされるノイズや密度値の欠損によってしばしば制限されます。既存のグローバルおよびローカルな画像シャープニング技術はCryo-EM密度マップの改善に広く使用されていますが、より正確なタンパク質構造を構築するためにその品質を効率的に向上させることには依然として課題があります。この問題を解決するために、研究者はCryoTenという3D UNETR++スタイルのTransformerモデルを開発し、Cryo-EM密度マップの品質を効果的に向上させることを目指しています。 論文の出典 この論文は、Jo...

情報エントロピー強化BERTと多方向GRUを統合したS-硫化部位予測のためのアンサンブル深層学習法

背景紹介 タンパク質の翻訳後修飾(Post-Translational Modifications, PTMs)は、遺伝子転写、DNA修復、タンパク質相互作用などの細胞活動を調節する重要なメカニズムです。その中でも、システイン(Cysteine)は希少なアミノ酸であり、そのチオール基(Thiol Group)を介して多様なPTMsに関与し、特に酸化還元平衡やシグナル伝達プロセスにおいて重要な役割を果たしています。S-スルフヒドル化(S-Sulfhydration)は重要なPTMの一つであり、心血管疾患や神経疾患の発症と進行に密接に関連しています。しかし、S-スルフヒドル化の具体的なメカニズムは未解明であり、特にその部位の識別において大きな課題が残されています。 従来のS-スルフヒドル化部位の...