AutoStory:最小限の人的努力で多様なストーリーテリング画像を生成する

AutoStory:最小限の人的努力で多様なストーリーテリング画像を生成する

学術的背景と問題提起 ストーリービジュアライゼーション(Story Visualization)は、テキストで記述されたストーリーから一連の視覚的に一貫した画像を生成することを目的としたタスクです。このタスクでは、生成された画像が高品質であるだけでなく、テキストの記述と一致し、異なる画像間でキャラクターのアイデンティティやシーンが一貫している必要があります。ストーリービジュアライゼーションは、芸術創作、児童教育、文化継承などの分野で幅広い応用が期待されていますが、その複雑さから、既存の手法は特定のキャラクターやシーンのみを考慮したり、ユーザーに画像ごとの制御条件(スケッチなど)を提供することを要求したりすることで問題を大幅に簡略化しています。これらの簡略化により、既存の手法は実際のアプリケー...

行動から自然言語へ:無人航空機意図認識の生成アプローチ

UAVの行動意図認識の生成モデルに基づく研究:行動から自然言語へのクロスモーダルアプローチ 背景と研究目的 近年、無人機(Unmanned Aerial Vehicle, UAV)技術は飛躍的な発展を遂げ、捜索救助、農業精密作業、通信中継などの民間および軍事分野で広く活用されています。しかし、UAV群の規模が拡大し、知能化レベルが向上する中、空中指揮と制御分野における更なる高度な知能化への需要が高まっています。複雑な対抗環境下では「状況認識」(Situation Awareness)を向上することが鍵となり、特にUAVの行動意図を効果的に識別することが重要です。この識別プロセスは、敵の作戦意図と戦術的欺瞞の関係を明らかにし、指揮体系内での情報フローを最適化し、意思決定に対するガイドラインを提...

RADIFF: 電波天文マップ生成のための制御可能な拡散モデル

RaDiff: ラジオ天文学マップ生成のための制御可能な拡散モデルに関するレポート (和訳版) 背景紹介 平方キロメートルアレイ (Square Kilometer Array, SKA) 望遠鏡の建設が終盤を迎え、宇宙研究における革新的な進展が期待されています。SKAはこれまでにない感度と空間分解能を実現する一方で、既存の望遠鏡が生み出す膨大なデータは、効率的に処理可能な手法を必要としています。特に、背景ノイズが顕著で形状が複雑な電波画像 (例えば銀河面) を扱う場合は、効率的な自動化と科学情報抽出が重要です。 ここ数年で、深層学習 (Deep Learning) はラジオ天文学にも多様な形で活用されています。一方で、この手法は大量の高品質なアノテーションデータセットを必要とするため、デー...

分子リンカー設計のための等変3D条件付き拡散モデル

分子リンカー設計のための等変3D条件付き拡散モデル

早期の医薬品発見に従事する研究者は、およそ10の60乗の可能な分子構造の中から、薬理活性を持つ候補分子を見つけるという大きな課題に直面しています。この問題を解決する1つの有効な方法は、より小さな「フラグメント」分子から始めることで、この戦略はフラグメントベースの医薬品設計(FBDD)と呼ばれています。FBDDプロセスでは、まず計算機を使ってターゲットタンパク質の結合ポケットに結合するフラグメントを選別し、次にそれらのフラグメントを1つの化合物に接続します。フラグメントを接続する際には、フラグメントの幾何学的な構造とタンパク質ポケットの構造を考慮して、高い親和性を持つ潜在的な医薬品分子を設計する必要があります。 この論文では、DiffLinkerという新しいリンカー(linker)分子設計手法...