マスク画像モデリング事前学習による強力な軽量ビジョントランスフォーマーの探索に関する実験的研究

軽量級ビジョンTransformerの強力な探索のためのマスク付き画像モデリング事前学習に関する実験的研究 学術的背景 近年、自己教師あり学習(self-supervised learning, SSL)はコンピュータビジョン分野で顕著な進展を遂げています。特に、マスク付き画像モデリング(masked image modeling, MIM)事前学習法は大規模なビジョンTransformer(vision transformers, ViTs)への応用において成功し、これらのモデルに基づく下流タスクのパフォーマンスが大幅に向上しました。しかし、既存の研究は主に大規模ViTsに焦点を当てており、軽量級ViTsに対する事前学習方法とその効果についての研究は比較的少ないです。さらに、多くの研究は複...

前背景時空モデリングによる動画からの心拍数及び呼吸数の推定

ビデオベースの心拍数および呼吸数推定の新しい手法 背景と研究動機 心拍数(Heart Rate, HR)と呼吸数(Respiratory Rate, RR)は、心肺機能を反映する重要な生理学的指標であり、医学、健康モニタリング、心理学や行動研究などで広く利用されています。従来、これらの指標は接触型センサーで測定されてきました。たとえば、心拍数は心電図(Electrocardiography, ECG)や光電容積脈波記録法(Photoplethysmography, PPG)、呼吸数は呼吸ベルトや気流測定装置を用いて評価されます。しかし、接触型手法は、装着時の快適性や皮膚刺激の懸念を含む制約があり、特に遠隔モニタリングのような特定のシナリオでは適用が困難です。 近年、非接触型のビデオベース生理...