歩行中の視覚のディープラーニングを用いた転倒リスク評価の強化

はじめに 転倒事故は複数の臨床群で一般的であり、通常のリスク評価には個人の歩行の視覚的観察が含まれます。しかし、歩行の観察評価は通常、転倒リスクを増加させる可能性のある欠陥を特定するために、実験室内で個人に標準化された歩行プロトコルテストを行うことに限定されており、微妙な欠陥は観察されにくい可能性があります。そのため、客観的な方法(例えば慣性計測ユニット、IMUs)は、高解像度の歩行特性を定量的に分析するのに有用であり、微妙な違いを捉えることで転倒リスク評価の情報量を向上させるのに役立ちます。しかし、IMUのみに依存した歩行の器械化分析には限界があり、参加者の行動や環境の詳細(例えば障害物)を考慮していません。ビデオアイトラッカーは、頭部と目の動きを記録することで、人々が頭部と目の動きに基づ...

360° 画像における物体検出の視野IoU

FOV IoUを利用した360°画像における物体検出 360°カメラは近年、仮想現実、自動運転、安全監視などの多くの分野で広く利用されています。360°画像データの増加に伴い、特に物体検出のニーズも高まっています。従来の方法では360°画像処理に不十分であるとして、Miao Cao、Satoshi Ikehata、Kiyoharu Aizawaの研究者らは、360°画像における物体検出の効果を改善するために、視野IoU(Field-of-View Intersection over Union、略称FOV-IoU)と360augmentationの二つの基本技術を提案しました。 背景と研究動機 現代のほとんどの物体検出ニューラルネットワークは透視画像用に設計されていますが、等距離長方形投影(...

畳み込みカーネルの有効受容野の変更

GMConv:神経ネットワークの畳み込みカーネルの有効受容野の調整を実現 はじめに 畳み込みニューラルネットワーク(Convolutional Neural Networks、以下CNN)は、畳み込みカーネルの使用により画像分類や物体検出などのコンピュータービジョンタスクで顕著な成功を収めてきました。しかし、近年ではビジョントランスフォーマー(Vision Transformers、以下ViT)が注目を浴びており、これらは視覚認識タスクで優れた性能を発揮し、時にはCNNを超えることもあります。それにもかかわらず、CNNの改善に向けた取り組みは止まることなく、多くの研究が新しいCNNアーキテクチャの設計に取り組んでいます。特に大きな畳み込みカーネルを使用するCNNは、最新のViTに匹敵する性能...