少数の注釈付きピクセルとポイントクラウドに基づく運転シーンの弱教師ありセマンティックセグメンテーション

少量のピクセルラベルと点群データを用いた自動車運転シーンの弱教師ありセマンティックセグメンテーション 背景と研究課題 セマンティックセグメンテーションは、コンピュータビジョンにおける重要な課題の一つであり、自動運転などの分野で広く応用されています。しかし、従来の完全教師ありセグメンテーション手法では、大量のピクセル単位のアノテーションが必要であり、そのコストは非常に高いです。 弱教師ありセグメンテーション(Weakly Supervised Semantic Segmentation、WSSS)は、ラベル付きデータが少ない状況で高精度なセグメンテーションを実現することを目的とし、画像ラベルやバウンディングボックス、点レベルのラベルなどの粗いアノテーションを利用して、ピクセル単位のセグメンテー...

ターゲットからソースへの引き込み:ドメイン適応型セマンティックセグメンテーションの新しい視点

ドメイン適応セマンティックセグメンテーションにおける新たな視点:T2S-DAの研究 背景と研究の重要性 セマンティックセグメンテーションは、コンピュータビジョン分野において重要な応用を持つが、その性能は大量のアノテーションデータに依存することが多い。しかし、アノテーションデータの収集は特に複雑なシーンでは非常にコストが高いため、多くの研究がアノテーション要件を軽減するために合成データの利用に注目している。しかし、ドメイン間のギャップ(domain gap)の存在により、合成データで学習されたモデルが現実のシナリオに一般化するのは難しい。このような状況で、無教師ドメイン適応(Unsupervised Domain Adaptation, UDA)手法がこの問題を解決するための効果的なアプローチ...

二段階のカテゴリ整合に基づく教師なしドメイン適応セグメンテーションアルゴリズム

二段階のカテゴリ整合に基づく教師なしドメイン適応セグメンテーションアルゴリズム

语義セグメンテーションは画像内の各ピクセルに対してクラスラベルを予測することを目的としており(Liu et al., 2021; Wang et al., 2021)、シーンの理解、医療画像解析、自動運転、地理情報システム、拡張現実などに広く応用されています(Strudel et al., 2021; Sun et al., 2023)。深層神経ネットワークの発展により、セグメンテーションタスクの性能が大幅に向上しましたが(Chen et al., 2014; Guan et al., 2021; Zhao et al., 2017)、これらの進歩はモデルの訓練に大量のピクセルレベルのアノテーションデータを必要とし、これらのデータの取得は現実の場面では高コストです(Jiang et al.,...

セマンティックセグメンテーションのためのスタック型デコンボリューションネットワーク

セマンティックセグメンテーションのためのスタック型デコンボリューションネットワーク

セマンティックセグメンテーションのためのスタック反畳み込みネットワーク はじめに セマンティックセグメンテーションはコンピュータビジョン分野における重要なタスクであり、画像の各ピクセルを分類してそのカテゴリを予測することを目指しています。しかし、既存の完全畳み込みネットワーク(Fully Convolutional Networks, FCNs)は、空間解像度の処理において制限があり、物体の境界がぼやけたり小さな物体が見逃されたりする問題があります。これらの問題を解決するために、本論文ではセマンティックセグメンテーションの効果を向上させるために、スタック反畳み込みネットワーク(Stacked Deconvolutional Network, SDN)を提案します。 研究背景 深層畳み込み神経...

代替セルフデュアル教育による弱教師ありセマンティックセグメンテーション

代替セルフデュアル教育による弱教師ありセマンティックセグメンテーション

代替二重教師自己調整学習による弱監督セマンティック画像分割実現 背景紹介 コンピュータビジョンの分野の発展に伴い、セマンティック分割はその中で重要かつ活発な研究方向の一つとなっています。従来のセマンティック分割方法は手動でラベリングされたピクセルレベルのラベルに依存していますが、これらの精密なアノテーションの取得には通常多大な人力と時間コストがかかります。この問題を解決するために、近年、弱監督セマンティック分割(Weakly Supervised Semantic Segmentation, WSSS)が提案され、これは人工アノテーションを最小限に抑えつつ、弱いアノテーション情報(画像ラベル、バウンディングボックス、塗りつぶしなど)を利用して効率的なセマンティック分割を実現することを目指して...