音声感情認識のための音声的アンカードメイン適応
跨言語音声感情認識における音素アンカー領域適応に関する研究 学術的背景 音声感情認識(Speech Emotion Recognition, SER)は、インテリジェントエージェント、ソーシャルロボット、音声アシスタント、自動コールセンターシステムなど、幅広いアプリケーションで重要な役割を果たします。グローバル化の進展に伴い、異なる言語間での感情認識(Cross-lingual SER)の需要が増加しています。しかし、異なる言語間での感情表現や音響特性の違いが、主な課題となっています。従来の研究では、主に計算的な視点から特徴、ドメイン、ラベルの適応によって問題に対処してきましたが、言語間の潜在的な共通性については見過ごされていました。 本研究では、母音音素(vowel phonemes)を跨...