グラフニューラルネットワークを用いた効果的な感情認識のためのライン会話グラフ

新しいグラフニューラルネットワークに基づく対話感情認識の手法 研究背景 感情認識(Emotion Recognition, ER)は、人間とコンピュータの相互作用(Human-Computer Interaction, HCI)において重要な構成要素であり、音声、テキスト、ビデオなどのマルチモーダルデータを分析して、人間の感情状態を識別することを目指します。この技術は、医療、教育、ソーシャルメディア、チャットボットなどの分野で幅広い応用が期待されています。近年、感情認識の研究は単文感情分析から対話感情認識(Emotion Recognition in Conversations, ERC)に移行しており、これは対話中の各発言の感情状態を識別することを指します。単文感情分析と比較すると、対話感...

参照表現セグメンテーションと生成のための相互監視フレームワーク

参照表現セグメンテーションと生成のための相互監視フレームワーク

指表現セグメンテーションと生成のための相互監督フレームワーク 研究背景と問題提起 近年、視覚と言語の相互作用技術は人工知能分野で顕著な進展を遂げています。その中で、指表現セグメンテーション(Referring Expression Segmentation, RES)と指表現生成(Referring Expression Generation, REG)という2つのコアタスクは、それぞれ自然言語記述に基づいて画像内の対象オブジェクトを特定し、そのセグメンテーションマスクを生成する、または特定の対象に対して明確かつ正確な言語記述を生成することを目指します。これらのタスクは本質的に逆の関係にありますが、研究は通常別々に行われており、どのように相互に促進できるかを体系的に議論する方法が欠けています...

セマンティック分析と神経画像メタ分析によるドメイン一般覚醒の証拠は、覚醒に関する相反する見解を調和させます

「ドメイン一般性覚醒」に関する神経科学研究レポート 学術背景 覚醒(Arousal)は、神経科学の核心概念であり、大脳と身体状態の変動を指し、通常は動機付けられた行動と関連しています。覚醒という用語は広く使用されていますが、その定義は不明確で、教科書によって異なる解釈があります。一つの見解では、覚醒は多様な生物過程の抽象的な反映であるとされ、別の見解では共通の神経学的基礎があるとされます。この概念的な対立により、覚醒の分類と定義は解決すべき重要な問題となっています。さらに、覚醒に関する科学文献は非常に豊富(約50,000編の論文)ですが、系統的なレビューやデータ駆動型の分析による本質の解明はこれまでありませんでした。この空白を埋めるために、本研究では大規模テキストマイニング技術と神経イメージ...

FPGA上RNN加速用効率的CORDICベース活性化関数手法

RNNの効率的な活性化関数実現:CORDICアルゴリズムとFPGAハードウェア加速の革新 背景と研究の重要性 近年、ディープラーニング技術の急速な発展に伴い、特にリカレントニューラルネットワーク(Recurrent Neural Networks, RNNs)および長短期記憶ネットワーク(Long Short-Term Memory, LSTM)が、自然言語処理(Natural Language Processing, NLP)、音声認識、医療診断などの時間系列タスクにおいて強力な能力を発揮しています。しかし、畳み込みニューラルネットワーク(Convolutional Neural Networks, CNNs)と比較して、RNNモデルはその複雑性および非線形活性化関数の需要が多いため、計算...

ソーシャルメディアにおけるグルカゴン様ペプチド-1受容体作動薬に対する一般の認識を評価するための大規模言語モデルの使用

在全球範囲において、肥満の流行傾向が絶えず高まり、公衆衛生に重大な影響を与えています。肥満は独立して心血管疾患の発症率および死亡率に関連しており、毎年衛生システムに対して2,000億ドルを超える経済的負担をもたらすと推定されています。近年、インスリン・グルカゴン様ペプチド-1(GLP-1)受容体作動薬は体重減少および心血管リスクの低減に糖尿病とは無関係に効果を示すことから、治療の方法を変えるものとなっています。この背景の中、スタンフォード大学のスレイマン・ソマニ、スネハ・S. ジャイン、アシシュ・サラジュ、アレクサンダー・T. サンドゥー、ティナ・ヘルナンデス-ブサール、およびファティマ・ロドリゲスらは、GLP-1受容体作動薬に関するソーシャルメディアでの公衆認識に関する研究を行い、『Com...

EHR-HGCN: 電子カルテにおける異種グラフ畳み込みネットワークを使用したテキスト分類のための強化ハイブリッドアプローチ

EHR-HGCN: 電子カルテにおける異種グラフ畳み込みネットワークを使用したテキスト分類のための強化ハイブリッドアプローチ

EHR-HGCN:電子健康記録テキスト分類の新しいハイブリッド異種グラフ畳み込みネットワーク方法 学術的背景紹介 自然言語処理(NLP)の急速な発展に伴い、テキスト分類はこの分野の重要な研究方向の一つとなりました。テキスト分類は、文献の背後にある知識を理解するのを助けるだけでなく、生物医学テキスト、特に電子健康記録(Electronic Health Records, EHR)などの分野でも広く応用されています。既存の研究は主に双方向トランスフォーマーに基づくエンコード表現方法(BERTなど)や畳み込みニューラルネットワーク(CNN)を利用した深層学習方法に集中しています。しかし、これらの方法は医学長文の処理時に入力長さの制限や高い計算資源の需要に直面することが多いです。また、テキスト分類の...

大規模言語モデルと知識グラフの統合:ロードマップ

統一大言語モデルと知識グラフ 背景 近年、自然言語処理と人工知能の分野には多くの研究成果が現れており、その中でも大言語モデル(Large Language Models, LLMs)として知られるChatGPTやGPT-4が優れた成果を示しています。しかし、これらのモデルは優れた一般化能力を持ちながらも、そのブラックボックス性から事実知識を効果的に捕捉しアクセスすることが困難とされ批判を受けることも多いです。一方、知識グラフ(Knowledge Graphs, KGs)として知られるWikipediaやHuapuは、構造化形式で大量の事実知識を保存していますが、知識グラフの構築と進化のプロセスは非常に複雑です。そこで、研究者たちは大言語モデルと知識グラフを組み合わせ、それぞれの長所を生かして...

電子健康記録における健康の社会的決定要因を識別するための大規模言語モデル

大規模言語モデルによる電子健康記録中の健康の社会的決定要因の識別 背景と研究の動機 健康の社会的決定要因(Social Determinants of Health, SDOH)は患者の健康結果に重要な影響を与えます。しかし、電子健康記録(EHR)の構造化データにおいて、これらの要因の記録はしばしば不完全または欠落しています。大規模言語モデル(Large Language Models, LLMs)はEHRの叙述的なテキストからSDOHを高通量で抽出し、研究や臨床ケアを支援することが期待されています。しかし、カテゴリの不均衡やデータの制約が、このまばらな記録の重要な情報に挑戦をもたらします。本稿では、LLMsを用いてEHRの叙述的テキストから6種類のSDOHカテゴリ(雇用、住居、交通、親の身...