計算言語学を用いたパリ気候公約の内容分析
『パリ協定』は、地球規模の気候変動対策における重要な枠組みであり、各国は国家自主貢献(Nationally Determined Contributions, NDCs)を提出することで、気候行動の目標と戦略を明確にしています。既存の研究は主にNDCsの削減目標の評価に焦点を当てていますが、NDCs文書に含まれる広範なテキスト内容はほとんど系統的に分析されていません。これらのテキスト内容は削減目標だけでなく、国家の背景、実施計画、公平性、透明性など多岐にわたる情報を含んでいます。しかし、NDCsの透明性と比較可能性は不十分であり、特に具体的な政策、資金調達、適応策の詳細が不足しているため、地球規模の気候目標の達成が困難になっています。この問題に対処するため、Ivan Savin、Lewis C. King、Jeroen van den Berghらは自然言語処理技術(Natural Language Processing, NLP)を用いてNDCsの全文を系統的に分析し、NDCsに含まれる深層的な議論を明らかにし、各国の気候行動における焦点とその進化の傾向を探りました。
論文の出典
本論文は、Ivan Savin(ESCPビジネススクール、バルセロナ自治大学環境科学技術研究所)、Lewis C. King(バルセロナ自治大学環境科学技術研究所)、Jeroen van den Bergh(バルセロナ自治大学環境科学技術研究所、アムステルダム自由大学)によって共同執筆され、2025年3月に『Nature Sustainability』誌に掲載されました。論文のタイトルは『Analyzing Content of Paris Climate Pledges with Computational Linguistics』です。この研究は欧州研究評議会(ERC)の資金提供を受けており、スペイン科学イノベーション省の「María de Maeztu」卓越プログラムに属しています。
研究のプロセス
1. データ収集と前処理
研究チームは、Climate Watchプラットフォームと『国連気候変動枠組条約』(UNFCCC)のNDC登録簿から、2023年5月31日時点でのすべてのNDCs文書を収集しました。合計309のNDCsが収集され、そのうち167は初回提出分、142は更新版です。非英語の文書については、DeepL翻訳サービスを使用して英語に変換しました。データの前処理には、単語分割、句読点とストップワードの除去、語形還元(lemmatization)、および二重語シーケンス(bi-grams)の生成が含まれます。最終的に、研究チームは7,599のユニークな単語と539,902の単語頻度からなるデータセットを構築しました。
2. トピックモデリング(Topic Modelling)
研究では、構造化トピックモデリング(Structural Topic Modelling, STM)を使用してNDCsのテキストを分析しました。STMは自然言語処理と機械学習を組み合わせたトピックモデリング手法であり、テキストを異なるトピックにクラスタリングし、文書の特徴(国のGDP、排出強度など)に基づいてトピック分布を統計的に分析できます。テキスト数の限界を克服するため、研究チームは各NDCを約1,000語のテキストブロックに分割し、合計1,280のテキストブロックを生成しました。STMモデルを通じて、研究チームは21のトピックを識別し、それらを7つのトピックグループに分類しました。
3. トピック分析とクラスタリング
研究チームは、各NDCにおける21のトピックの分布比率を計算し、トピック分布の類似性に基づいて167の国をクラスタリング分析しました。ユークリッド距離と階層的クラスタリング法を使用し、国を9つのクラスターに分類しました。さらに、研究チームは回帰分析を通じて、トピック分布と国の特徴(GDP、排出強度、脆弱性など)との関係を探りました。
主な結果
1. トピックの識別と分布
研究で識別された7つのトピックグループとその割合は以下の通りです:開発(25%)、実施と計画(21.5%)、削減目標(20.3%)、政策と技術(11.3%)、気候変動の影響(10.7%)、農業と生態系(7.4%)、および利害関係者(3.8%)。このうち、開発トピックグループは持続可能な開発、経済開発、農村開発をカバーし、NDCsの中で最も主要な内容です。削減目標トピックグループは、温室ガス会計、排出シナリオ、目標報告などに焦点を当てています。
2. 国のクラスタリング分析
トピック分布に基づき、研究チームは国を9つのクラスターに分類しました。例えば、オーストラリア、カナダ、英国などの国で構成されるクラスター(C1)は政策と技術に重点を置いています。一方、EUや米国などの国で構成されるクラスター(C2)は削減目標に焦点を当てています。ブラジル、インド、小島嶼国(SIDS)などの開発途上国は、持続可能な開発と気候変動の影響により多くの注意を払っています。
3. トピックと国の特徴の関係
回帰分析によると、高GDPの国は削減目標に焦点を当てる傾向があるのに対し、開発途上国は開発と適応に関する議論をより多く行っています。例えば、石油輸出国機構(OPEC)の国々は経済開発を強調し、小島嶼国は気候変動の脆弱性に注目しています。
4. NDCs更新プロセスの変化
研究によると、更新されたNDCsは透明性と具体性が向上しており、特に削減目標と政策の詳細の記述が改善されています。しかし、国際支援やグリーンエネルギー技術などのトピックへの注目度は低下しており、これは更新されたNDCsが他の分野に重点を拡大したためと考えられます。
研究の結論
この研究は、自然言語処理技術を用いてNDCsの全文を系統的に分析し、各国の気候行動における焦点とその進化の傾向を明らかにしました。研究によると、NDCsの内容は削減目標に留まらず、開発、適応、実施など多岐にわたる情報を含んでいます。高所得国は削減目標に焦点を当てる一方、開発途上国はNDCsを持続可能な開発の一部と見なしています。研究はまた、NDCsの透明性と比較可能性の不足を指摘し、標準化されたフォーマットを通じてNDCsの信頼性と透明性を高めることを提案しています。
研究のハイライト
- 系統的分析:自然言語処理技術を用いてNDCsの全文を初めて系統的に分析し、既存研究の空白を埋めました。
- トピック識別とクラスタリング:21のトピックを識別し、7つのトピックグループに分類することで、NDCsの内容を理解する新たな視点を提供しました。
- 国の特徴とトピックの関係:回帰分析を通じてトピック分布と国の特徴の関係を明らかにし、差別化された気候政策の策定に役立つ情報を提供しました。
- NDCs更新プロセスの進化:更新されたNDCsの透明性と具体性が向上していることを発見し、気候行動の進捗評価に重要な参考資料を提供しました。
研究の意義
この研究は、NDCsの内容を理解するための新たなツールと方法を提供するだけでなく、地球規模の気候政策の策定と評価に重要な根拠を提供します。NDCsの透明性と比較可能性を高めることで、『パリ協定』の目標と実施進捗のギャップを縮め、地球規模の気候行動の実現を促進する可能性があります。