ESGenius: Benchmarking LLMs on Environmental, Social, and Governance (ESG) and Sustainability Knowledge
本論文は、環境・社会・ガバナンス(ESG)およびサステナビリティ分野における大規模言語モデル(LLM)の能力を評価・強化するための包括的なベンチマーク「ESGenius」を提案し、専門家の検証を受けた 1,136 問の質問と 231 件の基礎文書からなるコーパスを用いた評価により、ゼロショット設定では限界があるものの、信頼性の高い情報源に基づく検索拡張生成(RAG)手法を適用することでモデルの性能が大幅に向上することを示しています。