ESGenius: Benchmarking LLMs on Environmental, Social, and Governance (ESG) and Sustainability Knowledge
O artigo apresenta o ESGenius, o primeiro benchmark abrangente para avaliar o conhecimento de modelos de linguagem em ESG e sustentabilidade, demonstrando que, embora os modelos de ponta apresentem desempenho moderado em cenários zero-shot, a integração de métodos de Geração Aumentada por Recuperação (RAG) com um corpus de fontes autoritativas eleva significativamente a precisão, especialmente em modelos menores.