A unified foundational framework for knowledge injection and evaluation of Large Language Models in Combustion Science

Deze studie introduceert een unificerend raamwerk voor het injecteren van kennis en evalueren van grote taalmodellen in de verbrandingswetenschap, waarbij wordt aangetoond dat een gestructureerde aanpak met kennisgrafieken en voortgezette pretraining noodzakelijk is om de beperkingen van standaard retrieval-augmented generation te overwinnen.

Zonglin Yang, Runze Mao, Tianhao Wu + 3 more2026-03-06💻 cs

iAgentBench: Benchmarking Sensemaking Capabilities of Information-Seeking Agents on High-Traffic Topics

iAgentBench is een dynamisch benchmark dat de vermogens van informatieve zoekagenten om zintuiglijke conclusies te trekken uit meerdere bronnen op populaire onderwerpen evalueert, waarbij wordt vastgesteld dat het enkel ophalen van informatie onvoldoende is voor het oplossen van complexe vragen die synthese vereisen.

Preetam Prabhu Srikar Dammu, Arnav Palkhiwala, Tanya Roosta + 1 more2026-03-06💻 cs