Expert Evaluation of LLM World Models: A High- Superconductivity Case Study
Deze studie evalueert zes LLM-systemen op hun vermogen om als expert te reageren op complexe vragen over hoogtemperatuur-supergeleiding en concludeert dat systemen met retrieval-augmented generation (RAG) op een door experts samengestelde dataset betere prestaties leveren dan gesloten modellen.