Expert Evaluation of LLM World Models: A High- Superconductivity Case Study
Questo studio valuta la capacità di sei sistemi di modelli linguistici di rispondere a domande complesse sulla superconduttività ad alta temperatura, dimostrando che le soluzioni basate su retrieval-augmented generation (RAG) su letteratura curata superano i modelli chiusi esistenti in termini di completezza fattuale e supporto evidenziale.