Grading the Unspoken: Evaluating Tacit Reasoning in Quantum Field Theory and String Theory with LLMs
Este artigo avalia a capacidade de modelos de linguagem grandes (LLMs) de raciocinar tacitamente em física teórica avançada, como teoria quântica de campos e teoria das cordas, demonstrando que, embora apresentem alto desempenho em derivações explícitas, falham sistematicamente na reconstrução de passos de raciocínio omitidos e na reorganização de representações sob restrições de consistência global, revelando as limitações epistêmicas das atuais paradigmas de avaliação.