ABD: Default Exception Abduction in Finite First Order Worlds
Die Arbeit stellt ABD vor, einen Benchmark zur Bewertung der Fähigkeit von Sprachmodellen, in endlichen ersten Ordnungs-Welten durch das Ableiten sparsamer Ausnahmeregeln die Satisfiabilität von Theorien wiederherzustellen, und zeigt dabei trotz hoher Validität signifikante Defizite in der Sparsamkeit und Generalisierung auf.