PANDAExpress: a Simpler and Faster PANDA Algorithm

Die Arbeit stellt PANDAExpress vor, einen vereinfachten und schnelleren Algorithmus, der durch eine neue probabilistische Ungleichung und ein dynamisches Hyperplane-Cut-Splitting-Verfahren den bisher unpraktischen polylogarithmischen Faktor der Laufzeit des ursprünglichen PANDA-Algorithmus eliminiert und dabei dessen Allgemeingültigkeit für konjunktive Abfragen und disjunktive Datalog-Regeln unter beliebigen Gradbeschränkungen bewahrt.

Mahmoud Abo Khamis, Hung Q. Ngo, Dan Suciu2026-03-05🔢 math

Local Shapley: Model-Induced Locality and Optimal Reuse in Data Valuation

Die Arbeit stellt „Local Shapley" vor, ein Framework, das die inhärente Lokalität moderner Modelle nutzt, um die Shapley-Wert-Berechnung von einer exponentiell komplexen globalen Aufgabe auf effiziente, modellinduzierte Teilmenge-Prozesse zu reduzieren, und führt dabei den optimalen Algorithmus LSMR sowie dessen Monte-Carlo-Erweiterung LSMR-A ein, die die Anzahl notwendiger Neutraining-Schritte drastisch verringern, ohne die Genauigkeit zu beeinträchtigen.

Xuan Yang, Hsi-Wen Chen, Ming-Syan Chen + 1 more2026-03-05🤖 cs.AI

SpotIt+: Verification-based Text-to-SQL Evaluation with Database Constraints

Die Autoren stellen SpotIt+ vor, ein Open-Source-Tool zur Evaluierung von Text-to-SQL-Systemen, das durch die Kombination von regelbasiertem Constraint-Mining und LLM-Validierung realistische Datenbankinstanzen generiert, um effektiv Unterschiede zwischen generierten und Gold-SQL-Abfragen aufzudecken, die bei herkömmlichen Testverfahren unentdeckt bleiben.

Rocky Klopfenstein, Yang He, Andrew Tremante + 3 more2026-03-05🤖 cs.AI