Balancing Coverage and Draft Latency in Vocabulary Trimming for Faster Speculative Decoding

Die vorgestellte Arbeit optimiert die Effizienz des spekulativen Dekodierens bei Large Language Models, indem sie die Vokabulargröße von Draft-Modellen durch ein constrained-Optimierungsverfahren reduziert, das eine Balance zwischen der Abdeckung notwendiger Token und der Latenz herstellt, was insbesondere bei domänenspezifischen Aufgaben zu signifikanten Geschwindigkeitssteigerungen führt.

Ofir Ben Shoham2026-03-06🤖 cs.AI

Learning Optimal Individualized Decision Rules with Conditional Demographic Parity

Diese Arbeit stellt einen neuartigen Rahmen vor, der demografische Parität und bedingte demografische Parität durch effiziente Störungen der unbeschränkten optimalen individuellen Entscheidungsregeln in die Schätzung einbindet, um diskriminierende Effekte zu vermeiden, wobei die theoretische Konvergenz und praktische Wirksamkeit durch Simulationen und eine Anwendung auf das Oregon-Gesundheitsversicherungs-Experiment nachgewiesen werden.

Wenhai Cui, Wen Su, Donglin Zeng + 1 more2026-03-06🤖 cs.LG

The Geometric Inductive Bias of Grokking: Bypassing Phase Transitions via Architectural Topology

Die Studie zeigt durch interventive Architekturmodifikationen, dass die Beseitigung unbeschränkter Darstellungsmagnituden und datenabhängiger Attention-Routing-Mechanismen in Transformer-Modellen den Grokking-Effekt bei modularen Additionen vollständig überwindet, während diese Beschleunigung bei nicht-kommutativen Aufgaben wie der S5-Perposition ausbleibt, was auf eine entscheidende Abhängigkeit der Trainingsdynamik von der geometrischen Ausrichtung der Architekturprioritäten mit den intrinsischen Symmetrien der Aufgabe hindeutet.

Alper Yıldırım2026-03-06🤖 cs.AI

Beyond Word Error Rate: Auditing the Diversity Tax in Speech Recognition through Dataset Cartography

Diese Arbeit kritisiert die ausschließliche Verwendung der Wortfehlerrate (WER) zur Bewertung von Spracherkennungssystemen und führt mit dem Sample Difficulty Index (SDI) sowie semantischen Metriken einen neuen Audit-Rahmen ein, um die systematischen Nachteile für marginalisierte Sprecher („Diversity Tax") zu quantifizieren und zu mindern.

Ting-Hui Cheng, Line H. Clemmensen, Sneha Das2026-03-06🤖 cs.LG

How important are the genes to explain the outcome - the asymmetric Shapley value as an honest importance metric for high-dimensional features

Die Autoren schlagen asymmetrische Shapley-Werte als ehrliches Maß zur Bewertung der Bedeutung genomischer Merkmale in klinischen Vorhersagemodellen vor, um die Probleme von Kollinearität und bekannten Kausalrichtungen zu adressieren, und stellen effiziente Algorithmen für lokale und globale Analysen vor, die am Beispiel der Progressions-freien Überlebenszeit bei Darmkrebspatienten veranschaulicht werden.

Mark A. van de Wiel, Jeroen Goedhart, Martin Jullum + 1 more2026-03-06🤖 cs.LG

GALACTIC: Global and Local Agnostic Counterfactuals for Time-series Clustering

Die Arbeit stellt GALACTIC vor, ein einheitliches Framework, das erstmals lokale und globale kontrafaktische Erklärungen für das unüberwachte Clustering von Zeitreihen vereint, indem es instanzspezifische Störungen generiert und durch ein supermodulares MDL-Optimierungsverfahren eine kompakte, nicht-redundante globale Zusammenfassung der Clusterübergänge liefert.

Christos Fragkathoulas, Eleni Psaroudaki, Themis Palpanas + 1 more2026-03-06🤖 cs.AI