cs.LG Arbeiten | Gist.Science

Stable-LoRA: Stabilizing Feature Learning of Low-Rank Adaptation

Die Arbeit stellt Stable-LoRA vor, eine Methode zur dynamischen Gewichtsverkleinerung, die die Stabilität des Feature-Learnings bei der Low-Rank-Adaptation (LoRA) verbessert und dabei deren theoretische Grenzen überwindet, ohne zusätzlichen Speicherbedarf oder nennenswerten Rechenaufwand zu verursachen.

Yize Wu, Ke Gao, Ling Li + 1 more2026-03-06🤖 cs.AI

Balancing Coverage and Draft Latency in Vocabulary Trimming for Faster Speculative Decoding

Die vorgestellte Arbeit optimiert die Effizienz des spekulativen Dekodierens bei Large Language Models, indem sie die Vokabulargröße von Draft-Modellen durch ein constrained-Optimierungsverfahren reduziert, das eine Balance zwischen der Abdeckung notwendiger Token und der Latenz herstellt, was insbesondere bei domänenspezifischen Aufgaben zu signifikanten Geschwindigkeitssteigerungen führt.

Ofir Ben Shoham2026-03-06🤖 cs.AI

Early Warning of Intraoperative Adverse Events via Transformer-Driven Multi-Label Learning

Die Studie stellt das erste Multi-Label-Datenset für intraoperative Adverse Events vor und entwickelt IAENet, einen Transformer-basierten Rahmen mit neuartigen Modulen zur Fusion heterogener Daten und zum Ausgleich von Klassenungleichgewichten, der die Vorhersagegenauigkeit für kritische intraoperative Ereignisse signifikant verbessert.

Xueyao Wang, Xiuding Cai, Honglin Shang + 2 more2026-03-06🤖 cs.AI

KARL: Knowledge Agents via Reinforcement Learning

Das Paper stellt KARL vor, ein System, das durch eine neue iterative Reinforcement-Learning-Paradigme und eine synthetische Trainingspipeline auf dem umfassenden KARLBench-Testset state-of-the-art-Ergebnisse bei unternehmensinternen Suchaufgaben erzielt und dabei geschlossene Modelle wie Claude 4.6 sowie GPT 5.2 in Bezug auf Kosten, Latenz und Qualität übertrifft.

Jonathan D. Chang, Andrew Drozdov, Shubham Toshniwal + 23 more2026-03-06🤖 cs.AI

Learning Optimal Individualized Decision Rules with Conditional Demographic Parity

Diese Arbeit stellt einen neuartigen Rahmen vor, der demografische Parität und bedingte demografische Parität durch effiziente Störungen der unbeschränkten optimalen individuellen Entscheidungsregeln in die Schätzung einbindet, um diskriminierende Effekte zu vermeiden, wobei die theoretische Konvergenz und praktische Wirksamkeit durch Simulationen und eine Anwendung auf das Oregon-Gesundheitsversicherungs-Experiment nachgewiesen werden.

Wenhai Cui, Wen Su, Donglin Zeng + 1 more2026-03-06🤖 cs.LG

The Geometric Inductive Bias of Grokking: Bypassing Phase Transitions via Architectural Topology

Die Studie zeigt durch interventive Architekturmodifikationen, dass die Beseitigung unbeschränkter Darstellungsmagnituden und datenabhängiger Attention-Routing-Mechanismen in Transformer-Modellen den Grokking-Effekt bei modularen Additionen vollständig überwindet, während diese Beschleunigung bei nicht-kommutativen Aufgaben wie der S5-Perposition ausbleibt, was auf eine entscheidende Abhängigkeit der Trainingsdynamik von der geometrischen Ausrichtung der Architekturprioritäten mit den intrinsischen Symmetrien der Aufgabe hindeutet.

Alper Yıldırım2026-03-06🤖 cs.AI

Boosting ASR Robustness via Test-Time Reinforcement Learning with Audio-Text Semantic Rewards

Die Arbeit stellt ASR-TRA vor, ein Testzeit-Reinforcement-Learning-Framework, das durch kausale Interventionen, stochastische Dekodierung und semantische Audio-Text-Belohnungen die Robustheit von Spracherkennungssystemen gegenüber Rauschen und Akzenten verbessert, ohne auf Ground-Truth-Labels angewiesen zu sein.

Linghan Fang, Tianxin Xie, Li Liu2026-03-06🤖 cs.AI

SlideSparse: Fast and Flexible (2N-2):2N Structured Sparsity

SlideSparse ist ein System, das erstmals die NVIDIA-Sparse-Tensor-Cores auf handelsüblichen GPUs nutzt, um durch eine innovative Fensterzerlegung und Aktivierungsmanipulation die präzisionsbewahrende $(2N-2):2N$ -Struktursparsity (z. B. 6:8) für LLMs zu beschleunigen und dabei eine Geschwindigkeitssteigerung von bis zu 1,33x zu erreichen.

Hanyong Shao, Yingbo Hao, Ting Song + 10 more2026-03-06🤖 cs.LG

Recursive Inference Machines for Neural Reasoning

Die vorgestellte Arbeit führt Recursive Inference Machines (RIMs) ein, ein neuronales Reasoning-Framework, das klassische Inferenzmechanismen mit neuronalen Backbones verbindet, um durch eine Gewichtungskomponente die Leistung von Tiny Recursive Models (TRMs) auf anspruchsvollen Reasoning- und Klassifikationsaufgaben signifikant zu verbessern.

Mieszko Komisarczyk, Saurabh Mathur, Maurice Kraus + 2 more2026-03-06🤖 cs.AI

A Behaviour-Aware Federated Forecasting Framework for Distributed Stand-Alone Wind Turbines

Die Studie stellt ein zweistufiges, datenschutzfreundliches Framework vor, das Windturbinen mittels eines verhaltensbasierten Clustering-Algorithmus (DRS) gruppiert und darauf aufbauend lokale LSTM-Modelle per Federated Learning trainiert, um die Kurzzeitprognose von Windenergie bei heterogenen, dezentralen Anlagen zu verbessern.

Bowen Li, Xiufeng Liu, Maria Sinziiana Astefanoaei2026-03-06🤖 cs.LG

Beyond Word Error Rate: Auditing the Diversity Tax in Speech Recognition through Dataset Cartography

Diese Arbeit kritisiert die ausschließliche Verwendung der Wortfehlerrate (WER) zur Bewertung von Spracherkennungssystemen und führt mit dem Sample Difficulty Index (SDI) sowie semantischen Metriken einen neuen Audit-Rahmen ein, um die systematischen Nachteile für marginalisierte Sprecher („Diversity Tax") zu quantifizieren und zu mindern.

Ting-Hui Cheng, Line H. Clemmensen, Sneha Das2026-03-06🤖 cs.LG

Whispering to a Blackbox: Bootstrapping Frozen OCR with Visual Prompts

Diese Arbeit stellt „Whisperer" vor, ein neuartiges visuelles Prompting-Framework, das durch einen vierstufigen Curriculum-Lernansatz und Verhaltensklonierung stochastisch gefundene Verbesserungen nutzt, um eingefrorene OCR-Modelle wie EasyOCR durch pixelbasierte Eingabeoptimierung ohne Gewichtsänderung signifikant zu verbessern.

Samandar Samandarov, Nazirjon Ismoiljonov, Abdullah Sattorov + 1 more2026-03-06🤖 cs.AI

Layer by layer, module by module: Choose both for optimal OOD probing of ViT

Diese Studie zeigt, dass für das optimale Out-of-Distribution-Probing von Vision-Transformern je nach Stärke der Verteilungsverschiebung entweder die Aktivierungen des Feedforward-Netzwerks oder die normalisierten Ausgaben des Multi-Head-Self-Attention-Moduls verwendet werden sollten, um die Leistungstiefs tieferer Schichten zu überwinden.

Ambroise Odonnat, Vasilii Feofanov, Laetitia Chapel + 2 more2026-03-06🤖 cs.LG

Bayesian Supervised Causal Clustering

Der Artikel stellt die Bayesian Supervised Causal Clustering (BSCC)-Methode vor, die mithilfe von Behandlungseffekten als Zielvariable homogene Patientengruppen identifiziert, um personalisierte Entscheidungen im Gesundheitswesen und in der Politikbewertung zu unterstützen, und validiert diesen Ansatz sowohl an simulierten als auch an realen Daten aus dem dritten International Stroke Trial.

Luwei Wang, Nazir Lone, Sohan Seth2026-03-06🤖 cs.LG

Knowledge Divergence and the Value of Debate for Scalable Oversight

Diese Arbeit stellt den ersten formalen Zusammenhang zwischen KI-Debatte und RLAIF her, indem sie den Vorteil von Debatten durch die geometrische Divergenz des Wissens zwischen Modellen quantifiziert und zeigt, dass Debatten bei komplementärem Wissen entscheidend sind, während sie bei identischem Training auf RLAIF reduziert werden.

Robin Young2026-03-06🤖 cs.LG

Latent Policy Steering through One-Step Flow Policies

Die Arbeit stellt Latent Policy Steering (LPS) vor, eine Methode für das Offline-Reinforcement-Learning, die durch die direkte Rückpropagation von Q-Gradienten aus dem Original-Aktionsraum über eine differenzierbare One-Step-MeanFlow-Politik eine robuste und hyperparameterunabhängige Verbesserung von Latent-Policies ermöglicht und dabei den Datensatz-Support strikt wahrt.

Hokyun Im, Andrey Kolobov, Jianlong Fu + 1 more2026-03-06🤖 cs.LG

WavSLM: Single-Stream Speech Language Modeling via WavLM Distillation

Die Arbeit stellt WavSLM vor, ein einfaches, single-stream Sprachmodell, das durch Quantisierung und Distillation von WavLM-Repräsentationen semantische und akustische Informationen ohne Textsupervision in einem einzigen Token-Stream modelliert und dabei wettbewerbsfähige Ergebnisse bei geringerer Komplexität erzielt.

Luca Della Libera, Cem Subakan, Mirco Ravanelli2026-03-06🤖 cs.AI

How important are the genes to explain the outcome - the asymmetric Shapley value as an honest importance metric for high-dimensional features

Die Autoren schlagen asymmetrische Shapley-Werte als ehrliches Maß zur Bewertung der Bedeutung genomischer Merkmale in klinischen Vorhersagemodellen vor, um die Probleme von Kollinearität und bekannten Kausalrichtungen zu adressieren, und stellen effiziente Algorithmen für lokale und globale Analysen vor, die am Beispiel der Progressions-freien Überlebenszeit bei Darmkrebspatienten veranschaulicht werden.

Mark A. van de Wiel, Jeroen Goedhart, Martin Jullum + 1 more2026-03-06🤖 cs.LG

GALACTIC: Global and Local Agnostic Counterfactuals for Time-series Clustering

Die Arbeit stellt GALACTIC vor, ein einheitliches Framework, das erstmals lokale und globale kontrafaktische Erklärungen für das unüberwachte Clustering von Zeitreihen vereint, indem es instanzspezifische Störungen generiert und durch ein supermodulares MDL-Optimierungsverfahren eine kompakte, nicht-redundante globale Zusammenfassung der Clusterübergänge liefert.

Christos Fragkathoulas, Eleni Psaroudaki, Themis Palpanas + 1 more2026-03-06🤖 cs.AI

FairFinGAN: Fairness-aware Synthetic Financial Data Generation

Die Arbeit stellt FairFinGAN vor, ein auf WGAN basierendes Framework zur Erzeugung fairer synthetischer Finanzdaten, das durch direkte Integration von Fairness-Bedingungen in den Trainingsprozess Verzerrungen bezüglich geschützter Attribute reduziert, ohne die Nützlichkeit der Daten für nachgelagerte Aufgaben signifikant zu beeinträchtigen.

Tai Le Quy, Dung Nguyen Tuan, Trung Nguyen Thanh + 3 more2026-03-06🤖 cs.LG

← Zurück Weiter →