Huntington Disease Automatic Speech Recognition with Biomarker Supervision

Diese Studie stellt eine systematische Untersuchung zur automatischen Spracherkennung bei Huntington-Krankheit vor, die durch die Einführung einer biomarkerbasierten auxiliary Supervision und die Anpassung von Modellen an pathologische Sprachmerkmale die Wortfehlerrate signifikant senkt und dabei zeigt, dass sich Fehlermuster in Abhängigkeit vom Schweregrad der Erkrankung spezifisch verändern.

Charles L. Wang, Cady Chen, Ziwei Gong, Julia Hirschberg2026-03-13🤖 cs.LG

PACED: Distillation at the Frontier of Student Competence

Die Arbeit stellt PACED vor, ein Framework zur effizienteren LLM-Distillation, das durch eine theoretisch fundierte Beta-Gewichtungsfunktion den Lernprozess gezielt auf die Zone der proximalen Entwicklung konzentriert, in der das Schülermodell weder bereits vollständig kompetent noch völlig überfordert ist, um so Rechenressourcen zu sparen und die Leistung auf Benchmarks zu steigern.

Yuanda Xu, Hejian Sang, Zhengze Zhou, Ran He, Zhipeng Wang2026-03-13🤖 cs.AI

DNS-GT: A Graph-based Transformer Approach to Learn Embeddings of Domain Names from DNS Queries

Die Studie stellt DNS-GT vor, einen graphbasierten Transformer-Ansatz, der durch selbstüberwachtes Vortraining und Feinabstimmung auf DNS-Abfrage-Sequenzen aussagekräftige Domain-Name-Embeddings lernt, um die Genauigkeit bei der Erkennung von Botnets und der Klassifizierung von Domains im Vergleich zu bestehenden Methoden zu verbessern.

Massimiliano Altieri, Ronan Hamon, Roberto Corizzo, Michelangelo Ceci, Ignacio Sanchez2026-03-13🤖 cs.LG

Representation Finetuning for Continual Learning

Die Arbeit stellt CoRe vor, ein neuartiges Framework für das kontinuierliche Lernen, das das Feinabstimmungsparadigma vom Gewichtsraum in den Repräsentationsraum verlagert, indem es taskspezifische Eingriffe in einem niedrigrangigen linearen Unterraum versteckter Repräsentationen vornimmt, um Stabilität und Plastizität bei hoher Parameter-Effizienz zu gewährleisten.

Haihua Luo, Xuming Ran, Tommi Kärkkäinen, Huiyan Xue, Zhonghua Chen, Qi Xu, Fengyu Cong2026-03-13🤖 cs.LG

Security-by-Design for LLM-Based Code Generation: Leveraging Internal Representations for Concept-Driven Steering Mechanisms

Die Arbeit stellt „Secure Concept Steering for CodeLLMs" (SCS-Code) vor, eine Methode, die die internen Repräsentationen von Sicherheitskonzepten in Large Language Models nutzt, um während der Token-Generierung gezielt sichere und funktionale Codeausgaben zu steuern und dabei bestehende State-of-the-Art-Methoden in puncto Sicherheit und Korrektheit zu übertreffen.

Maximilian Wendlinger, Daniel Kowatsch, Konstantin Böttinger, Philip Sperl2026-03-13🤖 cs.LG

Measuring AI Agents' Progress on Multi-Step Cyber Attack Scenarios

Die Studie zeigt, dass autonome KI-Agenten bei komplexen Cyberangriffen ihre Leistung sowohl durch erhöhten Rechenbedarf als auch durch Modellgenerationen signifikant steigern, wobei fortgeschrittene Modelle in einem Unternehmensnetzwerk bis zu 22 von 32 Schritten autonom bewältigen können, während die Fähigkeiten in industriellen Steuerungssystemen jedoch noch begrenzt bleiben.

Linus Folkerts, Will Payne, Simon Inman, Philippos Giavridis, Joe Skinner, Sam Deverett, James Aung, Ekin Zorer, Michael Schmatz, Mahmoud Ghanem, John Wilkinson, Alan Steer, Vy Hong, Jessica Wang2026-03-13🤖 cs.AI

Trustworthy predictive distributions for rare events via diagnostic transport maps

Diese Arbeit stellt diagnostische Transportkarten vor, die als covariatenabhängige Korrekturmechanismen dienen, um ungenaue Vorhersageverteilungen für seltene Ereignisse neu zu kalibrieren und gleichzeitig Echtzeit-Diagnosedaten über spezifische Modellfehler zu liefern, was in einer Anwendung zur Vorhersage tropischer Wirbelstürme zu verbesserten Ergebnissen im Vergleich zu operationellen Modellen führt.

Elizabeth Cucuzzella, Rafael Izbicki, Ann B. Lee2026-03-13📊 stat

Cough activity detection for automatic tuberculosis screening

Die Studie zeigt, dass ein auf XLS-R basierendes Modell mit nur den ersten drei Schichten die Erkennung von Hustenereignissen in Audiodaten für die Tuberkulose-Screening-Programme in Südafrika und Uganda mit hoher Präzision ermöglicht und dabei rechenintensive Alternativen wie den Audio Spectrogram Transformer übertrifft.

Joshua Jansen van Vüren, Devendra Singh Parihar, Daphne Naidoo, Kimsey Zajac, Willy Ssengooba, Grant Theron, Thomas Niesler2026-03-13⚡ eess

Differentiable Thermodynamic Phase-Equilibria for Machine Learning

Die Arbeit stellt DISCOMAX vor, einen differentierbaren Algorithmus, der auf der diskreten Enumeration thermodynamisch zulässiger Zustände und einer maskierten Softmax-Aggregation basiert, um physik-konsistente neuronale Modelle für Phasengleichgewichte zu trainieren und dabei die Genauigkeit bestehender Methoden bei binären flüssig-flüssig-Gleichgewichten zu übertreffen.

Karim K. Ben Hicham, Moreno Ascani, Jan G. Rittig, Alexander Mitsos2026-03-13🤖 cs.LG

Beyond the Class Subspace: Teacher-Guided Training for Reliable Out-of-Distribution Detection in Single-Domain Models

Die Arbeit identifiziert das Phänomen des Domain-Sensitivity Collapse bei Single-Domain-Modellen und stellt Teacher-Guided Training (TGT) vor, das durch Wissensdistillation von einem eingefrorenen Multi-Domain-Lehrer die Out-of-Distribution-Erkennung verbessert, ohne zusätzliche Inferenzkosten zu verursachen.

Hong Yang, Devroop Kar, Qi Yu, Travis Desell, Alex Ororbia2026-03-13🤖 cs.LG

RIE-Greedy: Regularization-Induced Exploration for Contextual Bandits

Die Arbeit stellt RIE-Greedy vor, eine Methode für kontextbasierte Banditen, die durch die Nutzung der inhärenten Stochastizität im Regularisierungsprozess beim Modelltraining eine effektive Exploration ohne zusätzliche Strategien ermöglicht und theoretisch sowie empirisch mit Thompson Sampling vergleichbare Ergebnisse liefert.

Tong Li, Thiago de Queiroz Casanova, Eric M. Schwartz, Victor Kostyuk, Dehan Kong, Joseph J. Williams2026-03-13📊 stat