Generalization Bounds for Markov Algorithms through Entropy Flow Computations

Diese Arbeit erweitert die Anwendbarkeit von Entropiefluss-Methoden zur Herleitung von Generalisierungsschranken auf alle lernenden Algorithmen, deren iterative Dynamik durch einen zeit-homogenen Markov-Prozess beschrieben wird, indem sie eine exakte Entropiefluss-Formel und Verbindungen zu modifizierten logarithmischen Sobolev-Ungleichungen einführt.

Benjamin Dupuis, Maxime Haddouche, George Deligiannidis + 1 more2026-03-06💻 cs

FBFL: A Field-Based Coordination Approach for Data Heterogeneity in Federated Learning

Die Arbeit stellt FBFL vor, einen neuartigen, auf Feldkoordinierung basierenden Ansatz für das Federated Learning, der durch dezentrale, räumlich organisierte Hierarchien und personalisierte Leader-Election-Verfahren nicht nur die Herausforderungen nicht-identisch verteilter (non-IID) Daten effektiv löst, sondern auch die Skalierbarkeit und Ausfallsicherheit gegenüber zentralisierten Architekturen wie FedAvg, FedProx und Scaffold verbessert.

Davide Domini, Gianluca Aguzzi, Lukas Esterle + 1 more2026-03-06💻 cs

Double Momentum and Error Feedback for Clipping with Fast Rates and Differential Privacy

Die Autoren stellen Clip21-SGD2M vor, einen neuen Algorithmus für das Federated Learning, der durch eine innovative Kombination aus Clipping, Heavy-Ball-Momentum und Error Feedback sowohl optimale Konvergenzraten bei beliebiger Datenheterogenität als auch starke lokale Differentialprivatsphäre-Garantien ohne restriktive Annahmen erreicht.

Rustem Islamov, Samuel Horvath, Aurelien Lucchi + 2 more2026-03-06🔢 math

Safety Mirage: How Spurious Correlations Undermine VLM Safety Fine-Tuning and Can Be Mitigated by Machine Unlearning

Die Arbeit zeigt, dass überwachtes Sicherheitstraining bei Vision-Language-Modellen durch irreführende oberflächliche Korrelationen anfällig für Umgehungsangriffe und übermäßige Zurückhaltung bleibt, und demonstriert, dass maschinelles Vergessen (Machine Unlearning) eine überlegene Alternative ist, um schädliches Wissen gezielt zu entfernen und gleichzeitig die Sicherheit sowie die Leistungsfähigkeit der Modelle zu verbessern.

Yiwei Chen, Yuguang Yao, Yihua Zhang + 3 more2026-03-06💻 cs

Assessing the Impact of Code Changes on the Fault Localizability of Large Language Models

Diese Studie stellt ein neuartiges, skalierbares Evaluierungsframework vor, das zeigt, dass die Fähigkeit von Large Language Models zur Fehlerlokalisation durch semantisch erhaltende Mutationen stark beeinträchtigt wird, was auf eine übermäßige Abhängigkeit von syntaktischen Merkmalen anstelle eines tiefen semantischen Verständnisses hinweist.

Sabaat Haroon, Ahmad Faraz Khan, Ahmad Humayun + 5 more2026-03-06💻 cs

TianQuan-S2S: A Subseasonal-to-Seasonal Global Weather Model via Incorporate Climatology State

Das Paper stellt TianQuan-S2S vor, ein globales Wettermodell für subseasonale bis saisonale Vorhersagen, das durch die Integration klimatologischer Zustände in die Patch-Embeddings und einen unsicherheitsaugmentierten Transformer die Überglättung bestehender datengetriebener Modelle überwindet und dabei die Leistungsfähigkeit etablierter numerischer sowie anderer KI-basierter Modelle in Schlüsselmetriken übertrifft.

Guowen Li, Xintong Liu, Yang Liu + 11 more2026-03-06💻 cs