cs.LG Arbeiten | Gist.Science

AMiD: Knowledge Distillation for LLMs with $α$ -mixture Assistant Distribution

Das Paper stellt AMiD vor, ein einheitliches Framework für das Wissenstransfer von großen auf kleine Sprachmodelle, das durch eine neuartige, parametrisierbare $α$ -Mischungs-Assistentenverteilung und eine generalisierte Divergenzfamilie die Stabilität und Leistung gegenüber bisherigen Ansätzen verbessert.

Donghyeok Shin, Yeongmin Kim, Suhyeon Jo + 2 more2026-03-05🤖 cs.AI

Buzz, Choose, Forget: A Meta-Bandit Framework for Bee-Like Decision Making

Die Arbeit stellt MAYA vor, ein auf Multi-Armed-Bandits basierendes sequenzielles Imitationslernmodell, das die Entscheidungen einzelner Bienen bei der Nahrungssuche unter Berücksichtigung ihres begrenzten Gedächtnisses erfolgreich nachbildet und dabei sowohl reale als auch simulierte Daten besser erklärt als herkömmliche Modelle.

Emmanuelle Claeys, Elena Kerjean, Jean-Michel Loubes2026-03-05🤖 cs.LG

Key and Value Weights Are Probably All You Need: On the Necessity of the Query, Key, Value weight Triplet in Self-Attention Transformers

Die Studie zeigt theoretisch und empirisch, dass in Transformer-Modellen einer der drei Gewichtsvektoren (Query, Key oder Value) durch die Identitätsmatrix ersetzt werden kann, was die Parameteranzahl um 25 % reduziert, die Optimierung vereinfacht und dennoch eine vergleichbare Leistung erzielt.

Marko Karbevski, Antonij Mijoski2026-03-05🤖 cs.AI

Implicit Bias of Per-sample Adam on Separable Data: Departure from the Full-batch Regime

Diese Arbeit zeigt, dass sich die implizite Verzerrung von Adam bei inkrementellem Lernen auf separierbaren Daten vom Vollbatch-Verhalten unterscheiden und zu einem $\ell_2$ -Max-Margin-Classifier führen kann, während Signum unabhängig von der Batch-Größe stets zum $\ell_\infty$ -Max-Margin-Classifier konvergiert.

Beomhan Baek, Minhak Song, Chulhee Yun2026-03-05🤖 cs.AI

CNFP: Optimizing Cloud-Native Network Function Placement with Diffusion Models on the Cloud Continuum

Die Studie stellt CNFP vor, einen neuartigen Ansatz zur Platzierung von Cloud-Nativen Netzwerkfunktionen im Cloud-Continuum, der Diffusionsmodelle mit Graph Neural Networks kombiniert, um unter Einhaltung strenger Ressourcen- und Latenzbedingungen skalierbare und robuste Lösungen zu generieren, die herkömmliche Methoden in Bezug auf Geschwindigkeit und Generalisierungsfähigkeit übertreffen.

Álvaro Vázquez Rodríguez, Manuel Fernández-Veiga, Carlos Giraldo-Rodríguez2026-03-05🤖 cs.LG

NeuCLIP: Efficient Large-Scale CLIP Training with Neural Normalizer Optimization

NeuCLIP ist ein neuartiges Optimierungsframework, das durch die Umformulierung des CLIP-Verlusts mittels konvexer Analyse und die Approximation der Normalisierungsterme über ein kompaktes neuronales Netz mittels Variationsanalyse eine effiziente und präzise Training von CLIP-Modellen auf großen Datensätzen ermöglicht.

Xiyuan Wei, Chih-Jen Lin, Tianbao Yang2026-03-05🤖 cs.LG

Implicit Bias of the JKO Scheme

Die Arbeit charakterisiert den impliziten Bias des JKO-Schemas auf einer Riemannschen Mannigfaltigkeit bis zur zweiten Ordnung in der Schrittweite $\eta$ , indem sie zeigt, dass das Schema einem modifizierten Energiefunctional entspricht, das durch eine Korrekturterme basierend auf der quadrierten metrischen Krümmung des ursprünglichen Funktionals entsteht.

Peter Halmos, Boris Hanin2026-03-05🤖 cs.AI

Better audio representations are more brain-like: linking model-brain alignment with performance in downstream auditory tasks

Die Studie zeigt, dass Audio-Modelle mit höherer Leistung in nachgelagerten Aufgaben auch eine stärkere Ähnlichkeit mit menschlichen Gehirnaktivitäten aufweisen, was darauf hindeutet, dass brain-ähnliche Repräsentationen ein emergentes Nebenprodukt des Lernens aus natürlichen Audiodaten sind.

Leonardo Pepino, Pablo Riera, Juan Kamienkowski + 1 more2026-03-05🤖 cs.LG

EnECG: Efficient Ensemble Learning for Electrocardiogram Multi-task Foundation Model

EnECG ist ein effizientes Ensemble-Lern-Framework für EKG-Multi-Task-Aufgaben, das spezialisierte Foundation-Modelle durch eine leichte Anpassung mit Low-Rank Adaptation (LoRA) und einen Mixture-of-Experts-Mechanismus kombiniert, um die Rechenkosten zu senken und gleichzeitig die Vorhersageleistung für klinische Anwendungen zu verbessern.

Yuhao Xu, Xiaoda Wang, Jiaying Lu + 6 more2026-03-05🤖 cs.AI

Soft Quality-Diversity Optimization

Die Arbeit stellt „Soft QD" als eine diskretisierungsfreie Alternative zur herkömmlichen Qualitäts-Diversitäts-Optimierung vor, die durch die Herleitung des differenzierbaren Algorithmus SQUAD skalierbare Lösungen für hochdimensionale Probleme bietet und dabei mit dem aktuellen Stand der Technik konkurrieren kann.

Saeed Hedayatian, Stefanos Nikolaidis2026-03-05🤖 cs.LG

Weight Space Representation Learning via Neural Field Adaptation

Diese Arbeit untersucht, wie die Einschränkung des Optimierungsrums durch ein vortrainiertes Basismodell und Low-Rank Adaptation (LoRA) strukturierte und semantisch aussagekräftige Repräsentationen im Gewichtsraum induziert, die sich insbesondere für Rekonstruktions-, Generierungs- und Analyseaufgaben sowie zur Verbesserung der Qualität latenter Diffusionsmodelle eignen.

Zhuoqian Yang, Mathieu Salzmann, Sabine Süsstrunk2026-03-05🤖 cs.AI

ceLLMate: Sandboxing Browser AI Agents

Die Arbeit stellt ceLLMate vor, ein browserbasiertes Sandboxing-Framework, das durch die Überwachung des HTTP-Verkehrs anstelle von unsicheren UI-Eingriffen die Auswirkungen von Prompt-Injection-Angriffen auf Browser-Agenten effektiv eindämmt.

Luoxi Meng, Henry Feng, Ilia Shumailov + 1 more2026-03-05🤖 cs.LG

NRR-Core: Non-Resolution Reasoning as a Computational Framework for Contextual Identity and Ambiguity Preservation

Der Artikel stellt NRR-Core vor, ein Rechenrahmenwerk, das die vorzeitige Auflösung von Mehrdeutigkeiten in KI-Systemen durch Prinzipien wie Nicht-Identität und parallele Interpretation aufhebt, um die semantische Flexibilität bis zum Eintreffen des Kontexts zu bewahren.

Kei Saito2026-03-05🤖 cs.AI

Learning under Distributional Drift: Prequential Reproducibility as an Intrinsic Statistical Resource

Diese Arbeit führt ein intrinsisches Drift-Budget $C_T$ ein, das die kumulative Fisher-Rao-Bewegung der Datenverteilung in geschlossenen Lernsystemen quantifiziert und zeigt, dass die Reproduzierbarkeit der Vorhersagen durch eine untere Schranke von $T^{-1/2} + C_T/T$ bestimmt wird, welche die unvermeidbare Genauigkeitsgrenze bei nicht vernachlässigbarer Drift festlegt.

Sofiya Zaichyk2026-03-05🤖 cs.LG

BumpNet: A Sparse MLP Framework for Learning PDE Solutions

Die Arbeit stellt BumpNet vor, ein spärliches MLP-Framework auf Basis trainierbarer Sigmoid-Funktionen zur effizienten und universellen Approximation von PDE-Lösungen und Operatoren, das durch Kombination mit PINNs, EDNNs und DeepONets erweitert wird.

Shao-Ting Chiu, Ioannis G. Kevrekidis, Ulisses Braga-Neto2026-03-05🤖 cs.LG

Online Robust Reinforcement Learning with General Function Approximation

Dieses Paper stellt einen vollständig online arbeitenden, robusten Reinforcement-Learning-Algorithmus mit allgemeiner Funktionsapproximation vor, der ohne Vorwissen oder vorgefertigte Daten robuste Strategien lernt und durch die Einführung der robusten Bellman-Eluder-Dimension sublineare Regret-Garantien für eine breite Klasse von Unsicherheitsmengen nachweist.

Debamita Ghosh, George K. Atia, Yue Wang2026-03-05🤖 cs.LG

OASI: Objective-Aware Surrogate Initialization for Multi-Objective Bayesian Optimization in TinyML Keyword Spotting

Die Arbeit stellt OASI vor, eine Methode zur initialisierungsbasierten multi-objectiven bayesschen Optimierung, die durch pareto-biasierte Simulated Annealing-Lösungen effizientere und speicherkonforme Keyword-Spotting-Modelle für TinyML auf Mikrocontrollern ermöglicht.

Soumen Garai, Danilo Pau, Suman Samui2026-03-05🤖 cs.LG

Generalization of RLVR Using Causal Reasoning as a Testbed

Diese Studie zeigt, dass Reinforcement Learning mit verifizierbaren Belohnungen (RLVR) die Generalisierungsfähigkeit von Sprachmodellen in der kausalen Schlussfolgerung im Vergleich zur überwachten Feinabstimmung verbessert, jedoch nur dann wirksam ist, wenn die Modelle über eine ausreichende initiale Schlussfolgerungskompetenz verfügen, um ihre Marginalisierungsstrategien und Zwischenschritte zu optimieren.

Brian Lu, Hongyu Zhao, Shuo Sun + 3 more2026-03-05🤖 cs.AI

Deterministic Coreset for Lp Subspace

Diese Arbeit stellt den ersten deterministischen iterativen Algorithmus vor, der für beliebige $p \in [1,\infty)$ und $\varepsilon > 0$ eine $\varepsilon$ -Kernmenge mit optimaler Größe ohne logarithmische Faktoren konstruiert, um eine deterministische $\ell_p$ -Unterraumeinbettung zu gewährleisten und damit das $\ell_p$ -Regressionsproblem deterministisch zu lösen.

Rachit Chhaya, Anirban Dasgupta, Dan Feldman + 1 more2026-03-05🤖 cs.LG

Succeeding at Scale: Automated Dataset Construction and Query-Side Adaptation for Multi-Tenant Search

Die Arbeit stellt DevRev-Search vor, einen automatisiert erstellten Benchmark für die technische Kundenunterstützung, der durch eine indexerhaltende Anpassungsstrategie, bei der nur der Query-Encoder feinabgestimmt wird, eine skalierbare und effiziente Lösung für die Domain-Adaption in Multi-Tenant-Suchsystemen bietet.

Prateek Jain, Shabari S Nair, Ritesh Goru + 4 more2026-03-05🤖 cs.AI

← Zurück Weiter →

cs.LG

AMiD: Knowledge Distillation for LLMs with ααα-mixture Assistant Distribution