cs.LG Arbeiten | Gist.Science

Test-Time Meta-Adaptation with Self-Synthesis

Die Arbeit stellt MASS vor, ein Meta-Lern-Framework, das Large Language Models befähigt, sich während der Inferenz durch die Generierung und Optimierung von problemspezifischen synthetischen Trainingsdaten sowie anschließende gezielte Selbst-Updates an neue Aufgaben anzupassen.

Zeyneb N. Kaya, Nick Rui2026-03-05🤖 cs.AI

Logit-Level Uncertainty Quantification in Vision-Language Models for Histopathology Image Analysis

Diese Studie schlägt ein Logit-Level-Uncertainty-Quantifizierungs-Framework vor, um die Zuverlässigkeit von Vision-Language-Modellen in der histopathologischen Bildanalyse zu bewerten, wobei festgestellt wird, dass diese Modelle trotz starker stochastischer Sensitivität nur minimale Temperatureffekte aufweisen.

Betul Yurdem, Ferhat Ozgur Catak, Murat Kuzlu + 1 more2026-03-05🤖 cs.LG

mlx-snn: Spiking Neural Networks on Apple Silicon via MLX

Die Arbeit stellt mlx-snn vor, die erste native Bibliothek für Spiking Neural Networks auf Apple Silicon, die auf dem MLX-Framework aufbaut und durch effiziente Speichernutzung sowie beschleunigtes Training eine leistungsstarke Alternative zu PyTorch-basierten Lösungen bietet.

Jiahao Qin2026-03-05🤖 cs.AI

Directional Neural Collapse Explains Few-Shot Transfer in Self-Supervised Learning

Die Arbeit zeigt, dass die gerichtete CDNV (Varianz der Entscheidungsachsen) als zentrale geometrische Größe sowohl die starke Few-Shot-Transferfähigkeit als auch die geringe Interferenz bei Multi-Task-Aufgaben in selbstüberwachtem Lernen erklärt, indem sie eine geringe Variabilität entlang klassentrennender Richtungen sicherstellt.

Achleshwar Luthra, Yash Salunkhe, Tomer Galanti2026-03-05✓ Author reviewed ⓘ🤖 cs.AI

Role-Aware Conditional Inference for Spatiotemporal Ecosystem Carbon Flux Prediction

Die Arbeit stellt RACI vor, ein prozessgestütztes Lernframework, das durch hierarchische zeitliche Kodierung und rollenbewusste räumliche Suche die Vorhersage von Kohlenstoffflüssen in heterogenen Ökosystemen verbessert, indem es langsame Regime-Bedingungen von schnellen dynamischen Antrieben trennt.

Yiming Sun, Runlong Yu, Rongchao Dong + 6 more2026-03-05🤖 cs.AI

Trade-offs in Ensembling, Merging and Routing Among Parameter-Efficient Experts

Die Studie untersucht die Vor- und Nachteile von Ensembling, Merging und Routing bei der Fusion von parametereffizienten Experten in großen Sprachmodellen und zeigt, dass zwar nicht-uniforme Methoden die Leistung verbessern, Routing jedoch die größten Gewinne bietet, wobei durch Clusterung und greedy-Auswahl die Rechenkosten effektiv gesenkt werden können.

Sanae Lotfi, Lucas Caccia, Alessandro Sordoni + 2 more2026-03-05🤖 cs.LG

Online Learnability of Chain-of-Thought Verifiers: Soundness and Completeness Trade-offs

Diese Arbeit stellt ein Online-Lernframework für Chain-of-Thought-Verifizierer vor, das mithilfe erweiterter Littlestone-Dimensionen die Trade-offs zwischen Soundness und Completeness optimiert, um schwache Beweiser durch einen starken Verifizierer in einen lernfähigen, fehlerarmen Beweisgenerator zu verwandeln.

Maria-Florina Balcan, Avrim Blum, Kiriaki Fragkia + 2 more2026-03-05🤖 cs.LG

Real-time loosely coupled GNSS and IMU integration via Factor Graph Optimization

Diese Arbeit stellt eine Echtzeit-Implementierung einer lose gekoppelten GNSS/IMU-Integration mittels Faktorgraphen-Optimierung vor, die in urbanen Umgebungen eine erhöhte Verfügbarkeit gegenüber Batch-Verfahren bietet, jedoch mit einem Kompromiss bei der Positionsgenauigkeit einhergeht.

Radu-Andrei Cioaca, Cristian Rusu, Paul Irofti + 3 more2026-03-05🤖 cs.LG

Real-time tightly coupled GNSS and IMU integration via Factor Graph Optimization

Diese Arbeit stellt eine Echtzeit-Methode zur eng gekoppelten GNSS-IMU-Integration mittels Faktorengraf-Optimierung vor, die durch inkrementelle Optimierung mit fester Verzögerung eine robuste Positionsbestimmung in stark urbanen Umgebungen ermöglicht.

Radu-Andrei Cioaca, Paul Irofti, Cristian Rusu + 3 more2026-03-05🤖 cs.LG

Build, Judge, Optimize: A Blueprint for Continuous Improvement of Multi-Agent Consumer Assistants

Diese Arbeit stellt einen praktischen Leitfaden zur Bewertung und Optimierung von Multi-Agenten-KI-Einkaufsassistenten vor, der eine mehrdimensionale Evaluierungsrubrik, eine kalibrierte LLM-as-Judge-Pipeline sowie zwei komplementäre Prompt-Optimierungsstrategien (Sub-agent GEPA und MAMuT GEPA) für die Produktionsskalierung umfasst.

Alejandro Breen Herrera, Aayush Sheth, Steven G. Xu + 5 more2026-03-05🤖 cs.AI

Transport Clustering: Solving Low-Rank Optimal Transport via Clustering

Die Arbeit stellt den „Transport Clustering"-Algorithmus vor, der das NP-harte Problem der Low-Rank-Optimal-Transport-Lösung durch eine Reduktion auf ein Clustering-Problem nach einer Transport-Registration in polynomieller Zeit mit konstanten Approximationsfaktoren löst und dabei sowohl theoretische Garantien als auch überlegene empirische Ergebnisse liefert.

Henri Schmidt, Peter Halmos, Ben Raphael2026-03-05🤖 cs.LG

ByteFlow: Language Modeling through Adaptive Byte Compression without a Tokenizer

Das Paper stellt ByteFlow Net vor, eine neue hierarchische Architektur, die feste Tokenizer eliminiert und durch kompressionsbasierte, adaptive Segmentierung von Roh-Byte-Streams eine überlegene Leistung gegenüber herkömmlichen subword-basierten Modellen ermöglicht.

Chunyuan Deng, Sanket Lokegaonkar, Colin Lockard + 3 more2026-03-05🤖 cs.LG

Controllable Generative Sandbox for Causal Inference

Das Paper stellt CausalMix vor, ein variationsbasiertes generatives Framework, das durch die Kombination von Misch-Gauß-Verteilungen und datentypspezifischen Dekodern sowohl realistische gemischte tabellarische Daten erzeugt als auch eine präzise, unabhängige Kontrolle über kausale Mechanismen wie Überlappung, Konfundierung und Heterogenität des Behandlungseffekts ermöglicht.

Qi Zhang, Harsh Parikh, Ashley Naimi + 3 more2026-03-05🤖 cs.LG

SENTINEL: Stagewise Integrity Verification for Pipeline Parallel Decentralized Training

Das Paper stellt SENTINEL vor, einen leichten Verifikationsmechanismus auf Basis von Exponential Moving Averages, der die Integrität beim dezentralen Pipeline-Parallel-Training über unzuverlässige Knoten sicherstellt, ohne Berechnungen zu duplizieren, und dabei theoretische Konvergenzgarantien sowie erfolgreiche Experimente mit 4-Milliarden-Parameter-Modellen bietet.

Hadi Mohaghegh Dolatabadi, Thalaiyasingam Ajanthan, Sameera Ramasinghe + 5 more2026-03-05🤖 cs.LG

Hybrid Belief Reinforcement Learning for Efficient Coordinated Spatial Exploration

Diese Arbeit stellt einen hybriden Belief-Reinforcement-Learning-Ansatz vor, der die räumliche Unsicherheitsschätzung mittels Log-Gaussian-Cox-Prozessen mit dem effizienten Trajektorienlernen eines Soft Actor-Critic-Agenten kombiniert, um durch dualen Wissenstransfer und koordinierte Abdeckung die Leistung mehrerer autonomer Agenten bei der Erkundung heterogener räumlicher Nachfrage signifikant zu verbessern.

Danish Rizvi, David Boyle2026-03-05🤖 cs.LG

MEM: Multi-Scale Embodied Memory for Vision Language Action Models

Die Arbeit stellt MEM (Multi-Scale Embodied Memory) vor, ein Ansatz für Vision-Language-Action-Modelle in der Robotik, der durch die Kombination von video-basiertem Kurzzeit- und textbasiertem Langzeitgedächtnis die Bewältigung komplexer, langfristiger Aufgaben wie das Kochen oder Aufräumen ermöglicht.

Marcel Torne, Karl Pertsch, Homer Walke + 14 more2026-03-05🤖 cs.LG

NuMuon: Nuclear-Norm-Constrained Muon for Compressible LLM Training

Die Arbeit stellt NuMuon vor, einen Optimierer, der den Muon-Algorithmus durch eine Kernnorm-Beschränkung ergänzt, um die Komprimierbarkeit von LLMs zu erhöhen und gleichzeitig die Konvergenzeigenschaften beizubehalten.

Hadi Mohaghegh Dolatabadi, Thalaiyasingam Ajanthan, Sameera Ramasinghe + 7 more2026-03-05🤖 cs.LG

Riemannian Optimization in Modular Systems

Diese Arbeit kombiniert Riemannsche Geometrie, optimale Steuerungstheorie und theoretische Physik, um ein theoretisches Verständnis der Backpropagation zu vertiefen und durch eine rekursive, modulare Riemannsche Metrik sowie kontraktive Stabilitätsgarantien eine effiziente Alternative zum Natural Gradient Descent für die Optimierung modularer Systeme zu entwickeln.

Christian Pehle, Jean-Jacques Slotine2026-03-05🤖 cs.LG

Extending Neural Operators: Robust Handling of Functions Beyond the Training Set

Diese Arbeit entwickelt ein rigoroses Framework zur Erweiterung von neuronalen Operatoren für Out-of-Distribution-Eingaben durch Kernel-Approximation und RKHS-Theorie, was eine zuverlässige Erfassung von Funktionswerten und Ableitungen ermöglicht und an elliptischen PDEs auf Mannigfaltigkeiten validiert wird.

Blaine Quackenbush, Paul J. Atzberger2026-03-05🤖 cs.LG

Riemannian Langevin Dynamics: Strong Convergence of Geometric Euler-Maruyama Scheme

Diese Arbeit beweist die starke Konvergenz mit der Ordnung 1/2 für ein geometrisches Euler-Maruyama-Schema zur Diskretisierung von Riemannischen Langevin-Dynamiken auf Mannigfaltigkeiten und leitet daraus eine Wasserstein-Schranke für das Sampling auf diesen Mannigfaltigkeiten ab.

Zhiyuan Zhan, Masashi Sugiyama2026-03-05🤖 cs.LG

← Zurück Weiter →