cs.LG Arbeiten | Gist.Science

Real-time loosely coupled GNSS and IMU integration via Factor Graph Optimization

Diese Arbeit stellt eine Echtzeit-Implementierung einer lose gekoppelten GNSS/IMU-Integration mittels Faktorgraphen-Optimierung vor, die in urbanen Umgebungen eine erhöhte Verfügbarkeit gegenüber Batch-Verfahren bietet, jedoch mit einem Kompromiss bei der Positionsgenauigkeit einhergeht.

Radu-Andrei Cioaca, Cristian Rusu, Paul Irofti + 3 more2026-03-05🤖 cs.LG

Real-time tightly coupled GNSS and IMU integration via Factor Graph Optimization

Diese Arbeit stellt eine Echtzeit-Methode zur eng gekoppelten GNSS-IMU-Integration mittels Faktorengraf-Optimierung vor, die durch inkrementelle Optimierung mit fester Verzögerung eine robuste Positionsbestimmung in stark urbanen Umgebungen ermöglicht.

Radu-Andrei Cioaca, Paul Irofti, Cristian Rusu + 3 more2026-03-05🤖 cs.LG

Build, Judge, Optimize: A Blueprint for Continuous Improvement of Multi-Agent Consumer Assistants

Diese Arbeit stellt einen praktischen Leitfaden zur Bewertung und Optimierung von Multi-Agenten-KI-Einkaufsassistenten vor, der eine mehrdimensionale Evaluierungsrubrik, eine kalibrierte LLM-as-Judge-Pipeline sowie zwei komplementäre Prompt-Optimierungsstrategien (Sub-agent GEPA und MAMuT GEPA) für die Produktionsskalierung umfasst.

Alejandro Breen Herrera, Aayush Sheth, Steven G. Xu + 5 more2026-03-05🤖 cs.AI

Transport Clustering: Solving Low-Rank Optimal Transport via Clustering

Die Arbeit stellt den „Transport Clustering"-Algorithmus vor, der das NP-harte Problem der Low-Rank-Optimal-Transport-Lösung durch eine Reduktion auf ein Clustering-Problem nach einer Transport-Registration in polynomieller Zeit mit konstanten Approximationsfaktoren löst und dabei sowohl theoretische Garantien als auch überlegene empirische Ergebnisse liefert.

Henri Schmidt, Peter Halmos, Ben Raphael2026-03-05🤖 cs.LG

ByteFlow: Language Modeling through Adaptive Byte Compression without a Tokenizer

Das Paper stellt ByteFlow Net vor, eine neue hierarchische Architektur, die feste Tokenizer eliminiert und durch kompressionsbasierte, adaptive Segmentierung von Roh-Byte-Streams eine überlegene Leistung gegenüber herkömmlichen subword-basierten Modellen ermöglicht.

Chunyuan Deng, Sanket Lokegaonkar, Colin Lockard + 3 more2026-03-05🤖 cs.LG

Controllable Generative Sandbox for Causal Inference

Das Paper stellt CausalMix vor, ein variationsbasiertes generatives Framework, das durch die Kombination von Misch-Gauß-Verteilungen und datentypspezifischen Dekodern sowohl realistische gemischte tabellarische Daten erzeugt als auch eine präzise, unabhängige Kontrolle über kausale Mechanismen wie Überlappung, Konfundierung und Heterogenität des Behandlungseffekts ermöglicht.

Qi Zhang, Harsh Parikh, Ashley Naimi + 3 more2026-03-05🤖 cs.LG

SENTINEL: Stagewise Integrity Verification for Pipeline Parallel Decentralized Training

Das Paper stellt SENTINEL vor, einen leichten Verifikationsmechanismus auf Basis von Exponential Moving Averages, der die Integrität beim dezentralen Pipeline-Parallel-Training über unzuverlässige Knoten sicherstellt, ohne Berechnungen zu duplizieren, und dabei theoretische Konvergenzgarantien sowie erfolgreiche Experimente mit 4-Milliarden-Parameter-Modellen bietet.

Hadi Mohaghegh Dolatabadi, Thalaiyasingam Ajanthan, Sameera Ramasinghe + 5 more2026-03-05🤖 cs.LG

Hybrid Belief Reinforcement Learning for Efficient Coordinated Spatial Exploration

Diese Arbeit stellt einen hybriden Belief-Reinforcement-Learning-Ansatz vor, der die räumliche Unsicherheitsschätzung mittels Log-Gaussian-Cox-Prozessen mit dem effizienten Trajektorienlernen eines Soft Actor-Critic-Agenten kombiniert, um durch dualen Wissenstransfer und koordinierte Abdeckung die Leistung mehrerer autonomer Agenten bei der Erkundung heterogener räumlicher Nachfrage signifikant zu verbessern.

Danish Rizvi, David Boyle2026-03-05🤖 cs.LG

MEM: Multi-Scale Embodied Memory for Vision Language Action Models

Die Arbeit stellt MEM (Multi-Scale Embodied Memory) vor, ein Ansatz für Vision-Language-Action-Modelle in der Robotik, der durch die Kombination von video-basiertem Kurzzeit- und textbasiertem Langzeitgedächtnis die Bewältigung komplexer, langfristiger Aufgaben wie das Kochen oder Aufräumen ermöglicht.

Marcel Torne, Karl Pertsch, Homer Walke + 14 more2026-03-05🤖 cs.LG

NuMuon: Nuclear-Norm-Constrained Muon for Compressible LLM Training

Die Arbeit stellt NuMuon vor, einen Optimierer, der den Muon-Algorithmus durch eine Kernnorm-Beschränkung ergänzt, um die Komprimierbarkeit von LLMs zu erhöhen und gleichzeitig die Konvergenzeigenschaften beizubehalten.

Hadi Mohaghegh Dolatabadi, Thalaiyasingam Ajanthan, Sameera Ramasinghe + 7 more2026-03-05🤖 cs.LG

Riemannian Optimization in Modular Systems

Diese Arbeit kombiniert Riemannsche Geometrie, optimale Steuerungstheorie und theoretische Physik, um ein theoretisches Verständnis der Backpropagation zu vertiefen und durch eine rekursive, modulare Riemannsche Metrik sowie kontraktive Stabilitätsgarantien eine effiziente Alternative zum Natural Gradient Descent für die Optimierung modularer Systeme zu entwickeln.

Christian Pehle, Jean-Jacques Slotine2026-03-05🤖 cs.LG

Extending Neural Operators: Robust Handling of Functions Beyond the Training Set

Diese Arbeit entwickelt ein rigoroses Framework zur Erweiterung von neuronalen Operatoren für Out-of-Distribution-Eingaben durch Kernel-Approximation und RKHS-Theorie, was eine zuverlässige Erfassung von Funktionswerten und Ableitungen ermöglicht und an elliptischen PDEs auf Mannigfaltigkeiten validiert wird.

Blaine Quackenbush, Paul J. Atzberger2026-03-05🤖 cs.LG

Riemannian Langevin Dynamics: Strong Convergence of Geometric Euler-Maruyama Scheme

Diese Arbeit beweist die starke Konvergenz mit der Ordnung 1/2 für ein geometrisches Euler-Maruyama-Schema zur Diskretisierung von Riemannischen Langevin-Dynamiken auf Mannigfaltigkeiten und leitet daraus eine Wasserstein-Schranke für das Sampling auf diesen Mannigfaltigkeiten ab.

Zhiyuan Zhan, Masashi Sugiyama2026-03-05🤖 cs.LG

Adaptive Sensing of Continuous Physical Systems for Machine Learning

Diese Arbeit stellt ein allgemeines Framework vor, bei dem ein trainierbarer Aufmerksamkeitsmechanismus lernt, wie und wo physikalische dynamische Systeme gemessen werden müssen, um die Extraktion nützlicher Informationen für maschinelles Lernen zu optimieren und so die Vorhersagegenauigkeit bei chaotischen Systemen erheblich zu steigern.

Felix Köster, Atsushi Uchida2026-03-05🤖 cs.LG

Freezing of Gait Prediction using Proactive Agent that Learns from Selected Experience and DDQN Algorithm

Diese Studie stellt ein auf Double Deep Q-Networks und priorisierter Erfahrungswiederholung basierendes Reinforcement-Learning-Framework vor, das Freezing-of-Gait-Episoden bei Parkinson-Patienten zuverlässig bis zu 8,72 Sekunden im Voraus vorhersagt, um proaktive Interventionen in tragbaren Assistenzsystemen zu ermöglichen.

Septian Enggar Sukmana, Sang Won Bae, Tomohiro Shibata2026-03-05🤖 cs.LG

Graph Negative Feedback Bias Correction Framework for Adaptive Heterophily Modeling

Dieses Paper stellt den Graph Negative Feedback Bias Correction (GNFBC)-Rahmen vor, der durch die Einführung eines negativen Feedback-Verlusts und die Nutzung graph-unabhängiger Modellvorhersagen die durch Homophilie-Annahmen bedingten Verzerrungen in Graph Neural Networks korrigiert und so deren Leistung auf heterophilen Graphen verbessert.

Jiaqi Lv, Qingfeng Du, Yu Zhang + 2 more2026-03-05🤖 cs.AI

Principled Learning-to-Communicate with Quasi-Classical Information Structures

Diese Arbeit formalisiert das Lernen von Kommunikation in dezentralen, teilweise beobachtbaren Umgebungen durch den Einsatz von Informationsstrukturen, identifiziert quasi-klassische Szenarien als recheneffizient lösbar und entwickelt darauf aufbauend provierbare Algorithmen mit quasi-polynomieller Komplexität.

Xiangyu Liu, Haoyi You, Kaiqing Zhang2026-03-05🤖 cs.LG

Machine Pareidolia: Protecting Facial Image with Emotional Editing

Die Arbeit stellt MAP vor, eine neuartige Methode zum Schutz der Gesichtserkennung, die durch gezielte emotionale Bearbeitung und die gemeinsame Optimierung von Zielidentität und Mimik die Privatsphäre in schwarzen Kisten-Szenarien wirksam bewahrt und dabei eine hohe Bildqualität sowie Robustheit gegenüber verschiedenen demografischen Gruppen und Erkennungssystemen gewährleistet.

Binh M. Le, Simon S. Woo2026-03-05🤖 cs.LG

Local Shapley: Model-Induced Locality and Optimal Reuse in Data Valuation

Die Arbeit stellt „Local Shapley" vor, ein Framework, das die inhärente Lokalität moderner Modelle nutzt, um die Shapley-Wert-Berechnung von einer exponentiell komplexen globalen Aufgabe auf effiziente, modellinduzierte Teilmenge-Prozesse zu reduzieren, und führt dabei den optimalen Algorithmus LSMR sowie dessen Monte-Carlo-Erweiterung LSMR-A ein, die die Anzahl notwendiger Neutraining-Schritte drastisch verringern, ohne die Genauigkeit zu beeinträchtigen.

Xuan Yang, Hsi-Wen Chen, Ming-Syan Chen + 1 more2026-03-05🤖 cs.AI

A Stein Identity for q-Gaussians with Bounded Support

Dieses Paper leitet eine neue Stein-Identität für q-Gaußsche Verteilungen mit beschränktem Träger her, die durch die Verwendung von Eskort-Verteilungen und die Erweiterung bestehender Theoreme Gradientenschätzer mit nahezu gleicher Form wie bei Gaußschen Verteilungen ermöglicht und so die Varianz in Anwendungen wie dem Bayesschen Deep Learning reduziert.

Sophia Sklaviadis, Thomas Moellenhoff, Andre F. T. Martins + 2 more2026-03-05🤖 cs.LG

← Zurück Weiter →