cs.LG Arbeiten | Gist.Science

Geographically-Weighted Weakly Supervised Bayesian High-Resolution Transformer for 200m Resolution Pan-Arctic Sea Ice Concentration Mapping and Uncertainty Estimation using Sentinel-1, RCM, and AMSR2 Data

Diese Studie stellt einen neuartigen, geographisch gewichteten, schwach überwachten Bayesianischen High-Resolution Transformer vor, der Sentinel-1-, RCM- und AMSR2-Daten fusioniert, um eine präzise 200-m-Auflösung der Meereiskonzentration im gesamten Arktischen Ozean mit zuverlässiger Unsicherheitsschätzung zu ermöglichen.

Mabel Heffring, Lincoln Linlin Xu2026-03-05🤖 cs.LG

Solving adversarial examples requires solving exponential misalignment

Die Studie zeigt, dass die exponentielle Dimensionalität der von neuronalen Netzen wahrgenommenen Konstruktionsräume im Vergleich zu menschlichen Konzepten eine fundamentale Fehlausrichtung darstellt, die als Hauptursache für adversarial examples gilt und nur durch eine Angleichung dieser Dimensionen überwunden werden kann.

Alessandro Salvatore, Stanislav Fort, Surya Ganguli2026-03-05🤖 cs.LG

Orbital Transformers for Predicting Wavefunctions in Time-Dependent Density Functional Theory

Die Arbeit stellt OrbEvo vor, ein äquivariantes Graph-Transformer-Modell, das die zeitliche Entwicklung von Elektronenwellenfunktionen in der zeitabhängigen Dichtefunktionaltheorie (TDDFT) effizient lernt und dabei externe elektrische Felder berücksichtigt, um Quantendynamiken und optische Eigenschaften von Molekülen präzise vorherzusagen.

Xuan Zhang, Haiyang Yu, Chengdong Wang + 3 more2026-03-05🔬 cond-mat.mtrl-sci

MMAI Gym for Science: Training Liquid Foundation Models for Drug Discovery

Die Arbeit stellt das MMAI Gym for Science vor, ein umfassendes Framework zum Training effizienter, auf molekulare Daten spezialisierter Liquid Foundation Models, die in der Wirkstoffentwicklung spezifische Aufgaben wie ADMET-Vorhersage und Retrosynthese trotz geringerer Größe besser bewältigen als deutlich größere allgemeine oder spezialisierte Modelle.

Maksim Kuznetsov, Zulfat Miftahutdinov, Rim Shayakhmetov + 17 more2026-03-05🤖 cs.AI

Q-Measure-Learning for Continuous State RL: Efficient Implementation and Convergence

Die vorgestellte Arbeit entwickelt den Q-Maß-Lernansatz für Reinforcement Learning in kontinuierlichen Zustandsräumen, der durch das Lernen eines gewichteten empirischen Maßes eine effiziente, speicheroptimierte Schätzung der Aktionswertfunktion ermöglicht und deren fast sichere Konvergenz sowie Approximationsfehler unter der Annahme gleichmäßiger Ergodizität theoretisch begründet.

Shengbo Wang2026-03-05🤖 cs.LG

Test-Time Meta-Adaptation with Self-Synthesis

Die Arbeit stellt MASS vor, ein Meta-Lern-Framework, das Large Language Models befähigt, sich während der Inferenz durch die Generierung und Optimierung von problemspezifischen synthetischen Trainingsdaten sowie anschließende gezielte Selbst-Updates an neue Aufgaben anzupassen.

Zeyneb N. Kaya, Nick Rui2026-03-05🤖 cs.AI

Logit-Level Uncertainty Quantification in Vision-Language Models for Histopathology Image Analysis

Diese Studie schlägt ein Logit-Level-Uncertainty-Quantifizierungs-Framework vor, um die Zuverlässigkeit von Vision-Language-Modellen in der histopathologischen Bildanalyse zu bewerten, wobei festgestellt wird, dass diese Modelle trotz starker stochastischer Sensitivität nur minimale Temperatureffekte aufweisen.

Betul Yurdem, Ferhat Ozgur Catak, Murat Kuzlu + 1 more2026-03-05🤖 cs.LG

mlx-snn: Spiking Neural Networks on Apple Silicon via MLX

Die Arbeit stellt mlx-snn vor, die erste native Bibliothek für Spiking Neural Networks auf Apple Silicon, die auf dem MLX-Framework aufbaut und durch effiziente Speichernutzung sowie beschleunigtes Training eine leistungsstarke Alternative zu PyTorch-basierten Lösungen bietet.

Jiahao Qin2026-03-05🤖 cs.AI

Directional Neural Collapse Explains Few-Shot Transfer in Self-Supervised Learning

Die Arbeit zeigt, dass die gerichtete CDNV (Varianz der Entscheidungsachsen) als zentrale geometrische Größe sowohl die starke Few-Shot-Transferfähigkeit als auch die geringe Interferenz bei Multi-Task-Aufgaben in selbstüberwachtem Lernen erklärt, indem sie eine geringe Variabilität entlang klassentrennender Richtungen sicherstellt.

Achleshwar Luthra, Yash Salunkhe, Tomer Galanti2026-03-05✓ Author reviewed ⓘ🤖 cs.AI

Role-Aware Conditional Inference for Spatiotemporal Ecosystem Carbon Flux Prediction

Die Arbeit stellt RACI vor, ein prozessgestütztes Lernframework, das durch hierarchische zeitliche Kodierung und rollenbewusste räumliche Suche die Vorhersage von Kohlenstoffflüssen in heterogenen Ökosystemen verbessert, indem es langsame Regime-Bedingungen von schnellen dynamischen Antrieben trennt.

Yiming Sun, Runlong Yu, Rongchao Dong + 6 more2026-03-05🤖 cs.AI

Trade-offs in Ensembling, Merging and Routing Among Parameter-Efficient Experts

Die Studie untersucht die Vor- und Nachteile von Ensembling, Merging und Routing bei der Fusion von parametereffizienten Experten in großen Sprachmodellen und zeigt, dass zwar nicht-uniforme Methoden die Leistung verbessern, Routing jedoch die größten Gewinne bietet, wobei durch Clusterung und greedy-Auswahl die Rechenkosten effektiv gesenkt werden können.

Sanae Lotfi, Lucas Caccia, Alessandro Sordoni + 2 more2026-03-05🤖 cs.LG

Online Learnability of Chain-of-Thought Verifiers: Soundness and Completeness Trade-offs

Diese Arbeit stellt ein Online-Lernframework für Chain-of-Thought-Verifizierer vor, das mithilfe erweiterter Littlestone-Dimensionen die Trade-offs zwischen Soundness und Completeness optimiert, um schwache Beweiser durch einen starken Verifizierer in einen lernfähigen, fehlerarmen Beweisgenerator zu verwandeln.

Maria-Florina Balcan, Avrim Blum, Kiriaki Fragkia + 2 more2026-03-05🤖 cs.LG

Real-time loosely coupled GNSS and IMU integration via Factor Graph Optimization

Diese Arbeit stellt eine Echtzeit-Implementierung einer lose gekoppelten GNSS/IMU-Integration mittels Faktorgraphen-Optimierung vor, die in urbanen Umgebungen eine erhöhte Verfügbarkeit gegenüber Batch-Verfahren bietet, jedoch mit einem Kompromiss bei der Positionsgenauigkeit einhergeht.

Radu-Andrei Cioaca, Cristian Rusu, Paul Irofti + 3 more2026-03-05🤖 cs.LG

Real-time tightly coupled GNSS and IMU integration via Factor Graph Optimization

Diese Arbeit stellt eine Echtzeit-Methode zur eng gekoppelten GNSS-IMU-Integration mittels Faktorengraf-Optimierung vor, die durch inkrementelle Optimierung mit fester Verzögerung eine robuste Positionsbestimmung in stark urbanen Umgebungen ermöglicht.

Radu-Andrei Cioaca, Paul Irofti, Cristian Rusu + 3 more2026-03-05🤖 cs.LG

Build, Judge, Optimize: A Blueprint for Continuous Improvement of Multi-Agent Consumer Assistants

Diese Arbeit stellt einen praktischen Leitfaden zur Bewertung und Optimierung von Multi-Agenten-KI-Einkaufsassistenten vor, der eine mehrdimensionale Evaluierungsrubrik, eine kalibrierte LLM-as-Judge-Pipeline sowie zwei komplementäre Prompt-Optimierungsstrategien (Sub-agent GEPA und MAMuT GEPA) für die Produktionsskalierung umfasst.

Alejandro Breen Herrera, Aayush Sheth, Steven G. Xu + 5 more2026-03-05🤖 cs.AI

Transport Clustering: Solving Low-Rank Optimal Transport via Clustering

Die Arbeit stellt den „Transport Clustering"-Algorithmus vor, der das NP-harte Problem der Low-Rank-Optimal-Transport-Lösung durch eine Reduktion auf ein Clustering-Problem nach einer Transport-Registration in polynomieller Zeit mit konstanten Approximationsfaktoren löst und dabei sowohl theoretische Garantien als auch überlegene empirische Ergebnisse liefert.

Henri Schmidt, Peter Halmos, Ben Raphael2026-03-05🤖 cs.LG

ByteFlow: Language Modeling through Adaptive Byte Compression without a Tokenizer

Das Paper stellt ByteFlow Net vor, eine neue hierarchische Architektur, die feste Tokenizer eliminiert und durch kompressionsbasierte, adaptive Segmentierung von Roh-Byte-Streams eine überlegene Leistung gegenüber herkömmlichen subword-basierten Modellen ermöglicht.

Chunyuan Deng, Sanket Lokegaonkar, Colin Lockard + 3 more2026-03-05🤖 cs.LG

Controllable Generative Sandbox for Causal Inference

Das Paper stellt CausalMix vor, ein variationsbasiertes generatives Framework, das durch die Kombination von Misch-Gauß-Verteilungen und datentypspezifischen Dekodern sowohl realistische gemischte tabellarische Daten erzeugt als auch eine präzise, unabhängige Kontrolle über kausale Mechanismen wie Überlappung, Konfundierung und Heterogenität des Behandlungseffekts ermöglicht.

Qi Zhang, Harsh Parikh, Ashley Naimi + 3 more2026-03-05🤖 cs.LG

SENTINEL: Stagewise Integrity Verification for Pipeline Parallel Decentralized Training

Das Paper stellt SENTINEL vor, einen leichten Verifikationsmechanismus auf Basis von Exponential Moving Averages, der die Integrität beim dezentralen Pipeline-Parallel-Training über unzuverlässige Knoten sicherstellt, ohne Berechnungen zu duplizieren, und dabei theoretische Konvergenzgarantien sowie erfolgreiche Experimente mit 4-Milliarden-Parameter-Modellen bietet.

Hadi Mohaghegh Dolatabadi, Thalaiyasingam Ajanthan, Sameera Ramasinghe + 5 more2026-03-05🤖 cs.LG

Hybrid Belief Reinforcement Learning for Efficient Coordinated Spatial Exploration

Diese Arbeit stellt einen hybriden Belief-Reinforcement-Learning-Ansatz vor, der die räumliche Unsicherheitsschätzung mittels Log-Gaussian-Cox-Prozessen mit dem effizienten Trajektorienlernen eines Soft Actor-Critic-Agenten kombiniert, um durch dualen Wissenstransfer und koordinierte Abdeckung die Leistung mehrerer autonomer Agenten bei der Erkundung heterogener räumlicher Nachfrage signifikant zu verbessern.

Danish Rizvi, David Boyle2026-03-05🤖 cs.LG

← Zurück Weiter →