Geographically-Weighted Weakly Supervised Bayesian High-Resolution Transformer for 200m Resolution Pan-Arctic Sea Ice Concentration Mapping and Uncertainty Estimation using Sentinel-1, RCM, and AMSR2 Data

Diese Studie stellt einen neuartigen, geographisch gewichteten, schwach überwachten Bayesianischen High-Resolution Transformer vor, der Sentinel-1-, RCM- und AMSR2-Daten fusioniert, um eine präzise 200-m-Auflösung der Meereiskonzentration im gesamten Arktischen Ozean mit zuverlässiger Unsicherheitsschätzung zu ermöglichen.

Mabel Heffring, Lincoln Linlin Xu2026-03-05🤖 cs.LG

Orbital Transformers for Predicting Wavefunctions in Time-Dependent Density Functional Theory

Die Arbeit stellt OrbEvo vor, ein äquivariantes Graph-Transformer-Modell, das die zeitliche Entwicklung von Elektronenwellenfunktionen in der zeitabhängigen Dichtefunktionaltheorie (TDDFT) effizient lernt und dabei externe elektrische Felder berücksichtigt, um Quantendynamiken und optische Eigenschaften von Molekülen präzise vorherzusagen.

Xuan Zhang, Haiyang Yu, Chengdong Wang + 3 more2026-03-05🔬 cond-mat.mtrl-sci

MMAI Gym for Science: Training Liquid Foundation Models for Drug Discovery

Die Arbeit stellt das MMAI Gym for Science vor, ein umfassendes Framework zum Training effizienter, auf molekulare Daten spezialisierter Liquid Foundation Models, die in der Wirkstoffentwicklung spezifische Aufgaben wie ADMET-Vorhersage und Retrosynthese trotz geringerer Größe besser bewältigen als deutlich größere allgemeine oder spezialisierte Modelle.

Maksim Kuznetsov, Zulfat Miftahutdinov, Rim Shayakhmetov + 17 more2026-03-05🤖 cs.AI

Q-Measure-Learning for Continuous State RL: Efficient Implementation and Convergence

Die vorgestellte Arbeit entwickelt den Q-Maß-Lernansatz für Reinforcement Learning in kontinuierlichen Zustandsräumen, der durch das Lernen eines gewichteten empirischen Maßes eine effiziente, speicheroptimierte Schätzung der Aktionswertfunktion ermöglicht und deren fast sichere Konvergenz sowie Approximationsfehler unter der Annahme gleichmäßiger Ergodizität theoretisch begründet.

Shengbo Wang2026-03-05🤖 cs.LG

Directional Neural Collapse Explains Few-Shot Transfer in Self-Supervised Learning

Die Arbeit zeigt, dass die gerichtete CDNV (Varianz der Entscheidungsachsen) als zentrale geometrische Größe sowohl die starke Few-Shot-Transferfähigkeit als auch die geringe Interferenz bei Multi-Task-Aufgaben in selbstüberwachtem Lernen erklärt, indem sie eine geringe Variabilität entlang klassentrennender Richtungen sicherstellt.

Achleshwar Luthra, Yash Salunkhe, Tomer Galanti2026-03-05✓ Author reviewed 🤖 cs.AI

Trade-offs in Ensembling, Merging and Routing Among Parameter-Efficient Experts

Die Studie untersucht die Vor- und Nachteile von Ensembling, Merging und Routing bei der Fusion von parametereffizienten Experten in großen Sprachmodellen und zeigt, dass zwar nicht-uniforme Methoden die Leistung verbessern, Routing jedoch die größten Gewinne bietet, wobei durch Clusterung und greedy-Auswahl die Rechenkosten effektiv gesenkt werden können.

Sanae Lotfi, Lucas Caccia, Alessandro Sordoni + 2 more2026-03-05🤖 cs.LG

Build, Judge, Optimize: A Blueprint for Continuous Improvement of Multi-Agent Consumer Assistants

Diese Arbeit stellt einen praktischen Leitfaden zur Bewertung und Optimierung von Multi-Agenten-KI-Einkaufsassistenten vor, der eine mehrdimensionale Evaluierungsrubrik, eine kalibrierte LLM-as-Judge-Pipeline sowie zwei komplementäre Prompt-Optimierungsstrategien (Sub-agent GEPA und MAMuT GEPA) für die Produktionsskalierung umfasst.

Alejandro Breen Herrera, Aayush Sheth, Steven G. Xu + 5 more2026-03-05🤖 cs.AI

Controllable Generative Sandbox for Causal Inference

Das Paper stellt CausalMix vor, ein variationsbasiertes generatives Framework, das durch die Kombination von Misch-Gauß-Verteilungen und datentypspezifischen Dekodern sowohl realistische gemischte tabellarische Daten erzeugt als auch eine präzise, unabhängige Kontrolle über kausale Mechanismen wie Überlappung, Konfundierung und Heterogenität des Behandlungseffekts ermöglicht.

Qi Zhang, Harsh Parikh, Ashley Naimi + 3 more2026-03-05🤖 cs.LG

SENTINEL: Stagewise Integrity Verification for Pipeline Parallel Decentralized Training

Das Paper stellt SENTINEL vor, einen leichten Verifikationsmechanismus auf Basis von Exponential Moving Averages, der die Integrität beim dezentralen Pipeline-Parallel-Training über unzuverlässige Knoten sicherstellt, ohne Berechnungen zu duplizieren, und dabei theoretische Konvergenzgarantien sowie erfolgreiche Experimente mit 4-Milliarden-Parameter-Modellen bietet.

Hadi Mohaghegh Dolatabadi, Thalaiyasingam Ajanthan, Sameera Ramasinghe + 5 more2026-03-05🤖 cs.LG

Hybrid Belief Reinforcement Learning for Efficient Coordinated Spatial Exploration

Diese Arbeit stellt einen hybriden Belief-Reinforcement-Learning-Ansatz vor, der die räumliche Unsicherheitsschätzung mittels Log-Gaussian-Cox-Prozessen mit dem effizienten Trajektorienlernen eines Soft Actor-Critic-Agenten kombiniert, um durch dualen Wissenstransfer und koordinierte Abdeckung die Leistung mehrerer autonomer Agenten bei der Erkundung heterogener räumlicher Nachfrage signifikant zu verbessern.

Danish Rizvi, David Boyle2026-03-05🤖 cs.LG