cs.LG Arbeiten | Gist.Science

A Short Note on a Variant of the Squint Algorithm

Diese kurze Notiz stellt eine einfache Variante des Squint-Algorithmus von Koolen und Van Erven vor und beweist mittels einer angepassten Herleitung, dass diese Variante eine Regret-Schranke garantiert, die der kürzlich von Freund et al. für eine NormalHedge-Variante gezeigten entspricht.

Haipeng Luo2026-03-05🤖 cs.LG

Scalable Contrastive Causal Discovery under Unknown Soft Interventions

Die Autoren stellen ein skalierbares Modell zur kausalen Entdeckung vor, das unter der Annahme unbekannter weicher Interventionen durch kontrastives Lernen über Beobachtungs- und Interventionsregimes hinweg eine global konsistente kausale Struktur rekonstruiert und dabei theoretisch fundierte Verbesserungen gegenüber nicht-kontrastiven Methoden sowie eine bessere Generalisierungsfähigkeit bietet.

Mingxuan Zhang, Khushi Desai, Sopho Kevlishvili + 1 more2026-03-05🤖 cs.LG

[Re] FairDICE: A Gap Between Theory And Practice

Diese Replikationsstudie zeigt, dass der FairDICE-Algorithmus zwar theoretisch vielversprechend ist, jedoch aufgrund eines Programmfehlers und unzureichend spezifizierter Hyperparameter in der ursprünglichen Implementierung auf einfaches Behavior Cloning reduziert wurde, was nach Korrektur zwar eine Skalierbarkeit in komplexen Umgebungen bestätigt, aber eine erhebliche Überarbeitung der experimentellen Begründung erfordert.

Peter Adema, Karim Galliamov, Aleksey Evstratovskiy + 1 more2026-03-05🤖 cs.LG

Half the Nonlinearity Is Wasted: Measuring and Reallocating the Transformer's MLP Budget

Die Studie zeigt, dass ein großer Teil der Nichtlinearität in Transformer-MLPs durch kontextabhängiges Routing oder gezieltes Einfrieren linearer Schichten eliminiert werden kann, was bei minimalen oder sogar negativen Kosten zu einer deutlichen Verbesserung der Perplexität führt.

Peter Balogh2026-03-05🤖 cs.LG

Graph Hopfield Networks: Energy-Based Node Classification with Associative Memory

Die Autoren stellen Graph Hopfield Networks vor, ein energiebasiertes Modell für die Knotenklassifizierung, das assoziatives Gedächtnis mit Graph-Laplacien-Glättung kombiniert und durch einen iterativen Energieabstieg sowohl auf spärlichen Zitationsnetzwerken als auch unter Feature-Masking signifikante Verbesserungen gegenüber bestehenden Baselines erzielt.

Abinav Rao, Alex Wa, Rishi Athavale2026-03-05🤖 cs.AI

Biased Generalization in Diffusion Models

Die Arbeit widerlegt die Annahme, dass das Stoppen des Trainings beim Minimum der Testverlustfunktion ausreicht, indem sie eine Phase der „voreingenommenen Generalisierung" in Diffusionsmodellen nachweist, bei der die Modelle trotz sinkender Verluste neuartige Proben zugunsten von solchen mit übermäßiger Ähnlichkeit zu den Trainingsdaten bevorzugen, was insbesondere für datenschutzkritische Anwendungen problematisch ist.

Jerome Garnier-Brun, Luca Biggio, Davide Beltrame + 2 more2026-03-05🤖 cs.LG

When Shallow Wins: Silent Failures and the Depth-Accuracy Paradox in Latent Reasoning

Die Studie zeigt, dass mathematische Reasoning-Modelle trotz hoher Benchmark-Accuracy oft durch instabile, unzuverlässige Denkpfade und stille Fehler gekennzeichnet sind, was eine Diskrepanz zwischen scheinbarer Korrektheit und tatsächlicher Berechnungsstabilität aufdeckt und eine Reform der Evaluierungsmethoden erfordert.

Subramanyam Sahoo, Aman Chadha, Vinija Jain + 1 more2026-03-05🤖 cs.AI

Minimax Optimal Strategy for Delayed Observations in Online Reinforcement Learning

Die Autoren stellen einen minimax-optimalen Algorithmus für das Reinforcement Learning mit verzögerten Zustandsbeobachtungen vor, der durch die Kombination von Augmentierung und Upper Confidence Bound eine Regret-Schranke von $\tilde{\mathcal{O}}(H \sqrt{D_{\max} SAK})$ erreicht und durch ein passendes unteres Limit als optimal nachgewiesen wird.

Harin Lee, Kevin Jamieson2026-03-05🤖 cs.LG

Beyond Pixel Histories: World Models with Persistent 3D State

Das Paper stellt PERSIST vor, ein neues Paradigma für interaktive Weltmodelle, das durch die Simulation eines latenten 3D-Szenenraums mit persistierendem Speicher eine konsistente Geometrie und räumliche Stabilität über lange Zeiträume hinweg ermöglicht und damit bestehende Methoden in Bezug auf 3D-Konsistenz und langfristige Interaktivität übertrifft.

Samuel Garcin, Thomas Walker, Steven McDonagh + 5 more2026-03-05🤖 cs.AI

Optimal trajectory-guided stochastic co-optimization for e-fuel system design and real-time operation

Die Studie stellt MasCOR vor, einen maschinellen Lern-basierten Rahmen zur gemeinsamen Optimierung von Design und Echtzeitbetrieb von E-Fuel-Systemen unter Unsicherheit, der rechnerisch effizient standortspezifische Strategien für die kosteneffiziente und kohlenstoffneutrale Methanolproduktion ableitet.

Jeongdong Kim, Minsu Kim, Jonggeol Na + 1 more2026-03-05🤖 cs.AI

When Small Variations Become Big Failures: Reliability Challenges in Compute-in-Memory Neural Accelerators

Diese Arbeit adressiert die Zuverlässigkeitsprobleme von Rechen-im-Speicher-Neuralbeschleunigern durch eine cross-layer-Optimierung, die selektive Schreibverifikationsmechanismen und ein lernbasiertes Training mit zensiertem Rauschen kombiniert, um trotz kleiner Gerätevarianzen eine robuste und sichere Inferenz zu gewährleisten.

Yifan Qin, Jiahao Zheng, Zheyu Yan + 3 more2026-03-05🤖 cs.LG

Quantifying Ranking Instability Across Evaluation Protocol Axes in Gene Regulatory Network Benchmarking

Diese Studie präsentiert einen systematischen Diagnoserahmen zur Quantifizierung der Instabilität von Method-Rankings bei der Bewertung von Genregulationsnetzwerken, der zeigt, dass Reversal-Raten zwar unter Zufallserwartungen liegen, aber maßgeblich durch Änderungen der Diskriminationsfähigkeit der Methoden und nicht durch Basisraten-Effekte getrieben werden.

Ihor Kendiukhov2026-03-05🤖 cs.LG

Geographically-Weighted Weakly Supervised Bayesian High-Resolution Transformer for 200m Resolution Pan-Arctic Sea Ice Concentration Mapping and Uncertainty Estimation using Sentinel-1, RCM, and AMSR2 Data

Diese Studie stellt einen neuartigen, geographisch gewichteten, schwach überwachten Bayesianischen High-Resolution Transformer vor, der Sentinel-1-, RCM- und AMSR2-Daten fusioniert, um eine präzise 200-m-Auflösung der Meereiskonzentration im gesamten Arktischen Ozean mit zuverlässiger Unsicherheitsschätzung zu ermöglichen.

Mabel Heffring, Lincoln Linlin Xu2026-03-05🤖 cs.LG

Solving adversarial examples requires solving exponential misalignment

Die Studie zeigt, dass die exponentielle Dimensionalität der von neuronalen Netzen wahrgenommenen Konstruktionsräume im Vergleich zu menschlichen Konzepten eine fundamentale Fehlausrichtung darstellt, die als Hauptursache für adversarial examples gilt und nur durch eine Angleichung dieser Dimensionen überwunden werden kann.

Alessandro Salvatore, Stanislav Fort, Surya Ganguli2026-03-05🤖 cs.LG

Orbital Transformers for Predicting Wavefunctions in Time-Dependent Density Functional Theory

Die Arbeit stellt OrbEvo vor, ein äquivariantes Graph-Transformer-Modell, das die zeitliche Entwicklung von Elektronenwellenfunktionen in der zeitabhängigen Dichtefunktionaltheorie (TDDFT) effizient lernt und dabei externe elektrische Felder berücksichtigt, um Quantendynamiken und optische Eigenschaften von Molekülen präzise vorherzusagen.

Xuan Zhang, Haiyang Yu, Chengdong Wang + 3 more2026-03-05🔬 cond-mat.mtrl-sci

MMAI Gym for Science: Training Liquid Foundation Models for Drug Discovery

Die Arbeit stellt das MMAI Gym for Science vor, ein umfassendes Framework zum Training effizienter, auf molekulare Daten spezialisierter Liquid Foundation Models, die in der Wirkstoffentwicklung spezifische Aufgaben wie ADMET-Vorhersage und Retrosynthese trotz geringerer Größe besser bewältigen als deutlich größere allgemeine oder spezialisierte Modelle.

Maksim Kuznetsov, Zulfat Miftahutdinov, Rim Shayakhmetov + 17 more2026-03-05🤖 cs.AI

Q-Measure-Learning for Continuous State RL: Efficient Implementation and Convergence

Die vorgestellte Arbeit entwickelt den Q-Maß-Lernansatz für Reinforcement Learning in kontinuierlichen Zustandsräumen, der durch das Lernen eines gewichteten empirischen Maßes eine effiziente, speicheroptimierte Schätzung der Aktionswertfunktion ermöglicht und deren fast sichere Konvergenz sowie Approximationsfehler unter der Annahme gleichmäßiger Ergodizität theoretisch begründet.

Shengbo Wang2026-03-05🤖 cs.LG

Test-Time Meta-Adaptation with Self-Synthesis

Die Arbeit stellt MASS vor, ein Meta-Lern-Framework, das Large Language Models befähigt, sich während der Inferenz durch die Generierung und Optimierung von problemspezifischen synthetischen Trainingsdaten sowie anschließende gezielte Selbst-Updates an neue Aufgaben anzupassen.

Zeyneb N. Kaya, Nick Rui2026-03-05🤖 cs.AI

Logit-Level Uncertainty Quantification in Vision-Language Models for Histopathology Image Analysis

Diese Studie schlägt ein Logit-Level-Uncertainty-Quantifizierungs-Framework vor, um die Zuverlässigkeit von Vision-Language-Modellen in der histopathologischen Bildanalyse zu bewerten, wobei festgestellt wird, dass diese Modelle trotz starker stochastischer Sensitivität nur minimale Temperatureffekte aufweisen.

Betul Yurdem, Ferhat Ozgur Catak, Murat Kuzlu + 1 more2026-03-05🤖 cs.LG

mlx-snn: Spiking Neural Networks on Apple Silicon via MLX

Die Arbeit stellt mlx-snn vor, die erste native Bibliothek für Spiking Neural Networks auf Apple Silicon, die auf dem MLX-Framework aufbaut und durch effiziente Speichernutzung sowie beschleunigtes Training eine leistungsstarke Alternative zu PyTorch-basierten Lösungen bietet.

Jiahao Qin2026-03-05🤖 cs.AI

← Zurück Weiter →