cs.LG Arbeiten | Gist.Science

STREAM-VAE: Dual-Path Routing for Slow and Fast Dynamics in Vehicle Telemetry Anomaly Detection

Die Arbeit stellt STREAM-VAE vor, ein Variational-Autoencoder-Modell mit dualer Pfad-Routing-Architektur, das durch die getrennte Erfassung langsamer Drifts und schneller Spitzen in Fahrzeugtelemetriedaten die Zuverlässigkeit der Anomalieerkennung im Vergleich zu bestehenden Methoden verbessert.

Kadir-Kaan Özer, René Ebeling, Markus Enzweiler2026-03-12🤖 cs.LG

Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

Die vorgestellte Arbeit präsentiert einen hierarchischen Dual-Strategie-Ansatz zum selektiven Vergessen spezifischen Wissens in medizinischen Large Language Models, der durch geometrisch eingeschränkte Gradientenupdates und token-level Interventionen eine hohe Privatsphäre bei gleichzeitiger Erhaltung grundlegender medizinischer Kompetenzen gewährleistet.

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing Chen2026-03-12🤖 cs.LG

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

Das Paper stellt CostNav vor, einen physikalisch fundierten Benchmark, der autonome Navigationsagenten anhand realer wirtschaftlicher Kosten und Einnahmen bewertet und dabei zeigt, dass aktuelle Methoden trotz hoher Erfolgswahrscheinlichkeit bei vereinfachten Aufgaben kommerziell nicht tragfähig sind.

Haebin Seong, Sungmin Kim, Yongjun Cho, Myunchul Joe, Geunwoo Kim, Yubeen Park, Sunhoo Kim, Yoonshik Kim, Suhwan Choi, Jaeyoon Jung, Jiyong Youn, Jinmyung Kwak, Sunghee Ahn, Jaemin Lee, Younggil Do, Seungyeop Yi, Woojin Cheong, Minhyeok Oh, Minchan Kim, Seongjae Kang, Samwoo Seong, Youngjae Yu, Yunsung Lee2026-03-12🤖 cs.AI

Partially Equivariant Reinforcement Learning in Symmetry-Breaking Environments

Die Arbeit stellt Partially Equivariant Reinforcement Learning vor, ein Framework, das durch die selektive Anwendung von gruppeninvarianten Bellman-Updates in teilweise symmetriebrechenden Umgebungen die Generalisierungsfähigkeit und Sample-Effizienz von Reinforcement-Learning-Algorithmen signifikant verbessert.

Junwoo Chang, Minwoo Park, Joohwan Seo, Roberto Horowitz, Jongmin Lee, Jongeun Choi2026-03-12🤖 cs.LG

Cross-embodied Co-design for Dexterous Hands

Die Arbeit stellt einen Co-Design-Rahmen vor, der die morphologische Gestaltung und die Steuerung dexterer Roboterhände gemeinsam optimiert, um innerhalb von 24 Stunden eine vollständige Pipeline von der Simulation bis zum realen Einsatz zu ermöglichen.

Kehlani Fay, Darin Anthony Djapri, Anya Zorin, James Clinton, Ali El Lahib, Hao Su, Michael T. Tolley, Sha Yi, Xiaolong Wang2026-03-12🤖 cs.LG

A scalable and real-time neural decoder for topological quantum codes

Die Arbeit stellt AlphaQubit 2 vor, einen skalierbaren und Echtzeit-fähigen neuronalen Decoder, der für Oberflächencodes und Farbcodes nahezu optimale logische Fehlerraten erreicht und dabei die Geschwindigkeit und Genauigkeit bestehender Entschlüsselungsverfahren deutlich übertrifft.

Andrew W. Senior, Thomas Edlich, Francisco J. H. Heras, Lei M. Zhang, Oscar Higgott, James S. Spencer, Taylor Applebaum, Sam Blackwell, Justin Ledford, Akvil\.e Žemgulyt\.e, Augustin Žídek, Noah Shutty, Andrew Cowie, Yin Li, George Holland, Peter Brooks, Charlie Beattie, Michael Newman, Alex Davies, Cody Jones, Sergio Boixo, Hartmut Neven, Pushmeet Kohli, Johannes Bausch2026-03-12⚛️ quant-ph

Toward Closed-loop Molecular Discovery via Language Model, Property Alignment and Strategic Search

Das Paper stellt Trio vor, ein geschlossenes Framework für die molekulare Entdeckung, das fragmentbasierte Sprachmodelle, Reinforcement Learning und Monte-Carlo-Baumsuche integriert, um interpretierbare, synthetisch machbare und hochwirksame Liganden mit verbesserter Bindungsaffinität, Arzneimitteleigenschaften und Diversität zu generieren.

Junkai Ji, Zhangfan Yang, Dong Xu, Ruibin Bai, Jianqiang Li, Tingjun Hou, Zexuan Zhu2026-03-12🤖 cs.AI

Maximum Risk Minimization with Random Forests

Dieses Paper stellt effiziente Random-Forest-Varianten vor, die das Prinzip der Minimierung des maximalen Risikos (MaxRM) über verschiedene Umgebungen hinweg anwenden, um die Generalisierungsfähigkeit bei Out-of-Distribution-Szenarien zu verbessern, und liefert sowohl konsistente Algorithmen als auch neue theoretische Garantien für verschiedene Risikomaße.

Francesco Freni, Anya Fries, Linus Kühne, Markus Reichstein, Jonas Peters2026-03-12📊 stat

PvP: Data-Efficient Humanoid Robot Learning with Proprioceptive-Privileged Contrastive Representations

Die Arbeit stellt PvP vor, ein kontrastives Lernframework, das propriozeptive und privilegierte Zustände nutzt, um die Effizienz und Stabilität des Reinforcement-Learning-basierten Ganzkörperkontrolls für humanoide Roboter zu verbessern, und führt gleichzeitig SRL4Humanoid als einheitliches Evaluierungsframework ein.

Mingqi Yuan, Tao Yu, Haolin Song, Bo Li, Xin Jin, Hua Chen, Wenjun Zeng2026-03-12🤖 cs.LG

Pretrained battery transformer (PBT): A foundation model for universal battery life prediction

Die Studie stellt den „Pretrained Battery Transformer" (PBT) als ersten universellen Grundmodell für die Vorhersage der Batterielebensdauer vor, der durch den Einsatz von wissenscodierten Mixture-of-Experts-Schichten auf heterogenen Daten trainiert wird und damit den aktuellen Stand der Technik bei der Lebensdauervorhersage verschiedener Batterietypen deutlich übertrifft.

Ruifeng Tan, Weixiang Hong, Jia Li, Jiaqiang Huang, Tong-Yi Zhang2026-03-12🤖 cs.LG

NMIRacle: Multi-modal Generative Molecular Elucidation from IR and NMR Spectra

Die Arbeit stellt NMIRacle vor, ein zweistufiges generatives KI-Framework, das aus IR- und NMR-Spektren präzise Molekülstrukturen ableitet, indem es fragmentbasierte chemische Modelle mit spektralen Daten verknüpft und dabei bestehende Methoden in Bezug auf Genauigkeit und Robustheit übertrifft.

Federico Ottomano, Yingzhen Li, Alex M. Ganose2026-03-12🔬 physics

Saddle-to-Saddle Dynamics Explains A Simplicity Bias Across Neural Network Architectures

Die Arbeit stellt ein theoretisches Rahmenwerk vor, das erklärt, wie Sattel-zu-Sattel-Dynamiken beim Gradientenabstieg in verschiedenen neuronalen Netzarchitekturen zu einem systematischen Einfachheitsbias führen, bei dem Lösungen schrittweise komplexer werden, indem sie nacheinander invariante Mannigfaltigkeiten durchlaufen.

Yedi Zhang, Andrew Saxe, Peter E. Latham2026-03-12🤖 cs.LG

Data relativistic uncertainty framework for low-illumination anime scenery image enhancement

Diese Studie stellt ein datenbasiertes relativistisches Unsicherheitsframework (DRU) vor, das speziell für die Verbesserung von schlecht beleuchteten Anime-Hintergrundbildern entwickelt wurde, indem es ein neues Datenset erstellt und Unsicherheitsinformationen nutzt, um die Lernziele dynamisch anzupassen und so die Bildqualität über den aktuellen Stand der Technik hinaus zu verbessern.

Yiquan Gao, John See2026-03-12🤖 cs.LG

The Bayesian Geometry of Transformer Attention

Die Studie zeigt, dass Transformer-Modelle in kontrollierten „Bayesian Wind Tunnels" durch eine spezifische geometrische Mechanik, bei der Attention-Module als Routing und Feed-Forward-Netze als Posterior-Updates fungieren, exakte Bayes'sche Inferenz durchführen, was ihre Überlegenheit gegenüber flachen Architekturen erklärt.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12📊 stat

Gradient Dynamics of Attention: How Cross-Entropy Sculpts Bayesian Manifolds

Diese Arbeit zeigt, dass die Gradientendynamik des Cross-Entropy-Trainings in Transformer-Aufmerksamkeitsköpfen durch einen gekoppelten Spezialisationsmechanismus, der einem Zwei-Zeitskalen-EM-Verfahren ähnelt, die interne Geometrie so formt, dass Bayessche Inferenzmanifolde entstehen, welche probabilisches Schlussfolgern im Kontext ermöglichen.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12📊 stat

Geometric Scaling of Bayesian Inference in LLMs

Die Studie zeigt, dass moderne Sprachmodelle die geometrische Struktur aufweisen, die für die bayessche Inferenz notwendig ist, und dass eine gezielte Manipulation dieser Struktur die Unsicherheitsrepräsentation stört, ohne jedoch eine proportionale Verschlechterung des bayesschen Verhaltens zu verursachen, was darauf hindeutet, dass diese Geometrie eher ein privilegiertes Lesesystem als ein einzelner rechnerischer Engpass ist.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12🤖 cs.LG

Inferring Clinically Relevant Molecular Subtypes of Pancreatic Cancer from Routine Histopathology Using Deep Learning

Die Studie stellt PanSubNet vor, ein interpretierbares Deep-Learning-Framework, das aus routinemäßigen H&E-gefärbten Gewebeschnitten molekulare Subtypen des Pankreaskarzinoms (basal-ähnlich und klassisch) mit hoher Genauigkeit vorhersagt und somit eine kosteneffiziente, schnelle und klinisch anwendbare Alternative zu teuren Genexpressionsanalysen bietet.

Abdul Rehman Akbar, Alejandro Levya, Ashwini Esnakula, Elshad Hasanov, Anne Noonan, Lingbin Meng, Susan Tsai, Vaibhav Sahai, Midhun Malla, Sarbajit Mukherjee, Upender Manne, Anil Parwani, Wei Chen, Ashish Manne, Muhammad Khalid Khan Niazi2026-03-12⚡ eess

Over-Searching in Search-Augmented Large Language Models

Diese Arbeit untersucht das Problem des übermäßigen Suchens in suchaugmentierten Large Language Models, führt mit „Tokens Per Correctness" eine neue Metrik zur Bewertung des Kosten-Nutzen-Verhältnisses ein und stellt den OverSearchQA-Datensatz sowie Lösungsansätze vor, um die Effizienz und Genauigkeit dieser Systeme zu verbessern.

Roy Xie, Deepak Gopinath, David Qiu, Dong Lin, Haitian Sun, Saloni Potdar, Bhuwan Dhingra2026-03-12🤖 cs.LG

Sampling via Stochastic Interpolants by Langevin-based Velocity and Initialization Estimation in Flow ODEs

Die Autoren stellen eine neue Methode vor, die auf stochastischen Interpolanten und Langevin-Samplern basiert, um effizient aus unnormalisierten Boltzmann-Verteilungen zu sampeln und dabei sowohl die Geschwindigkeitsfelder der zugehörigen ODEs zu schätzen als auch Konvergenzgarantien für multimodale Verteilungen und Bayes'sche Inferenz aufzuzeigen.

Chenguang Duan, Yuling Jiao, Gabriele Steidl, Christian Wald, Jerry Zhijian Yang, Ruizhe Zhang2026-03-12📊 stat

Error Analysis of Bayesian Inverse Problems with Generative Priors

Diese Arbeit analysiert Bayesianische Inverse Probleme mit generativen Priors, indem sie quantitative Fehlerabschätzungen für den Posterior herleitet, die sich aus der Approximationsgüte des Priors im Wasserstein-Abstand ableiten lassen, und diese Ergebnisse durch numerische Experimente sowie ein inverses Problem mit elliptischer PDE validiert.

Bamdad Hosseini, Ziqi Huang2026-03-12📊 stat

← Zurück Weiter →