Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

Die vorgestellte Arbeit präsentiert einen hierarchischen Dual-Strategie-Ansatz zum selektiven Vergessen spezifischen Wissens in medizinischen Large Language Models, der durch geometrisch eingeschränkte Gradientenupdates und token-level Interventionen eine hohe Privatsphäre bei gleichzeitiger Erhaltung grundlegender medizinischer Kompetenzen gewährleistet.

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing Chen2026-03-12🤖 cs.LG

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

Das Paper stellt CostNav vor, einen physikalisch fundierten Benchmark, der autonome Navigationsagenten anhand realer wirtschaftlicher Kosten und Einnahmen bewertet und dabei zeigt, dass aktuelle Methoden trotz hoher Erfolgswahrscheinlichkeit bei vereinfachten Aufgaben kommerziell nicht tragfähig sind.

Haebin Seong, Sungmin Kim, Yongjun Cho, Myunchul Joe, Geunwoo Kim, Yubeen Park, Sunhoo Kim, Yoonshik Kim, Suhwan Choi, Jaeyoon Jung, Jiyong Youn, Jinmyung Kwak, Sunghee Ahn, Jaemin Lee, Younggil Do, Seungyeop Yi, Woojin Cheong, Minhyeok Oh, Minchan Kim, Seongjae Kang, Samwoo Seong, Youngjae Yu, Yunsung Lee2026-03-12🤖 cs.AI

A scalable and real-time neural decoder for topological quantum codes

Die Arbeit stellt AlphaQubit 2 vor, einen skalierbaren und Echtzeit-fähigen neuronalen Decoder, der für Oberflächencodes und Farbcodes nahezu optimale logische Fehlerraten erreicht und dabei die Geschwindigkeit und Genauigkeit bestehender Entschlüsselungsverfahren deutlich übertrifft.

Andrew W. Senior, Thomas Edlich, Francisco J. H. Heras, Lei M. Zhang, Oscar Higgott, James S. Spencer, Taylor Applebaum, Sam Blackwell, Justin Ledford, Akvil\.e Žemgulyt\.e, Augustin Žídek, Noah Shutty, Andrew Cowie, Yin Li, George Holland, Peter Brooks, Charlie Beattie, Michael Newman, Alex Davies, Cody Jones, Sergio Boixo, Hartmut Neven, Pushmeet Kohli, Johannes Bausch2026-03-12⚛️ quant-ph

Toward Closed-loop Molecular Discovery via Language Model, Property Alignment and Strategic Search

Das Paper stellt Trio vor, ein geschlossenes Framework für die molekulare Entdeckung, das fragmentbasierte Sprachmodelle, Reinforcement Learning und Monte-Carlo-Baumsuche integriert, um interpretierbare, synthetisch machbare und hochwirksame Liganden mit verbesserter Bindungsaffinität, Arzneimitteleigenschaften und Diversität zu generieren.

Junkai Ji, Zhangfan Yang, Dong Xu, Ruibin Bai, Jianqiang Li, Tingjun Hou, Zexuan Zhu2026-03-12🤖 cs.AI

PvP: Data-Efficient Humanoid Robot Learning with Proprioceptive-Privileged Contrastive Representations

Die Arbeit stellt PvP vor, ein kontrastives Lernframework, das propriozeptive und privilegierte Zustände nutzt, um die Effizienz und Stabilität des Reinforcement-Learning-basierten Ganzkörperkontrolls für humanoide Roboter zu verbessern, und führt gleichzeitig SRL4Humanoid als einheitliches Evaluierungsframework ein.

Mingqi Yuan, Tao Yu, Haolin Song, Bo Li, Xin Jin, Hua Chen, Wenjun Zeng2026-03-12🤖 cs.LG

Pretrained battery transformer (PBT): A foundation model for universal battery life prediction

Die Studie stellt den „Pretrained Battery Transformer" (PBT) als ersten universellen Grundmodell für die Vorhersage der Batterielebensdauer vor, der durch den Einsatz von wissenscodierten Mixture-of-Experts-Schichten auf heterogenen Daten trainiert wird und damit den aktuellen Stand der Technik bei der Lebensdauervorhersage verschiedener Batterietypen deutlich übertrifft.

Ruifeng Tan, Weixiang Hong, Jia Li, Jiaqiang Huang, Tong-Yi Zhang2026-03-12🤖 cs.LG

Data relativistic uncertainty framework for low-illumination anime scenery image enhancement

Diese Studie stellt ein datenbasiertes relativistisches Unsicherheitsframework (DRU) vor, das speziell für die Verbesserung von schlecht beleuchteten Anime-Hintergrundbildern entwickelt wurde, indem es ein neues Datenset erstellt und Unsicherheitsinformationen nutzt, um die Lernziele dynamisch anzupassen und so die Bildqualität über den aktuellen Stand der Technik hinaus zu verbessern.

Yiquan Gao, John See2026-03-12🤖 cs.LG

Geometric Scaling of Bayesian Inference in LLMs

Die Studie zeigt, dass moderne Sprachmodelle die geometrische Struktur aufweisen, die für die bayessche Inferenz notwendig ist, und dass eine gezielte Manipulation dieser Struktur die Unsicherheitsrepräsentation stört, ohne jedoch eine proportionale Verschlechterung des bayesschen Verhaltens zu verursachen, was darauf hindeutet, dass diese Geometrie eher ein privilegiertes Lesesystem als ein einzelner rechnerischer Engpass ist.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12🤖 cs.LG

Inferring Clinically Relevant Molecular Subtypes of Pancreatic Cancer from Routine Histopathology Using Deep Learning

Die Studie stellt PanSubNet vor, ein interpretierbares Deep-Learning-Framework, das aus routinemäßigen H&E-gefärbten Gewebeschnitten molekulare Subtypen des Pankreaskarzinoms (basal-ähnlich und klassisch) mit hoher Genauigkeit vorhersagt und somit eine kosteneffiziente, schnelle und klinisch anwendbare Alternative zu teuren Genexpressionsanalysen bietet.

Abdul Rehman Akbar, Alejandro Levya, Ashwini Esnakula, Elshad Hasanov, Anne Noonan, Lingbin Meng, Susan Tsai, Vaibhav Sahai, Midhun Malla, Sarbajit Mukherjee, Upender Manne, Anil Parwani, Wei Chen, Ashish Manne, Muhammad Khalid Khan Niazi2026-03-12⚡ eess

Over-Searching in Search-Augmented Large Language Models

Diese Arbeit untersucht das Problem des übermäßigen Suchens in suchaugmentierten Large Language Models, führt mit „Tokens Per Correctness" eine neue Metrik zur Bewertung des Kosten-Nutzen-Verhältnisses ein und stellt den OverSearchQA-Datensatz sowie Lösungsansätze vor, um die Effizienz und Genauigkeit dieser Systeme zu verbessern.

Roy Xie, Deepak Gopinath, David Qiu, Dong Lin, Haitian Sun, Saloni Potdar, Bhuwan Dhingra2026-03-12🤖 cs.LG

Sampling via Stochastic Interpolants by Langevin-based Velocity and Initialization Estimation in Flow ODEs

Die Autoren stellen eine neue Methode vor, die auf stochastischen Interpolanten und Langevin-Samplern basiert, um effizient aus unnormalisierten Boltzmann-Verteilungen zu sampeln und dabei sowohl die Geschwindigkeitsfelder der zugehörigen ODEs zu schätzen als auch Konvergenzgarantien für multimodale Verteilungen und Bayes'sche Inferenz aufzuzeigen.

Chenguang Duan, Yuling Jiao, Gabriele Steidl, Christian Wald, Jerry Zhijian Yang, Ruizhe Zhang2026-03-12📊 stat