cs.LG Arbeiten | Gist.Science

DT-BEHRT: Disease Trajectory-aware Transformer for Interpretable Patient Representation Learning

Die Studie stellt DT-BEHRT vor, einen graphenbasierten Transformer, der durch die explizite Modellierung von Krankheitsverläufen und eine maßgeschneiderte Vorverarbeitungsmethode interpretierbare Patientenrepräsentationen für die klinische Entscheidungsfindung erzeugt.

Deyi Li, Zijun Yao, Qi Xu, Muxuan Liang, Lingyao Li, Zijian Xu, Mei Liu2026-03-12🤖 cs.LG

Stability and Robustness via Regularization: Bandit Inference via Regularized Stochastic Mirror Descent

Diese Arbeit entwickelt eine systematische Stabilitätstheorie für Banditalgorithmen auf Basis des stochastischen spiegelnden Abstiegs, führt regularisierte EXP3-Varianten ein, die sowohl für gültige statistische Inferenz als auch für minimax-optimales Lernen sorgen, und zeigt deren Robustheit gegenüber adversarischen Korruptionen.

Budhaditya Halder, Ishan Sengupta, Koustav Chowdhury, Koulik Khamaru2026-03-12📊 stat

ARCHE: Autoregressive Residual Compression with Hyperprior and Excitation

Die Arbeit stellt ARCHE vor, ein effizientes, auf End-to-End-Lernen basierendes Bildkompressionsframework, das durch die Kombination von hierarchischen, räumlichen und kanalbasierten Priors sowie adaptiver Merkmalsneujustierung ohne rekurrente oder Transformer-Komponenten einen neuen State-of-the-Art in der Rate-Distortion-Leistung bei gleichzeitig hoher Recheneffizienz erreicht.

Sofia Iliopoulou, Dimitris Ampeliotis, Athanassios Skodras2026-03-12⚡ eess

Adaptive Activation Cancellation for Hallucination Mitigation in Large Language Models

Die Arbeit stellt Adaptive Activation Cancellation (AAC) vor, ein Echtzeit-Inferenz-Verfahren, das Halluzinationen in großen Sprachmodellen durch die gezielte Unterdrückung spezifischer neuronaler Aktivierungen ohne Nachtraining oder externe Wissensquellen reduziert und dabei gleichzeitig die allgemeine Sprachfähigkeit und das logische Denken des Modells vollständig erhält.

Eric Yocam, Varghese Vaidyan, Gurcan Comert, Paris Kalathas, Yong Wang, Judith L. Mwakalonge2026-03-12💬 cs.CL

Actor-Accelerated Policy Dual Averaging for Reinforcement Learning in Continuous Action Spaces

Dieses Paper stellt die actor-accelerated PDA vor, eine Methode, die ein gelerntes Policy-Netzwerk nutzt, um die rechenintensive Optimierung bei der Policy Dual Averaging in kontinuierlichen Aktionsräumen zu beschleunigen, dabei die theoretischen Konvergenzgarantien bewahrt und in Benchmarks die Leistung von PPO übertrifft.

Ji Gao, Caleb Ju, Guanghui Lan, Zhaohui Tong2026-03-12🤖 cs.LG

Hybrid Hidden Markov Model for Modeling Equity Excess Growth Rate Dynamics: A Discrete-State Approach with Jump-Diffusion

Die Studie stellt ein hybrides Hidden-Markov-Modell vor, das diskrete Marktzustände mit einem Poisson-Sprungmechanismus kombiniert, um synthetische Aktienrenditen zu erzeugen, die sowohl die Verteilungseigenschaften als auch die zeitliche Struktur und Volatilitätsclustering realer Marktdaten besser abbilden als bestehende Ansätze wie GARCH oder Standard-HMMs.

Abdulrahman Alswaidan, Jeffrey D. Varner2026-03-12💰 q-fin

Flexible Cutoff Learning: Optimizing Machine Learning Potentials After Training

Die Studie stellt Flexible Cutoff Learning (FCL) vor, eine Methode zum Trainieren von Machine-Learning-Potenzialen mit nachträglich anpassbaren Abstandsabschnitten, die es ermöglicht, einen einzigen allgemeinen Ansatz für verschiedene Anwendungen zu optimieren, ohne das Modell neu trainieren zu müssen.

Rick Oerder (Institute for Numerical Simulation, University of Bonn, Fraunhofer Institute for Algorithms and Scientific Computing SCAI), Jan Hamaekers (Fraunhofer Institute for Algorithms and Scientific Computing SCAI)2026-03-12🔬 cond-mat.mtrl-sci

FusionNet: a frame interpolation network for 4D heart models

Das Paper stellt FusionNet vor, ein neuronales Netzwerk, das aus kurzen CMR-Aufnahmen hochauflösende 4D-Herzbewegungen rekonstruiert, indem es Zwischenformen schätzt, und erreicht dabei mit einem Dice-Koeffizienten von über 0,897 eine präzisere Formwiederherstellung als bestehende Methoden.

Chujie Chang, Shoko Miyauchi, Ken'ichi Morooka, Ryo Kurazume, Oscar Martinez Mozos2026-03-12🤖 cs.LG

SDSR: A Spectral Divide-and-Conquer Approach for Species Tree Reconstruction

Die Arbeit stellt SDSR vor, einen skalierbaren, auf spektraler Graphentheorie basierenden Divide-and-Conquer-Algorithmus zur Rekonstruktion von Speziesbäumen, der die Rechenzeit im Vergleich zu herkömmlichen Methoden um das Zehnfache reduziert, ohne dabei die Genauigkeit der phylogenetischen Analyse zu beeinträchtigen.

Ortal Reshef (Hebrew University of Jerusalem), Ofer Glassman (Weizmann Institute of Science), Or Zuk (Hebrew University of Jerusalem), Yariv Aizenbud (Tel Aviv University), Boaz Nadler (Weizmann Institute of Science), Ariel Jaffe (Hebrew University of Jerusalem)2026-03-12🧬 q-bio

A Diffusion Analysis of Policy Gradient for Stochastic Bandits

Diese Arbeit analysiert eine Diffusionsapproximation des Policy-Gradient-Verfahrens für stochastische Banditen, indem sie zeigt, dass bei einer Lernrate von $\eta = O(\Delta^2/\log(n))$ ein logarithmisches Regret von $O(k \log(k) \log(n) / \eta)$ erreicht wird, während für bestimmte Instanzen mit logarithmisch vielen Armen eine lineare Lernrate $\eta = O(\Delta^2)$ erforderlich ist, um lineares Regret zu vermeiden.

Tor Lattimore2026-03-12📊 stat

Rethinking the Harmonic Loss via Non-Euclidean Distance Layers

Diese Arbeit erweitert den harmonischen Verlust über die reine euklidische Geometrie hinaus, indem sie systematisch verschiedene nicht-euklidische Distanzmetriken untersucht und nachweist, dass insbesondere kosinus-basierte Ansätze in Vision- und Sprachmodellen die Genauigkeit, Interpretierbarkeit und Nachhaltigkeit im Vergleich zur herkömmlichen Kreuzentropie verbessern.

Maxwell Miller-Golub, Kamil Faber, Marcin Pietron, Panpan Zheng, Pasquale Minervini, Roberto Corizzo2026-03-12🤖 cs.LG

A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

Dieses Paper stellt eine neue Trust-Region-Innenpunkt-Stochastische-Sequentielle-Quadratische-Programmierung-Methode (TR-IP-SSQP) vor, die stochastische Zielfunktionen mit deterministischen nichtlinearen Nebenbedingungen löst, globale Konvergenz unter Standardannahmen garantiert und ihre praktische Leistungsfähigkeit an CUTEst-Problemen sowie logistischen Regressionen demonstriert.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad Lavaei2026-03-12🔢 math

Why Does It Look There? Structured Explanations for Image Classification

Die Arbeit stellt I2X vor, ein Framework, das aus unstrukturierten Interpretierbarkeitsmethoden strukturierte Erklärungen für Bildklassifizierungsmodelle ableitet, um deren Entscheidungsfindung während des Trainings nachvollziehbar zu machen und durch gezielte Optimierung der unsicheren Prototypen die Vorhersagegenauigkeit zu verbessern.

Jiarui Li, Zixiang Yin, Samuel J Landry, Zhengming Ding, Ramgopal R. Mettu2026-03-12🤖 cs.LG

One Adapter for All: Towards Unified Representation in Step-Imbalanced Class-Incremental Learning

Die Arbeit stellt „One-A" vor, ein einheitliches Framework für das schrittweise inkrementelle Lernen bei Klassenungleichgewicht, das durch asymmetrische Subraumausrichtung und richtungsabhängiges Gating stabile Updates für große Aufgaben mit plastischen Anpassungen für kleine Aufgaben in einem einzigen Adapter vereint, um die Leistung zu verbessern und die Inferenzkosten konstant zu halten.

Xiaoyan Zhang, Jiangpeng He2026-03-12🤖 cs.LG

Intrinsic Numerical Robustness and Fault Tolerance in a Neuromorphic Algorithm for Scientific Computing

Die Studie zeigt, dass ein neuromorpher Algorithmus zur Lösung partieller Differentialgleichungen eine außergewöhnliche inhärente Fehlertoleranz aufweist, da er bis zu 32 % der Neuronen und 90 % der Spikes verlieren kann, ohne dass die Genauigkeit signifikant beeinträchtigt wird.

Bradley H. Theilman, James B. Aimone2026-03-12🤖 cs.AI

SiMPO: Measure Matching for Online Diffusion Reinforcement Learning

Die Arbeit stellt SiMPO vor, ein einfaches und einheitliches Framework für das Online-Diffusions-Reinforcement-Learning, das durch die Nutzung von $f$ -Divergenz regularisierter Optimierung und negativer Umgewichtierung eine übermäßige Gierigkeit vermeidet und die Leistung durch flexible, geometrisch fundierte Gewichtungsschemata verbessert.

Haitong Ma, Chenxiao Gao, Tianyi Chen, Na Li, Bo Dai2026-03-12🤖 cs.LG

Bayesian Hierarchical Models and the Maximum Entropy Principle

Die Arbeit zeigt, dass die abhängige Randverteilung in bayesschen hierarchischen Modellen, bei denen die bedingte Prior-Verteilung eine kanonische Maximum-Entropie-Verteilung ist, ebenfalls eine Maximum-Entropie-Eigenschaft bezüglich einer anderen Randverteilungsbedingung aufweist, was die impliziten Annahmen solcher Modelle verdeutlicht.

Brendon J. Brewer2026-03-12📊 stat

Improving TabPFN's Synthetic Data Generation by Integrating Causal Structure

Diese Arbeit verbessert die Qualität und Stabilität der synthetischen Tabellendatengenerierung des Modells TabPFN, indem sie kausale Strukturen durch DAG-basierte Konditionierung und CPDAG-Strategien in den autoregressiven Generierungsprozess integriert, um so kausale Effekte zu erhalten und Scheinkorrelationen zu vermeiden.

Davide Tugnoli, Andrea De Lorenzo, Marco Virgolin, Giovanni Cinà2026-03-12🤖 cs.LG

Discovery of a Hematopoietic Manifold in scGPT Yields a Method for Extracting Performant Algorithms from Biological Foundation Model Internals

Die Studie präsentiert eine dreistufige Methode zur Extraktion eines kompakten, hochleistungsfähigen hämatopoetischen Algorithmus aus dem Foundation-Modell scGPT mittels mechanischer Interpretierbarkeit, der ohne erneutes Training des Ziel-Datensatzes die Leistung bestehender Methoden übertrifft und biologisch interpretierbare Genprogramme offenbart.

Ihor Kendiukhov2026-03-12🧬 q-bio

From Prior to Pro: Efficient Skill Mastery via Distribution Contractive RL Finetuning

Die Arbeit stellt DICE-RL vor, ein effizientes Framework, das vortrainierte generative Robotik-Policies durch eine stabile, sample-effiziente Nachjustierung mit Reinforcement Learning in hochleistungsfähige Expertenmodelle verwandelt, um komplexe Manipulationsaufgaben direkt aus Bilddaten zu meistern.

Zhanyi Sun, Shuran Song2026-03-12🤖 cs.LG

← Zurück Weiter →