cs.LG Arbeiten | Gist.Science

How Far Can Unsupervised RLVR Scale LLM Training?

Diese Arbeit analysiert umfassend das unüberwachte Reinforcement Learning mit verifizierbaren Belohnungen (URLVR), zeigt auf, dass intrinsische Belohnungsmethoden aufgrund einer theoretisch bedingten Konvergenz zur Verschärfung der anfänglichen Modellverteilung zwangsläufig in einem „Rise-and-Fall"-Muster mit anschließendem Zusammenbruch enden, und schlägt externe Belohnungsmechanismen als vielversprechende Alternative zur Überwindung dieser Skalierungsgrenzen vor.

Bingxiang He, Yuxin Zuo, Zeyuan Liu, Shangziqi Zhao, Zixuan Fu, Junlin Yang, Cheng Qian, Kaiyan Zhang, Yuchen Fan, Ganqu Cui, Xiusi Chen, Youbang Sun, Xingtai Lv, Xuekai Zhu, Li Sheng, Ran Li, Huan-ang Gao, Yuchen Zhang, Bowen Zhou, Zhiyuan Liu, Ning Ding2026-03-10🤖 cs.LG

Characterization and upgrade of a quantum graph neural network for charged particle tracking

Diese Arbeit charakterisiert und verbessert eine hybride Quanten-Graph-Neuronale-Netzwerk-Architektur für das Tracking geladener Teilchen bei hohen Luminositäten, wobei neue Erkenntnisse über das Zusammenspiel klassischer und quantenmechanischer Komponenten sowie eine verbesserte Trainingskonvergenz vorgestellt werden.

Matteo Argenton, Laura Cappelli, Concezio Bozzi2026-03-10⚛️ quant-ph

Momentum SVGD-EM for Accelerated Maximum Marginal Likelihood Estimation

Dieses Paper stellt Momentum SVGD-EM vor, eine beschleunigte Variante des EM-Algorithmus für die maximale marginale Likelihood-Schätzung, die durch die Einführung von Nesterov-Acceleration sowohl in den Parameter-Updates als auch im Raum der Wahrscheinlichkeitsmaße eine schnellere Konvergenz in verschiedenen Szenarien erreicht.

Adam Rozzio, Rafael Athanasiades, O. Deniz Akyildiz2026-03-10🤖 cs.LG

A New Lower Bound for the Random Offerer Mechanism in Bilateral Trade using AI-Guided Evolutionary Search

Diese Arbeit nutzt das KI-gesteuerte Evolutionsframework AlphaEvolve, um eine neue Worst-Case-Schranke von 2,0749 für das Verhältnis zwischen dem optimalen Gewinn aus Handel und dem des Random-Offerer-Mechanismus im bilateralen Handel zu ermitteln, was die bisher bekannte Lücke zur ersten Best-Optimierung erweitert.

Yang Cai, Vineet Gupta, Zun Li, Aranyak Mehta2026-03-10🤖 cs.LG

Structural Causal Bottleneck Models

Die Arbeit stellt strukturelle kausale Flaschenhals-Modelle (SCBMs) vor, die kausale Effekte zwischen hochdimensionalen Variablen auf niedrigdimensionale Zusammenfassungen zurückführen, um eine flexible, identifizierbare und schätzbare Dimensionreduktion für Aufgaben wie Transferlernen zu ermöglichen.

Simon Bing, Jonas Wahl, Jakob Runge2026-03-10🤖 cs.LG

Benchmarking Language Modeling for Lossless Compression of Full-Fidelity Audio

Die Studie stellt mit „Trilobyte" ein neues Byte-Level-Tokenisierungsschema vor, das den Einsatz autoregressiver Sprachmodelle für verlustfreie Kompression von hochauflösendem 24-Bit-Audio ermöglicht und dabei zwar FLAC übertrifft, jedoch mit abnehmenden Kompressionsgewinnen bei steigender Bittiefe konfrontiert ist.

Phillip Long, Zachary Novack, Chris Donahue2026-03-10🤖 cs.LG

Split Federated Learning Architectures for High-Accuracy and Low-Delay Model Training

Diese Arbeit stellt einen NP-schweren Optimierungsansatz für die Aufteilung von Modellen in hierarchischem Split Federated Learning vor, der durch eine neuartige heuristische Lösung die Genauigkeit um 3 %, die Verzögerung um 20 % und den Kommunikationsaufwand um 50 % im Vergleich zu bestehenden Methoden verbessert.

Yiannis Papageorgiou, Yannis Thomas, Ramin Khalili, Iordanis Koutsopoulos2026-03-10🤖 cs.LG

Agentic Critical Training

Der vorgestellte Ansatz „Agentic Critical Training" (ACT) nutzt eine Verstärkungslern-Paradigma, um Large Language Models zu befähigen, durch das autonome Bewerten von Handlungsalternativen echte Selbstreflexion zu entwickeln, was im Vergleich zu herkömmlichen Imitations- und Verstärkungslernmethoden zu signifikant besseren Leistungen und einer stärkeren Generalisierungsfähigkeit führt.

Weize Liu, Minghui Liu, Sy-Tuyen Ho, Souradip Chakraborty, Xiyao Wang, Furong Huang2026-03-10🤖 cs.LG

Impermanent: A Live Benchmark for Temporal Generalization in Time Series Forecasting

Das Paper stellt Impermanent vor, ein dynamisches Live-Benchmark-System für Zeitreihenvorhersagen, das die Bewertung von Modellen von statischen Test-Splits auf eine kontinuierliche, sequenzielle Leistungsmessung unter realen zeitlichen Veränderungen umstellt, um die wahre zeitliche Generalisierungsfähigkeit zu erfassen.

Azul Garza, Renée Rosillo, Rodrigo Mendoza-Smith, David Salinas, Andrew Robert Williams, Arjun Ashok, Mononito Goswami, José Martín Juárez2026-03-10🤖 cs.LG

A mixed-frequency approach for exchange rates predictions

Dieser Artikel schlägt einen gemischtfrequenten Ansatz zur Vorhersage von Wechselkursen vor, um die durch zeitliche Aggregation verursachten Informationsverluste zu überwinden und das Meese-Rogoff-Problem zu adressieren, wobei die Wirksamkeit der Methode anhand von CAD/USD-Prognosen nachgewiesen wird.

Raffaele Mattera, Michelangelo Misuraca, Germana Scepi, Maria Spano2026-03-09🤖 cs.LG

A Cognitive Explainer for Fetal ultrasound images classifier Based on Medical Concepts

Diese Arbeit stellt einen interpretierbaren Framework vor, der auf medizinischen Konzepten und einer konzeptbasierten Graph-Convolutional-Neural-Network (GCN) Architektur basiert, um die Entscheidungsfindung bei der Erkennung von Standard-Ebenen in fetalen Ultraschallbildern für Kliniker transparent und nachvollziehbar zu machen.

Yingni Wanga, Yunxiao Liua, Licong Dongc, Xuzhou Wua, Huabin Zhangb, Qiongyu Yed, Desheng Sunc, Xiaobo Zhoue, Kehong Yuan2026-03-09🤖 cs.AI

Correlations Between COVID-19 and Dengue

Diese Studie entwickelt ein auf neuronalen Netzen und LSTM basierendes Korrelationsmodell, das die ähnlichen Trends von COVID-19 und Dengue nutzt, um Dengue-Infektionen in Ländern mit unzureichenden Daten anhand von COVID-19-Daten und externen Faktoren vorherzusagen.

Paula Bergero, Laura P. Schaposnik, Grace Wang2026-03-09🧬 q-bio

Graph Neural Networks on Factor Graphs for Robust, Fast, and Scalable Linear State Estimation with PMUs

Dieses Papier stellt einen skalierbaren und robusten Ansatz zur linearen Zustandsabschätzung in Stromnetzen vor, der Graph Neural Networks auf Faktorgraphen anwendet, um PMU-Messungen effizient zu verarbeiten und Ausfälle lokal zu begrenzen.

Ognjen Kundacina, Mirsad Cosovic, Dragisa Miskovic + 1 more2026-03-09⚡ eess

Expert-Aided Causal Discovery of Ancestral Graphs

Diese Arbeit stellt Ancestral GFlowNet (AGFN) vor, einen neuartigen Reinforcement-Learning-Algorithmus, der die kausale Entdeckung unter latenten Störgrößen ermöglicht, indem er sowohl vorab eingebrachtes als auch unsicheres nachträgliches Expertenwissen integriert und dabei durch eine bayessche Modellierung des Feedbacks zur wahren kausalen Struktur konvergiert.

Tiago da Silva, Bruna Bazaluk, Eliezer de Souza da Silva, António Góis, Salem Lahlou, Dominik Heider, Samuel Kaski, Diego Mesquita, Adèle Helena Ribeiro2026-03-09🤖 cs.LG

A unified framework for learning with nonlinear model classes from arbitrary linear samples

Dieses Paper stellt ein einheitliches Rahmenwerk vor, das das Lernen unbekannter Objekte aus beliebigen linearen Messungen mittels nichtlinearer Modellklassen ermöglicht und durch die Einführung des Konzepts der „Variation" sowie Entropie-Integrale neue, nahezu optimale Generalisierungsgrenzen herleitet, die bestehende Ergebnisse in Bereichen wie Compressed Sensing und Matrix-Sketching vereinen und erweitern.

Ben Adcock, Juan M. Cardenas, Nick Dexter2026-03-09🤖 cs.LG

Estimation of Energy-dissipation Lower-bounds for Neuromorphic Learning-in-memory

Diese Arbeit leitet modellunabhängige theoretische Untergrenzen für den Energieverbrauch neuromorpher Lern-in-Speicher-Optimierer ab, die durch die Anpassung physikalischer Speicherbarrieren an die Optimierungsdynamik die Energieeffizienz bei großen KI-Workloads maximieren.

Zihao Chen, Faiek Ahsan, Johannes Leugering, Gert Cauwenberghs, Shantanu Chakrabartty2026-03-09🤖 cs.AI

Make VLM Recognize Visual Hallucination on Cartoon Character Image with Pose Information

Die vorgestellte Arbeit stellt ein System vor, das Vision-Language-Modelle durch eine posebewusste In-Context-Learning-Methode (PA-ICVL) befähigt, visuelle Halluzinationen in Cartoon-Bildern deutlich genauer zu erkennen als herkömmliche Ansätze, die nur auf RGB-Bilder angewiesen sind.

Bumsoo Kim, Wonseop Shin, Kyuchul Lee, Yonghoon Jung, Sanghyun Seo2026-03-09🤖 cs.AI

BInD: Bond and Interaction-generating Diffusion Model for Multi-objective Structure-based Drug Design

Das Paper stellt BInD vor, einen diffusionsbasierten Generierungsmodellansatz für das strukturabhängige Wirkstoffdesign, der durch wissensbasierte Führung Moleküle und ihre Wechselwirkungen mit Zielproteinen gemeinsam erzeugt, um eine ausgewogene Optimierung mehrerer Ziele wie Bindungsspezifität, Moleküleigenschaften und lokale Geometrie zu erreichen.

Joongwon Lee, Wonho Zhung, Jisu Seo, Woo Youn Kim2026-03-09🤖 cs.LG

Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition

Diese Arbeit stellt eine neuartige zweistufige Pipeline für die automatische Spracherkennung vor, die unüberwachtes Clustering von X-Vektoren mit einem auf Monte-Carlo-Dropout basierenden bayesschen Batch-Active-Learning kombiniert, um durch strategische Stichprobenauswahl den Labelaufwand zu minimieren und die Modellleistung zu optimieren.

Ognjen Kundacina, Vladimir Vincan, Dragisa Miskovic2026-03-09⚡ eess

Predictive Coding Networks and Inference Learning: Tutorial and Survey

Dieses Tutorial und die Übersicht stellen Predictive Coding Networks als eine vielversprechende, biologisch plausible und mathematisch übergeordnete Alternative zum Backpropagation-Algorithmus vor, die durch Inferenzlernen effizientere und vielseitigere Architekturen für überwachtes und unüberwachtes Lernen ermöglicht.

Björn van Zwol, Ro Jefferson, Egon L. van den Broek2026-03-09🤖 cs.AI

← Zurück Weiter →