cs.LG Arbeiten | Gist.Science

Good Reasoning Makes Good Demonstrations: Implicit Reasoning Quality Supervision via In-Context Reinforcement Learning

Die Arbeit stellt „In-Context RLVR" vor, eine Methode, die durch die Nutzung von „Evidence Gain" als implizites Belohnungsgewicht die Qualität von Lösungswegen in Large Language Models verbessert, ohne externe Bewertungsmodelle zu benötigen.

Tiehua Mei, Minxuan Lv, Leiyu Pan, Zhenpeng Su, Hongru Hou, Hengrui Chen, Ao Xu, Deqing Yang2026-03-11🤖 cs.LG

Correction of Transformer-Based Models with Smoothing Pseudo-Projector

Diese Arbeit stellt einen leichtgewichtigen „Pseudo-Projektor" vor, der von der Multigrid-Methode inspiriert ist und als Korrektur für versteckte Repräsentationen in Transformer-Modellen dient, um deren Robustheit gegenüber Rauschen zu erhöhen und das Trainingsverhalten zu verbessern, ohne die Kernarchitektur zu verändern.

Vitaly Bulgakov2026-03-11🤖 cs.AI

A Unified Hierarchical Multi-Task Multi-Fidelity Framework for Data-Efficient Surrogate Modeling in Manufacturing

Diese Arbeit stellt ein neuartiges hierarchisches Multi-Task-Multi-Fidelity-Framework für Gaußsche Prozesse vor, das durch die gleichzeitige Nutzung von Ähnlichkeiten zwischen Aufgaben und fidelityabhängigen Datenmerkmalen die Vorhersagegenauigkeit bei der Surrogatmodellierung in Fertigungssystemen signifikant verbessert.

Manan Mehta, Zhiqiao Dong, Yuhang Yang, Chenhui Shao2026-03-11🤖 cs.LG

A Graph-Based Approach to Spectrum Demand Prediction Using Hierarchical Attention Networks

Diese Arbeit stellt HR-GAT vor, ein hierarchisches Graph-Attention-Netzwerk, das mithilfe von Geodaten die Spektrumnachfrage präziser vorhersagt als herkömmliche Modelle und dabei räumliche Autokorrelationen effektiv berücksichtigt.

Mohamad Alkadamani, Halim Yanikomeroglu, Amir Ghasemi2026-03-11🤖 cs.AI

GAST: Gradient-aligned Sparse Tuning of Large Language Models with Data-layer Selection

Das Paper stellt GAST vor, eine innovative Methode zur parametereffizienten Feinabstimmung großer Sprachmodelle, die durch eine einheitliche Optimierungsstrategie sowohl daten- als auch schichtselektive Anpassungen kombiniert, um Redundanzen zu minimieren und die Leistung gegenüber bestehenden Ansätzen zu steigern.

Kai Yao, Zhenghan Song, Kaixin Wu, Mingjie Zhong, Danzhao Cheng, Zhaorui Tan, Yixin Ji, Penglei Gao2026-03-11🤖 cs.LG

CarbonBench: A Global Benchmark for Upscaling of Carbon Fluxes Using Zero-Shot Learning

Das Paper stellt CarbonBench vor, den ersten globalen Benchmark für das Zero-Shot-Learning zur Hochskalierung von Kohlenstoffflüssen, der über 1,3 Millionen Beobachtungen von 567 Messstellen nutzt, um die Generalisierungsfähigkeit von Modellen auf nicht trainierte Ökosysteme und Klimazonen systematisch zu evaluieren.

Aleksei Rozanov, Arvind Renganathan, Yimeng Zhang, Vipin Kumar2026-03-11🤖 cs.LG

MSSR: Memory-Aware Adaptive Replay for Continual LLM Fine-Tuning

Die Arbeit stellt MSSR vor, ein Erfahrungswiederholungs-Framework für das kontinuierliche Fine-Tuning von LLMs, das durch die Schätzung der samplespezifischen Gedächtnisstärke und adaptive Intervalle für das Rehearsal katastrophales Vergessen effektiv reduziert, ohne die Anpassungsfähigkeit an neue Aufgaben zu beeinträchtigen.

Yiyang Lu, Yu He, Jianlong Chen, Hongyuan Zha2026-03-11🤖 cs.AI

OptEMA: Adaptive Exponential Moving Average for Stochastic Optimization with Zero-Noise Optimality

Die Arbeit stellt OptEMA vor, einen adaptiven Exponential Moving Average-Optimierer für stochastische Probleme, der ohne Kenntnis der Lipschitz-Konstante auskommt und im noise-freien Fall eine nahezu optimale Konvergenzrate von $\widetilde{\mathcal{O}}(T^{-1/2})$ erreicht.

Ganzhao Yuan2026-03-11🤖 cs.LG

Generative Drifting is Secretly Score Matching: a Spectral and Variational Perspective

Diese Arbeit stellt theoretisch dar, dass generatives Drifting unter einem Gaußschen Kernel exakt Score Matching auf geglätteten Verteilungen entspricht, und liefert damit durch eine spektrale und variationale Analyse Erklärungen für die Stabilität des Trainings, die Wahl des Kernels sowie eine neue Bandbreiten-Annealing-Strategie zur Überwindung von Konvergenzengpässen.

Erkan Turan, Maks Ovsjanikov2026-03-11🤖 cs.LG

SignalMC-MED: A Multimodal Benchmark for Evaluating Biosignal Foundation Models on Single-Lead ECG and PPG

Die Studie stellt SignalMC-MED vor, ein multimodales Benchmark-Verfahren zur systematischen Evaluierung von Biosignal-Foundation-Modellen auf synchronisierten EKG- und PPG-Daten, das zeigt, dass domänenspezifische Modelle und multimodale Fusion die Vorhersageleistung verbessern, während längere Signalsegmente vorteilhafter sind als kürzere.

Fredrik K. Gustafsson, Xiao Gu, Mattia Carletti, Patitapaban Palo, David W. Eyre, David A. Clifton2026-03-11🤖 cs.LG

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Die Studie zeigt, dass der Overfitting-Underfitting-Indicator (OUI) bereits zu einem frühen Trainingszeitpunkt von 10 % als wirksames Signal dient, um in PPO-Actor-Critic-Systemen stabile Lernraten von instabilen zu unterscheiden und dadurch ineffiziente Hyperparametersuchen durch eine präzise Früherkennung zu vermeiden.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

Towards a Neural Debugger for Python

Die Arbeit stellt „Neural Debuggers" vor, eine neue Klasse von Sprachmodellen, die traditionelle Debugger-Funktionen wie das Setzen von Haltepunkten und das schrittweise Durchlaufen von Code nachahmen, um sowohl die Vorwärts- als auch die Rückwärtsausführung von Python-Programmen zuverlässig zu modellieren und so die Grundlage für fortschrittlichere Agenten-basierte Codiersysteme zu legen.

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeve2026-03-11🤖 cs.AI

On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer

Die Arbeit führt eine neue Familie von mittelnormalisierten Operator-Normen ein, um stabilen Lernraten-Transfer über verschiedene Netzwerkbreiten hinweg zu ermöglichen, und stellt den darauf basierenden Optimierer MOGA vor, der in großen Sprachmodellen mit Muon konkurrierbar ist und dabei schneller konvergiert.

Ruihan Xu, Jiajin Li, Yiping Lu2026-03-11🤖 cs.LG

From Semantics to Pixels: Coarse-to-Fine Masked Autoencoders for Hierarchical Visual Understanding

Die Arbeit stellt C2FMAE vor, einen hierarchischen Masked Autoencoder, der durch einen kaskadierten Decoder und einen progressiven Maskierungs-Lehrplan semantische, instanzbasierte und pixelgenaue Repräsentationen vereint, um die inhärenten Spannungen zwischen kontrastivem Lernen und Masked Image Modeling aufzulösen und so robustere visuelle Darstellungen zu erlernen.

Wenzhao Xiang, Yue Wu, Hongyang Yu, Feng Gao, Fan Yang, Xilin Chen2026-03-11🤖 cs.LG

Think Before You Lie: How Reasoning Improves Honesty

Die Studie zeigt, dass im Gegensatz zum menschlichen Verhalten das Nachdenken bei großen Sprachmodellen die Ehrlichkeit erhöht, da der Prozess des moralischen Abwägens das Modell durch einen verzerrten Repräsentationsraum führt, in dem ehrliche Antworten stabiler sind als täuschende.

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja Filippova2026-03-11🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

Die Studie zeigt, dass in realistischen Szenarien mit korrelierten Merkmalen Interferenz konstruktiv genutzt werden kann, um semantische Cluster und zyklische Strukturen zu bilden, was die traditionelle Sichtweise der Superposition als rein störendes Rauschen erweitert.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano2026-03-11🤖 cs.AI

Task Aware Modulation Using Representation Learning for Upsaling of Terrestrial Carbon Fluxes

Die Studie stellt TAM-RL vor, ein Framework, das durch die Kombination von räumlich-zeitlichem Repräsentationslernen mit physikalisch fundierten Constraints die Genauigkeit und Übertragbarkeit von hochskalierten terrestrischen Kohlenstoffflüssen im Vergleich zu bestehenden Methoden signifikant verbessert.

Aleksei Rozanov, Arvind Renganathan, Vipin Kumar2026-03-11🤖 cs.LG

Online Neural Networks for Change-Point Detection

In diesem Paper werden zwei auf neuronalen Netzen und Online-Lernen basierende Verfahren zur Erkennung von Strukturbrüchen in großen Zeitreihen vorgestellt, die sich durch lineare Komplexität, Überlegenheit gegenüber bestehenden Methoden und bewiesene Konvergenz auszeichnen.

Mikhail Hushchyn, Kenenbek Arzymatov, Denis Derkach2026-03-10🤖 cs.LG

Accounting for shared covariates in semi-parametric Bayesian additive regression trees

Die Autoren stellen eine Erweiterung semi-parametrischer Modelle auf Basis von Bayesian Additive Regression Trees (BART) vor, die durch modifizierte Baumgenerierungsverfahren die gemeinsame Nutzung von Kovariaten in linearen und nicht-parametrischen Komponenten ermöglicht, um Verzerrungen zu vermeiden und komplexe Interaktionen bei der Analyse von Bildungsdaten zu erfassen.

Estevão B. Prado, Andrew C. Parnell, Keefe Murphy + 3 more2026-03-10🤖 cs.LG

A White-Box SVM Framework and its Swarm-Based Optimization for Supervision of Toothed Milling Cutter through Characterization of Spindle Vibrations

Diese Arbeit stellt ein weißes SVM-Framework mit schwarmbasierter Optimierung vor, das zur Überwachung von Zahnfräsern durch die Echtzeit-Charakterisierung von Spindelvibrationen und die Analyse von Verschleißmustern dient.

Tejas Y. Deo, B. B. Deshmukh, Keshav H. Jatakar, Kamlesh M. Chhajed, S. S. Pardeshi, R. Jegadeeshwaran, Apoorva N. Khairnar, Hrushikesh S. Khade, A. D. Patange2026-03-10🤖 cs.LG

← Zurück Weiter →