cs.LG Arbeiten | Gist.Science

Reverse Distillation: Consistently Scaling Protein Language Model Representations

Die Arbeit stellt Reverse Distillation vor, ein Framework, das Protein-Sprachmodelle durch die Zerlegung ihrer Repräsentationen in orthogonale Unterräume so optimiert, dass größere Modelle konsistent besser abschneiden als kleinere, indem sie die von kleineren Modellen erlernten allgemeinen Merkmale bewahren und zusätzliche Informationen orthogonal hinzufügen.

Darius Catrina, Christian Bepler, Samuel Sledzieski, Rohit Singh2026-03-10🤖 cs.LG

A Lightweight MPC Bidding Framework for Brand Auction Ads

Dieses Papier stellt einen leichtgewichtigen, vollständig online arbeitenden Model-Predictive-Control-Rahmen vor, der mittels isotonischer Regression auf Streaming-Daten bidirektionale Modelle für Markenwerbung erstellt und so im Vergleich zu Baseline-Strategien die Ausgaben-effizienz und Kostenkontrolle erheblich verbessert.

Yuanlong Chen, Bowen Zhu, Bing Xia, Yichuan Wang2026-03-10🤖 cs.LG

Hide and Find: A Distributed Adversarial Attack on Federated Graph Learning

Die Arbeit stellt FedShift vor, eine neuartige zweistufige „Verstecken und Finden"-Angriffsmethode auf das verteilte Federated Graph Learning, die durch das Einbringen eines versteckten „Shifters" und die nachfolgende gezielte Suche nach Adversarial-Perturbationen eine hohe Angriffseffektivität bei gleichzeitiger Umgehung gängiger Verteidigungsmechanismen und einer drastischen Reduzierung der Rechenzeit erreicht.

Jinshan Liu, Ken Li, Jiazhe Wei, Bin Shi, Bo Dong2026-03-10🤖 cs.LG

Uncertainty-Gated Generative Modeling

Die Arbeit stellt ein Unsicherheits-gesteuertes generatives Modell (UGGM) vor, das Unsicherheit als internen Kontrollmechanismus nutzt, um die Repräsentation, Propagation und Generierung zu steuern, und dadurch durch eine signifikante Reduktion des MSE-Fehlers und verbesserte Robustheit bei Schocks die risikosensitive Finanzzeitreihenvorhersage erheblich verbessert.

Xingrui Gu, Haixi Zhang2026-03-10🤖 cs.LG

Using GPUs And LLMs Can Be Satisfying for Nonlinear Real Arithmetic Problems

Die Autoren stellen den neuen SMT-Solver GANRA vor, der durch die Kombination von Large Language Models und GPU-Beschleunigung nichtlineare reelle Arithmetik-Probleme signifikant effizienter löst als der aktuelle Stand der Technik.

Christopher Brix, Julia Walczak, Nils Lommen, Thomas Noll2026-03-10🤖 cs.LG

Breaking Training Bottlenecks: Effective and Stable Reinforcement Learning for Coding Models

Die Arbeit stellt MicroCoder-GRPO vor, einen verbesserten Reinforcement-Learning-Ansatz mit drei Innovationen zur Überwindung von Trainingsengpässen bei Code-Modellen, der in Kombination mit einem neuen Datensatz und einem optimierten Evaluierungsframework signifikante Leistungssteigerungen auf LiveCodeBench v6 erzielt und dabei zeigt, dass sorgfältig trainierte Modelle mit größeren Modellen konkurrieren können.

Zongqian Li, Shaohan Huang, Zewen Chi, Yixuan Su, Lexin Zhou, Li Dong, Nigel Collier, Furu Wei2026-03-10🤖 cs.LG

Lindbladian Learning with Neural Differential Equations

Die vorgestellte Methode nutzt neuronale Differentialgleichungen und Maximum-Likelihood-Schätzung auf transienten Pauli-Messdaten, um die Dynamik offener Quantensysteme (Lindbladian-Lernen) auch bei starkem Rauschen und verschiedenen Systemgrößen effizient und robust zu rekonstruieren.

Timothy Heightman, Roman Aseguinolaza Gallo, Edward Jiang, JRM Saavedra, Antonio Acín, Marcin Płodzien2026-03-10⚛️ quant-ph

Scaling Data Difficulty: Improving Coding Models via Reinforcement Learning on Fresh and Challenging Problems

Die Studie stellt das MicroCoder-Dataset vor, das durch einen systematischen vierstufigen Verarbeitungsprozess und eine KI-gestützte Schwierigkeitsfilterung aus aktuellen Wettbewerbsaufgaben besteht und nachweislich die Leistung von Code-Generierungsmodellen bei komplexen Aufgaben im Vergleich zu herkömmlichen Datensätzen signifikant verbessert.

Zongqian Li, Tengchao Lv, Shaohan Huang, Yixuan Su, Qinzheng Sun, Qiufeng Yin, Ying Xin, Scarlett Li, Lei Cui, Nigel Collier, Furu Wei2026-03-10🤖 cs.LG

ProgAgent:A Continual RL Agent with Progress-Aware Rewards

Der Artikel stellt ProgAgent vor, einen kontinuierlichen Reinforcement-Learning-Agenten, der durch die Kombination von fortschrittsbasierten Belohnungen aus ungelabelten Expertenvideos, einer adversativen Regularisierung zur Vermeidung von Überanpassung und einer hocheffizienten JAX-Architektur das Vergessen verhindert und das robotische Lernen aus wenigen Demonstrationen erheblich verbessert.

Jinzhou Tan, Gabriel Adineera, Jinoh Kim2026-03-10🤖 cs.LG

Vision Transformers that Never Stop Learning

Diese Arbeit untersucht das Phänomen des Plastizitätsverlusts bei Vision Transformern, identifiziert Instabilitäten in den Aufmerksamkeits- und Feed-Forward-Modulen als Hauptursache und stellt ARROW vor, einen geometriebewussten Optimierer, der durch adaptive Anpassung der Gradientenrichtung die Plastizität erhält und die Anpassungsfähigkeit an neue Aufgaben verbessert.

Caihao Sun, Mingqi Yuan, Shiyuan Wang, Jiayu Chen2026-03-10🤖 cs.LG

Toward Global Intent Inference for Human Motion by Inverse Reinforcement Learning

Diese Studie zeigt mittels des effizienten MO-IRL-Algorithmus, dass eine einzige, subjekt- und haltungsunabhängige zeitvariierende Kostenfunktion menschliche Greifbewegungen präziser vorhersagen kann als bisherige, spezifischere Ansätze, wobei die Gelenkbeschleunigungsregulierung als dominierender Optimierungsmechanismus identifiziert wird.

Sarmad Mehrdad, Maxime Sabbah, Vincent Bonnet, Ludovic Righetti2026-03-10🤖 cs.LG

Neural Precoding in Complex Projective Spaces

Diese Arbeit stellt ein Deep-Learning-Framework vor, das komplexe projektive Räume zur parametrisierung von Kanälen und Precodern in MU-MISO-Systemen nutzt, um durch die Eliminierung globaler Phasenredundanzen die Summenratenleistung und Generalisierungsfähigkeit im Vergleich zu herkömmlichen Methoden signifikant zu verbessern.

Zaid Abdullah, Merouane Debbah, Symeon Chatzinotas, Bjorn Ottersten2026-03-10🤖 cs.LG

Learning embeddings of non-linear PDEs: the Burgers' equation

Diese Arbeit stellt eine Methode vor, die Physics-Informed Neural Networks mit einem Multi-Head-Setup und orthogonality-bedingten PCA-Analysen kombiniert, um einen robusten, niedrigdimensionalen Einbettungsraum für die nichtlineare Burgers-Gleichung zu konstruieren, der die Dynamik durch wenige dominante Moden effizient erfasst.

Pedro Tarancón-Álvarez, Leonid Sarieddine, Pavlos Protopapas, Raul Jimenez2026-03-10🤖 cs.LG

Fusion Complexity Inversion: Why Simpler Cross View Modules Outperform SSMs and Cross View Attention Transformers for Pasture Biomass Regression

Die Studie zeigt, dass bei der Schätzung von Weidebiomasse auf kleinen Datensätzen einfache, lokale Fusionsmodule (wie gatede Tiefenkonvolutionen) komplexe Architekturen wie SSMs oder Cross-View-Attention-Transformer übertreffen und die Qualität des Backbone-Modells den entscheidenden Einflussfaktor darstellt.

Mridankan Mandal2026-03-10🤖 cs.LG

Transferable Optimization Network for Cross-Domain Image Reconstruction

Die vorgestellte Arbeit entwickelt ein Transfer-Learning-Framework mit zwei Optimierungsstufen, das einen universellen Merkmalsextraktor und einen domänenspezifischen Adapter kombiniert, um bei unterabgetasteten MRT-Bildern auch mit begrenzten Trainingsdaten hochwertige Rekonstruktionen zu erzielen.

Yunmei Chen, Chi Ding, Xiaojing Ye2026-03-10🤖 cs.LG

Gradient Iterated Temporal-Difference Learning

Die vorgestellte Arbeit stellt Gradient Iterated Temporal-Difference Learning vor, eine stabile Variante des iterierten TD-Lernens, die durch die Berechnung von Gradienten über bewegte Ziele eine mit semi-gradienten Methoden konkurrierende Lerngeschwindigkeit erreicht und dabei erstmals Gradient-TD-Methoden erfolgreich auf Atari-Spielen demonstriert.

Théo Vincent, Kevin Gerhardt, Yogesh Tripathi, Habib Maraqten, Adam White, Martha White, Jan Peters, Carlo D'Eramo2026-03-10🤖 cs.LG

Guess & Guide: Gradient-Free Zero-Shot Diffusion Guidance

Die Arbeit stellt eine leichte, gradientenfreie Methode für diffusionsbasierte Null-Shot-Inferenz bei inversen Problemen vor, die den Rechenaufwand drastisch senkt und gleichzeitig beste Ergebnisse liefert.

Abduragim Shtanchaev, Albina Ilina, Yazid Janati, Arip Asadulaev, Martin Takác, Eric Moulines2026-03-10🤖 cs.LG

An Interpretable Generative Framework for Anomaly Detection in High-Dimensional Financial Time Series

Die Arbeit stellt ReGEN-TAD vor, ein interpretierbares generatives Framework, das moderne maschinelles Lernen mit ökonometrischen Diagnoseverfahren kombiniert, um Anomalien in hochdimensionalen Finanzzeitreihen durch die Aggregation mehrerer Signale wie Vorhersageinkonsistenzen und Rekonstruktionsverschlechterungen robust und ohne gelabelte Daten zu erkennen.

Waldyn G Martinez2026-03-10🤖 cs.LG

Viewpoint-Agnostic Grasp Pipeline using VLM and Partial Observations

Die vorgestellte Arbeit präsentiert eine robuste, sprachgesteuerte Greifpipeline für mobile Beinmanipulatoren, die durch die Kombination von VLM-basierter Objekterkennung, Punktwolken-Vervollständigung bei Verdeckungen und sicherheitsorientierten Heuristiken eine signifikant höhere Erfolgsrate in unstrukturierten Umgebungen im Vergleich zu herkömmlichen, sichtungsabhängigen Ansätzen erreicht.

Dilermando Almeida, Juliano Negri, Guilherme Lazzarini, Thiago H. Segreto, Ranulfo Bezerra, Ricardo V. Godoy, Marcelo Becker2026-03-10🤖 cs.LG

Slumbering to Precision: Enhancing Artificial Neural Network Calibration Through Sleep-like Processes

Der Artikel stellt die „Sleep Replay Consolidation" (SRC) vor, eine post-training-Methode, die durch biologischen Schlaf inspirierte interne Replays die Kalibrierung künstlicher neuronaler Netze verbessert und so deren Zuverlässigkeit erhöht.

Jean Erik Delanois, Aditya Ahuja, Giri P. Krishnan, Maxim Bazhenov2026-03-10🤖 cs.LG

← Zurück Weiter →