cs.LG papers | Gist.Science

Reverse Distillation: Consistently Scaling Protein Language Model Representations

Deze paper introduceert Reverse Distillation, een raamwerk dat de representaties van grote eiwit-taalmodellen ontleedt in geneste orthogonale subruimtes om de vaak tegenstrijdige schaalwetten op te lossen en consequent betere prestaties te behalen dan kleinere modellen of de oorspronkelijke baselines.

Darius Catrina, Christian Bepler, Samuel Sledzieski, Rohit Singh2026-03-10🤖 cs.LG

A Lightweight MPC Bidding Framework for Brand Auction Ads

Dit paper introduceert een lichtgewicht Model Predictive Control-framework voor merkadvertenties dat gebruikmaakt van online isotone regressie om complexe modellen te vermijden en zo de bestedings-efficiëntie en kostenbeheersing in realtime biedingen significant verbetert.

Yuanlong Chen, Bowen Zhu, Bing Xia, Yichuan Wang2026-03-10🤖 cs.LG

Hide and Find: A Distributed Adversarial Attack on Federated Graph Learning

Dit paper introduceert FedShift, een innovatieve twee-traps "Verstop en Zoek"-aanval op Federated Graph Learning die door het injecteren van een verborgen "shifter" en het benutten van globale modelinformatie, een uiterst effectieve, stealthy en efficiënte methode biedt om bestaande verdedigingsmechanismen te omzeilen.

Jinshan Liu, Ken Li, Jiazhe Wei, Bin Shi, Bo Dong2026-03-10🤖 cs.LG

Uncertainty-Gated Generative Modeling

Deze paper introduceert Uncertainty-Gated Generative Modeling (UGGM), een methode die onzekerheid gebruikt als interne regeling om financiële tijdsreeksvoorspellingen robuuster te maken en de foutmarge aanzienlijk te verkleinen, zelfs tijdens marktshocks.

Xingrui Gu, Haixi Zhang2026-03-10🤖 cs.LG

Using GPUs And LLMs Can Be Satisfying for Nonlinear Real Arithmetic Problems

Dit paper introduceert GANRA, een nieuwe SMT-oplosser die Large Language Models en GPU-versnelling combineert om kwantorenvrije niet-lineaire reële rekenproblemen aanzienlijk sneller en effectiever op te lossen dan de huidige stand van de techniek.

Christopher Brix, Julia Walczak, Nils Lommen, Thomas Noll2026-03-10🤖 cs.LG

Breaking Training Bottlenecks: Effective and Stable Reinforcement Learning for Coding Models

Dit paper introduceert MicroCoder-GRPO, een verbeterde RL-methode met innovaties zoals conditionele truncatie en diversiteitsgestuurde temperatuurkeuze, samen met een uitdagender dataset en robuustere evaluatie, die trainingsbottlenecks voor coderingsmodellen effectief oplost en aanzienlijke prestatieverbeteringen op LiveCodeBench v6 oplevert.

Zongqian Li, Shaohan Huang, Zewen Chi, Yixuan Su, Lexin Zhou, Li Dong, Nigel Collier, Furu Wei2026-03-10🤖 cs.LG

Lindbladian Learning with Neural Differential Equations

Deze paper introduceert een methode die neurale differentiaalvergelijkingen en maximum-likelihood schatting op tijdsafhankelijke metingen combineert om de dynamische generator van open kwantumsystemen (Lindbladian learning) robuust en interpreteerbaar te leren, zelfs bij hoge ruis en voor systemen tot zes qubits.

Timothy Heightman, Roman Aseguinolaza Gallo, Edward Jiang, JRM Saavedra, Antonio Acín, Marcin Płodzien2026-03-10⚛️ quant-ph

Scaling Data Difficulty: Improving Coding Models via Reinforcement Learning on Fresh and Challenging Problems

Dit paper introduceert MicroCoder, een zorgvuldig samengesteld dataset van recente en uitdagende programmeerproblemen die via een geautomatiseerd vierstapsverwerkingsframework is gefilterd op moeilijkheidsgraad, en waaruit blijkt dat het trainen van coderingsmodellen hierop leidt tot aanzienlijk betere prestaties op complexe taken vergeleken met bestaande datasets.

Zongqian Li, Tengchao Lv, Shaohan Huang, Yixuan Su, Qinzheng Sun, Qiufeng Yin, Ying Xin, Scarlett Li, Lei Cui, Nigel Collier, Furu Wei2026-03-10🤖 cs.LG

ProgAgent:A Continual RL Agent with Progress-Aware Rewards

ProgAgent is een doorlopende versterkingsleer-agent die catastrofale vergeeting en hoge kosten voor beloningsspecificatie aanpakt door ongelabelde expertvideo's te gebruiken voor het afleiden van progreseergerichte beloningen, gecombineerd met een JAX-native architectuur voor stabiele en snelle robotleer.

Jinzhou Tan, Gabriel Adineera, Jinoh Kim2026-03-10🤖 cs.LG

Vision Transformers that Never Stop Learning

Deze paper onderzoekt het verlies van plasticiteit bij Vision Transformers, onthult dat bestaande herinitialisatiemethoden onvoldoende werken, en introduceert ARROW, een geometrie-bewuste optimizer die het vermogen om nieuwe taken te leren effectief behoudt door gradiënten adaptief aan te passen.

Caihao Sun, Mingqi Yuan, Shiyuan Wang, Jiayu Chen2026-03-10🤖 cs.LG

Toward Global Intent Inference for Human Motion by Inverse Reinforcement Learning

Dit artikel toont aan dat een enkele, tijdsvariërende kostenfunctie, geschat met het MO-IRL-algoritme, menselijke reikbewegingen nauwkeurig kan voorspellen en ondersteunt het bestaan van een universeel optimaliteitsprincipe dat onafhankelijk is van het individu of de houding.

Sarmad Mehrdad, Maxime Sabbah, Vincent Bonnet, Ludovic Righetti2026-03-10🤖 cs.LG

Neural Precoding in Complex Projective Spaces

Dit artikel presenteert een nieuw deep-learning-framework voor precoding in MU-MISO-systemen dat gebruikmaakt van complexe projectieve ruimtes om fase-redundanties te elimineren, wat leidt tot aanzienlijke verbeteringen in de som-rate en generalisatie ten opzichte van conventionele methoden.

Zaid Abdullah, Merouane Debbah, Symeon Chatzinotas, Bjorn Ottersten2026-03-10🤖 cs.LG

Learning embeddings of non-linear PDEs: the Burgers' equation

Dit artikel presenteert een methode om met behulp van Physics Informed Neural Networks en orthogonale hoofdcomponentenanalyse een robuuste, laagdimensionale inbedding te construeren voor de oplossingsruimte van de niet-lineaire Burgers-vergelijking, waarbij een klein aantal latentemodes de dominante dynamische kenmerken effectief vastlegt.

Pedro Tarancón-Álvarez, Leonid Sarieddine, Pavlos Protopapas, Raul Jimenez2026-03-10🤖 cs.LG

Fusion Complexity Inversion: Why Simpler Cross View Modules Outperform SSMs and Cross View Attention Transformers for Pasture Biomass Regression

Dit onderzoek toont aan dat voor de regressie van graslandbiomassa op beperkte landbouwdata, de kwaliteit van de vooraf getrainde backbone (zoals DINOv3) en eenvoudige lokale fusiemodules cruciaal zijn, terwijl complexe architecturen zoals cross-view attention en SSMs juist slechter presteren.

Mridankan Mandal2026-03-10🤖 cs.LG

Transferable Optimization Network for Cross-Domain Image Reconstruction

Deze paper introduceert een nieuw transfer learning-framework dat door middel van twee bi-niveau optimalisatiestappen een universele feature-extractor en een domeinspecifieke adapter combineert om hoogwaardige beelden te reconstrueren, zelfs bij beperkte trainingsdata zoals bij onderbemonsterde MRI-scans.

Yunmei Chen, Chi Ding, Xiaojing Ye2026-03-10🤖 cs.LG

Gradient Iterated Temporal-Difference Learning

Dit paper introduceert Gradient Iterated Temporal-Difference learning, een nieuw algoritme dat de stabiliteit van gradient TD-methoden verbetert door de gradiënten over bewegende doelen te berekenen, waardoor het voor het eerst een concurrerende leersnelheid bereikt ten opzichte van semi-gradiënt-methoden op benchmarks zoals Atari-games.

Théo Vincent, Kevin Gerhardt, Yogesh Tripathi, Habib Maraqten, Adam White, Martha White, Jan Peters, Carlo D'Eramo2026-03-10🤖 cs.LG

Guess & Guide: Gradient-Free Zero-Shot Diffusion Guidance

Dit paper introduceert een lichtgewicht, gradient-vrije methode voor zero-shot geleiding van diffusiemodellen die de rekenkosten voor Bayesiaanse inverse problemen drastisch verlaagt terwijl het tegelijkertijd de beste prestaties levert.

Abduragim Shtanchaev, Albina Ilina, Yazid Janati, Arip Asadulaev, Martin Takác, Eric Moulines2026-03-10🤖 cs.LG

An Interpretable Generative Framework for Anomaly Detection in High-Dimensional Financial Time Series

Dit artikel introduceert ReGEN-TAD, een interpreteerbaar generatief raamwerk dat moderne machine learning combineert met econometrische diagnostiek om structurele instabiliteit en anomalieën in hoogdimensionale financiële tijdreeksen te detecteren zonder gebruik van gelabelde data.

Waldyn G Martinez2026-03-10🤖 cs.LG

Viewpoint-Agnostic Grasp Pipeline using VLM and Partial Observations

Deze paper presenteert een robuuste, viewpoint-agnostische grijppijplijn voor mobiele benige manipulators die, door gebruik te maken van visuele taalmodellen en gedeeltelijke waarnemingen, taalgestuurde grijpacties in verwarde omgevingen mogelijk maakt met een succespercentage van 90%, aanzienlijk beter dan een bestaande view-dependent baseline.

Dilermando Almeida, Juliano Negri, Guilherme Lazzarini, Thiago H. Segreto, Ranulfo Bezerra, Ricardo V. Godoy, Marcelo Becker2026-03-10🤖 cs.LG

Slumbering to Precision: Enhancing Artificial Neural Network Calibration Through Sleep-like Processes

Dit paper introduceert Sleep Replay Consolidation (SRC), een post-training methode die geïnspireerd is op biologische slaap om de betrouwbaarheid van voorspellingskansen in kunstmatige neurale netwerken te verbeteren zonder toezicht.

Jean Erik Delanois, Aditya Ahuja, Giri P. Krishnan, Maxim Bazhenov2026-03-10🤖 cs.LG

← Vorige Volgende →