cs.LG papers | Gist.Science

Towards Understanding Subliminal Learning: When and How Hidden Biases Transfer

Dit onderzoek onthult dat subliminale leerprocessen waarbij taalmodellen verborgen vooroordelen overnemen, voornamelijk worden gedreven door een klein aantal afwijkende tokens in de vroege lagen van het model, en dat dit fenomeen kwetsbaar is voor kleine veranderingen in de prompt.

Simon Schrodi, Elias Kempf, Fazl Barez + 1 more2026-03-06💻 cs

BeyondBench: Contamination-Resistant Evaluation of Reasoning in Language Models

Het paper introduceert BeyondBench, een evaluatieframework dat wiskundig onderbouwde, dynamisch gegenereerde algoritmische problemen gebruikt om taalmodellen op een verontreinigingsvrije manier te testen op hun redeneervermogen, waarbij de resultaten aantonen dat prestaties sterk afnemen naarmate de complexiteit toeneemt.

Gaurav Srivastava, Aafiya Hussain, Zhenyu Bi + 5 more2026-03-06💻 cs

Hyperspherical Latents Improve Continuous-Token Autoregressive Generation

Het paper introduceert SphereAR, een autoregressief beeldgeneratiemodel dat door het beperken van VAE-latents tot een hypersfeer de variatie-collapse oplost en zo nieuwe state-of-the-art prestaties bereikt die concurreren met of zelfs beter zijn dan diffusion- en masked-generation-modellen.

Guolin Ke, Hui Xue2026-03-06💻 cs

Quantitative convergence of trained single layer neural networks to Gaussian processes

Dit artikel biedt expliciete bovengrenzen voor de kwantitatieve convergentie van getrainde enkelvoudige laag-neurale netwerken naar Gaussische processen in de limiet van oneindige breedte, waarbij wordt aangetoond dat de kwadratische Wasserstein-afstand polynoommatig afneemt met de netwerkbreedte.

Eloy Mosig, Andrea Agazzi, Dario Trevisan2026-03-06🔢 math

Pretraining Large Language Models with NVFP4

Dit paper introduceert een stabiele NVFP4-pretraining-methode voor grote taalmodellen die, na het trainen van een 12 miljard parameter tellend model op 10 biljoen tokens, prestaties bereikt die vergelijkbaar zijn met een FP8-basislijn.

NVIDIA, Felix Abecassis, Anjulie Agrusa + 87 more2026-03-06💻 cs

OPPO: Accelerating PPO-based RLHF via Pipeline Overlap

Dit paper introduceert OPPO, een lichtgewicht en model-onafhankelijk framework dat de trainingsefficiëntie van PPO-gebaseerde RLHF voor grote taalmodellen aanzienlijk verbetert door pipeline-overlapping-technieken toe te passen die de wachttijden door sequentiële afhankelijkheden en lange responsen verminderen.

Kaizhuo Yan, Yingjie Yu, Yifan Yu + 2 more2026-03-06💻 cs

VidGuard-R1: AI-Generated Video Detection and Explanation via Reasoning MLLMs and RL

VidGuard-R1 is een baanbrekend AI-model dat met behulp van Reinforcement Learning (GRPO) en een gespecialiseerd dataset van 140.000 video's niet alleen geavanceerde AI-generaties detecteert, maar ook menselijk interpreteerbare, fysisch onderbouwde verklaringen biedt voor zijn oordelen.

Kyoungjun Park, Yifan Yang, Juheon Yi + 6 more2026-03-06💻 cs

Non-Asymptotic Analysis of Efficiency in Conformalized Regression

Deze studie levert niet-asymptotische grenzen op voor de efficiëntie van geconformaliseerde regressie, waarbij de afhankelijkheid van de voorspellingsintervallengte van de trainings- en kalibratieomvang en het misdekkingenniveau wordt gekwantificeerd om richtlijnen te bieden voor data-allocation.

Yunzhen Yao, Lie He, Michael Gastpar2026-03-06💻 cs

Do We Really Need Permutations? Impact of Model Width on Linear Mode Connectivity

Deze studie toont aan dat het simpelweg vergroten van de modelbreedte, gecombineerd met een geschikte softmax-temperatuurcalibratie, voldoende is om lineaire mode-connectiviteit te bereiken zonder permutaties, omdat de output van het samengevoegde model dan overeenkomt met een exponentieel gewogen ensemble van de originele modellen.

Akira Ito, Masanori Yamada, Daiki Chijiwa + 1 more2026-03-06💻 cs

True Self-Supervised Novel View Synthesis is Transferable

Dit paper introduceert XFactor, het eerste geometrie-vrije zelf-supervised model dat echte Novel View Synthesis mogelijk maakt door camera-pose en scène-inhoud te ontkoppelen, waardoor geproduceerde poses overdraagbaar zijn tussen verschillende 3D-scènes zonder gebruik te maken van expliciete 3D-inductieve bias.

Thomas W. Mitchel, Hyunwoo Ryu, Vincent Sitzmann2026-03-06💻 cs

CBF-RL: Safety Filtering Reinforcement Learning in Training with Control Barrier Functions

Dit artikel introduceert CBF-RL, een framework dat veiligheidsbeperkingen via Control Barrier Functions integreert in het trainingsproces van versterkingslering, waardoor de geleerde strategie veilig wordt zonder dat er tijdens de uitvoering nog een aparte veiligheidsfilter nodig is.

Lizhi Yang, Blake Werner, Massimiliano de Sa + 1 more2026-03-06💻 cs

Bayesian Inference for PDE-based Inverse Problems using the Optimization of a Discrete Loss

Dit paper introduceert B-ODIL, een Bayesiaanse uitbreiding van de ODIL-methode die partiële differentiaalvergelijkingen als prior kennis combineert met data-likelihood om inverse problemen op te lossen met gekwantificeerde onzekerheid, zoals geïllustreerd bij het schatten van tumorconcentraties in hersenbeelden.

Lucas Amoudruz, Sergey Litvinov, Costas Papadimitriou + 1 more2026-03-06🔬 physics

Schrödinger Bridge Mamba for One-Step Speech Enhancement

Dit artikel introduceert Schrödinger Bridge Mamba (SBM), een nieuw model dat de Schrödinger Bridge-training combineert met de Mamba-architectuur om spraakverbetering in één stap te realiseren met superieure prestaties en real-time capaciteit.

Jing Yang, Sirui Wang, Chao Wu + 2 more2026-03-06💻 cs

Breaking and Fixing Defenses Against Control-Flow Hijacking in Multi-Agent Systems

Deze paper introduceert ControlValve, een nieuwe verdediging tegen controlestroomkaping in multi-agent systemen die de inherente spanning tussen veiligheid en functionaliteit aanpakt door de uitvoering te beperken tot vooraf gegenereerde, toegestane controlestroomgrafieken en contextuele regels.

Rishi Jha, Harold Triedman, Justin Wagle, Vitaly Shmatikov2026-03-06🔒 cs.CR

Generalization Below the Edge of Stability: The Role of Data Geometry

Dit paper toont theoretisch aan dat de geometrie van de data de generalisatie in overparameteriseerde ReLU-netwerken stuurt, waarbij data die moeilijk te 'shatteren' is leidt tot het leren van gedeelde patronen, terwijl data die makkelijk te shatteren is (zoals op de eenheidsbol) memorisatie bevordert.

Tongtong Liang, Alexander Cloninger, Rahul Parhi + 1 more2026-03-06💻 cs

Testing Most Influential Sets

Dit paper introduceert een principieel raamwerk voor het testen van de meest invloedrijke datasets in lineaire kleinste-kwadratenmodellen, waarbij exacte formules en extreme-waardeverdelingen worden gebruikt om statistisch onderbouwde hypothesetoetsen uit te voeren om te bepalen of invloed buitensporig is ten opzichte van natuurlijke variatie.

Lucas Darius Konrad, Nikolas Kuschnig2026-03-06🔢 math

LLEMA: Evolutionary Search with LLMs for Multi-Objective Materials Discovery

Het paper introduceert LLEMA, een geïntegreerd kader dat grote taalmodellen combineert met evolutionaire zoekalgoritmen en geheugengebaseerde verfijning om op een efficiënte en haalbare manier nieuwe materialen te ontdekken die voldoen aan meerdere, vaak tegenstrijdige, doelstellingen.

Nikhil Abhyankar, Sanchit Kabra, Saaketh Desai + 1 more2026-03-06🔬 cond-mat.mtrl-sci

Auto-Adaptive PINNs with Applications to Phase Transitions

Dit paper introduceert een auto-adaptieve trainingsmethode voor Physics Informed Neural Networks (PINNs) die, met name bij het oplossen van de Allen-Cahn-vergelijkingen, probleemspecifieke heuristieken gebruikt om de interfacegebieden nauwkeurig op te lossen zonder nasampling.

Kevin Buck, Woojeong Kim2026-03-06🔢 math

FMint-SDE: A Multimodal Foundation Model for Accelerating Numerical Simulation of SDEs via Error Correction

Deze paper introduceert FMint-SDE, een multimodaal foundation model dat op basis van in-context learning en correctie van grove oplossingen een universele en efficiënte methode biedt voor het nauwkeurig simuleren van stochastische differentiaalvergelijkingen in diverse wetenschappelijke domeinen.

Jiaxin Yuan, Haizhao Yang, Maria Cameron2026-03-06🔢 math

MotionStream: Real-Time Video Generation with Interactive Motion Controls

MotionStream is een real-time video-generatiemodel dat via distillatie en een slimme sliding-window-attention-mechanisme interactieve bewegingscontrole mogelijk maakt met sub-seconde latentie en constante snelheid voor onbeperkt lange video's.

Joonghyuk Shin, Zhengqi Li, Richard Zhang + 4 more2026-03-06💻 cs

← Vorige Volgende →