cs.LG papers | Gist.Science

You Didn't Have to Say It like That: Subliminal Learning from Faithful Paraphrases

Dit onderzoek toont aan dat taalmodellen via subliminale leerprocessen voorkeuren van een 'leraar'-model kunnen overnemen, zelfs wanneer ze worden getraind op semantisch trouwe parafrases die de voorkeur expliciet tegenspreken, wat wijst op een fundamenteel veiligheidsrisico in pipelines met synthetische trainingsdata.

Isaia Gisler (ETH Zürich), Zhonghao He (University of Cambridge), Tianyi Qiu (Peking University)2026-03-11🤖 cs.LG

Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

Dit paper introduceert EDA, een parameter- en data-efficiënt framework dat de prestaties van speculatieve decoding op fijngetrainde LLM's herstelt door een ontkoppelde architectuur, data-regeneratie en selectieve steekproefneming te combineren, waardoor volledige hertraining overbodig wordt.

Luxi Lin, Zhihang Lin, Zhanpeng Zeng, Yuhao Chen, Qingyu Zhang, Jixiang Luo, Xuelong Li, Rongrong Ji2026-03-11🤖 cs.AI

What Do We Care About in Bandits with Noncompliance? BRACE: Bandits with Recommendations, Abstention, and Certified Effects

Dit paper introduceert BRACE, een parameterloos algoritme voor bandietenproblemen met non-compliance dat simultane validiteit garandeert voor zowel aanbevelings- als behandelingsbeleid en structurele onzekerheid certificeert, zelfs bij zwakke identificatie of heterogeniteit.

Nicolás Della Penna2026-03-11🤖 cs.LG

Compiler-First State Space Duality and Portable $O(1)$ Autoregressive Caching for Inference

Dit artikel introduceert een compiler-gebaseerde implementatie van Mamba-2 in JAX die, dankzij het gebruik van standaard XLA-primitieven in plaats van aangepaste CUDA-kernels, portabele autoregressieve inferentie met $O(1)$ caching mogelijk maakt op CPU, NVIDIA GPU en Google TPU zonder host-synchronisatie.

Cosmo Santoni2026-03-11🤖 cs.AI

Learning Bayesian and Markov Networks with an Unreliable Oracle

Dit artikel onderzoekt de structurele leerbaarheid van Bayesiaanse en Markov-netwerken met behulp van een onbetrouwbare orakel, waarbij het aantoont dat Markov-netwerken robuust zijn tegen een exponentieel aantal fouten bij een lage maximale hoeveelheid disjuncte paden, terwijl Bayesiaanse netwerken zelfs bij één fout niet altijd uniek identificeerbaar zijn, en biedt vervolgens algoritmen voor structurele leerbaarheid wanneer unieke identificatie mogelijk is.

Juha Harviainen, Pekka Parviainen, Vidya Sagar Sharma2026-03-11🤖 cs.LG

a-TMFG: Scalable Triangulated Maximally Filtered Graphs via Approximate Nearest Neighbors

Dit paper introduceert a-TMFG, een schaalbaar algoritme dat de beperkingen van de traditionele TMFG-methode voor grote datasets overwint door gebruik te maken van benaderde k-NN-grafen en dynamische correlatieschatting.

Lionel Yelibi2026-03-11🤖 cs.LG

An Optimal Control Approach To Transformer Training

Dit artikel presenteert een rigoureuze optimal control-theoretische aanpak voor Transformer-training die de architectuur modelleert als een McKean-Vlasov-deeltjessysteem, waardoor een globaal optimale en robuuste trainingsmethode wordt verkregen die niet afhankelijk is van gradiënten of convexiteit.

Ka\u{g}an Akman, Naci Saldı, Serdar Yüksel2026-03-11🤖 cs.LG

SCDP: Learning Humanoid Locomotion from Partial Observations via Mixed-Observation Distillation

Deze paper introduceert SCDP, een methode die mensachtige locomotie mogelijk maakt met alleen aan boord sensoren door een diffusiemodel te trainen dat gedeeltelijke waarnemingen omzet in gedetailleerde bewegingsdynamiek via distillatie van bevoorrechte data, wat resulteert in robuuste prestaties in zowel simulatie als op een echte G1-robot.

Milo Carroll, Tianhu Peng, Lingfan Bao, Chengxu Zhou, Zhibin Li2026-03-11🤖 cs.LG

Routing without Forgetting

Dit paper introduceert 'Routing without Forgetting' (RwF), een transformer-architectuur die continu leren in online scenario's verbetert door dynamische prompts te genereren via energie-gebaseerde associatieve retrieval in plaats van traditionele parameter-efficiënte aanpassingen.

Alessio Masano, Giovanni Bellitto, Dipam Goswani, Joost Van de Weijer, Concetto Spampinato2026-03-11🤖 cs.AI

Towards Understanding Adam Convergence on Highly Degenerate Polynomials

Dit artikel toont aan dat de Adam-optimizer op een specifieke klasse van sterk gedegenereerde polynomen van nature lokaal lineair convergeert zonder extra schedulers, wat een aanzienlijke versnelling oplevert ten opzichte van Gradient Descent en Momentum dankzij een ontkoppeling tussen het tweede moment en de gekwadrateerde gradiënt.

Zhiwei Bai, Jiajie Zhao, Zhangchen Zhou, Zhi-Qin John Xu, Yaoyu Zhang2026-03-11🤖 cs.LG

Nonparametric Variational Differential Privacy via Embedding Parameter Clipping

Deze paper introduceert een theoretisch onderbouwde strategie voor het afkappen van parameters in niet-parametrische variational differentieel-private modellen, die leidt tot sterkere privacygaranties en betere prestaties op downstream-taken door de Rényi-divergentiebovengrens te minimaliseren.

Dina El Zein, Shashi Kumar, James Henderson2026-03-11🤖 cs.LG

Memorization capacity of deep ReLU neural networks characterized by width and depth

Dit artikel karakteriseert de memorisatiecapaciteit van diepe ReLU-neurale netwerken door aan te tonen dat de optimale afweging tussen breedte en diepte wordt bepaald door de relatie $W^2L^2 = \Theta(N\log(\delta^{-1}))$ voor het memoriseren van $N$ datapunten.

Xin Yang, Yunfei Yang2026-03-11🤖 cs.LG

MM-algorithms for traditional and convex NMF with Tweedie and Negative Binomial cost functions and empirical evaluation

Deze paper introduceert een unifyend kader voor traditionele en convexe niet-negatieve matrixfactorisatie (NMF) met Tweedie- en Negatief Binomiale kostenfuncties, waarbij nieuwe Majorize-Minimiseer-update-regels worden afgeleid en empirisch gevalideerd om te tonen dat de keuze van het ruismodel cruciaal is voor modelfit en dat convexe NMF een robuust alternatief biedt bij grote aantallen klassen.

Elisabeth Sommer James, Asger Hobolth, Marta Pelizzola2026-03-11🤖 cs.LG

Learning the Hierarchical Organization in Brain Network for Brain Disorder Diagnosis

Deze paper introduceert BrainHO, een nieuw model dat een hiërarchische attentiemechanisme gebruikt om intrinsieke afhankelijkheden in fMRI-gebaseerde hersennetwerken te leren zonder vooraf gedefinieerde subnetwerken, wat leidt tot state-of-the-art diagnoseprestaties en interpreteerbare biomerkers voor hersenaandoeningen.

Jingfeng Tang, Peng Cao, Guangqi Wen, Jinzhu Yang, Xiaoli Liu, Osmar R. Zaiane2026-03-11🤖 cs.LG

Multi-DNN Inference of Sparse Models on Edge SoCs

Deze paper introduceert SparseLoom, een demonstratiesysteem dat 'model stitching' toepast om subgrafen van sparse modellen te herschikken zonder opnieuw te trainen, waardoor multi-DNN-inferentie op Edge-SoCs aanzienlijk efficiënter wordt met een reductie van SLO-overtredingen tot 74% en een doorvoerverhoging tot 2,31x.

Jiawei Luo, Di Wu, Simon Dobson, Blesson Varghese2026-03-11🤖 cs.LG

Evolution of Photonic Quantum Machine Learning under Noise

Deze review analyseert systematisch de bronnen en impact van ruis op fotone-gebaseerde quantummachinelearning, bespreekt bestaande karakteriseringstechnieken en mitigeringsstrategieën, en schetst toekomstige onderzoeksrichtingen voor robuuste en schaalbare systemen.

A. M. A. S. D. Alagiyawanna, Asoka Karunananda2026-03-11⚛️ quant-ph

Well Log-Guided Synthesis of Subsurface Images from Sparse Petrography Data Using cGANs

Dit artikel presenteert een op cGAN's gebaseerd raamwerk dat porositeitsgegevens uit boorgatmetingen gebruikt om realistische, continue poreuze afbeeldingen van koolstofhoudende gesteenten te synthetiseren, waardoor de kloof tussen discrete petrografische steekproeven wordt overbrugd voor betere reservoirkarakterisering.

Ali Sadeghkhani, A. Assadi, B. Bennett, A. Rabbani2026-03-11🤖 cs.LG

FreqCycle: A Multi-Scale Time-Frequency Analysis Method for Time Series Forecasting

Het artikel introduceert FreqCycle, een nieuw framework voor tijdreeksvoorspelling dat zowel lage als midden- en hoge frequentiepatronen effectief combineert via modules voor filterversterkte cyclusvoorspelling en segmenteerde frequentiedomeinpatroonleer, en dit uitbreidt naar MFreqCycle om gekoppelde multi-periodiciteit aan te pakken, wat resulteert in state-of-the-art nauwkeurigheid en snellere inferentie.

Boya Zhang, Shuaijie Yin, Huiwen Zhu, Xing He2026-03-11🤖 cs.LG

No evaluation without fair representation : Impact of label and selection bias on the evaluation, performance and mitigation of classification models

Deze studie analyseert empirisch hoe label- en selectiebias de evaluatie, prestaties en mitigatie van classificatiemodellen beïnvloeden, en introduceert een nieuw raamwerk dat aantoont dat er geen afweging bestaat tussen eerlijkheid en nauwkeurigheid wanneer modellen worden getest op onbevooroordeelde data.

Magali Legast, Toon Calders, François Fouss2026-03-11🤖 cs.LG

GNNs for Time Series Anomaly Detection: An Open-Source Framework and a Critical Evaluation

Deze paper introduceert een open-source framework voor tijdreeksanomaliedetectie met Graph Neural Networks, dat niet alleen de prestaties en interpreteerbaarheid van dergelijke modellen verbetert, maar ook kritische inzichten biedt over de huidige evaluatiemethoden.

Federico Bello, Gonzalo Chiarlone, Marcelo Fiori, Gastón García González, Federico Larroca2026-03-11🤖 cs.AI

← Vorige Volgende →

cs.LG