cs.LG papers | Gist.Science

From Entropy to Calibrated Uncertainty: Training Language Models to Reason About Uncertainty

Dit artikel introduceert een drie-staps pipeline die grote taalmodellen post-train om via versterkingsleer efficiënte, goed gekalibreerde en interpreteerbare onzekerheidsschattingen te genereren, wat een verbetering biedt ten opzichte van bestaande, rekenintensieve methoden.

Azza Jenane, Nassim Walha, Lukas Kuhn, Florian Buettner2026-03-09🤖 cs.AI

SAHOO: Safeguarded Alignment for High-Order Optimization Objectives in Recursive Self-Improvement

Het paper introduceert SAHOO, een praktisch framework dat de alignatie-drift tijdens recursieve zelfverbetering van AI-systemen beheerst door middel van drie veiligheidsmechanismen, waardoor aanzienlijke prestatieverbeteringen worden bereikt zonder in te leveren op veiligheid of waarheidsgetrouwheid.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-09🤖 cs.AI

AI End-to-End Radiation Treatment Planning Under One Second

Dit artikel introduceert AIRT, een end-to-end deep-learning framework dat binnen één seconde een uitvoerbaar stralingsbehandelingsplan voor prostaatkanker genereert op basis van CT-beelden, met een kwaliteit die niet onderdoet voor bestaande methoden.

Simon Arberet, Riqiang Gao, Martin Kraus, Florin C. Ghesu, Wilko Verbakel, Mamadou Diallo, Anthony Magliari, Venkatesan Karuppusamy, Sushil Beriwal, REQUITE Consortium, Ali Kamen, Dorin Comaniciu2026-03-09🤖 cs.AI

MoEless: Efficient MoE LLM Serving via Serverless Computing

Dit paper introduceert MoEless, het eerste serverless framework voor het serveren van Mixture-of-Experts (MoE) taalmodellen dat door middel van proactieve voorspelling en dynamische schaalbaarheid expert-loadbalancingproblemen oplost en zo de inferentielatentie met 43% en de kosten met 84% verlaagt ten opzichte van bestaande oplossingen.

Hanfei Yu, Bei Ouyang, Shwai He, Ang Li, Hao Wang2026-03-09🤖 cs.AI

Dynamic Chunking Diffusion Transformer

Het artikel introduceert de Dynamic Chunking Diffusion Transformer (DC-DiT), een model dat de compute-efficiëntie en beeldkwaliteit verbetert door adaptief het aantal tokens aan te passen op basis van beeldinhoud en het denoising-stadium, zonder extra supervisie en met minimale extra training.

Akash Haridas, Utkarsh Saxena, Parsa Ashrafi Fashi, Mehdi Rezagholizadeh, Vikram Appia, Emad Barsoum2026-03-09🤖 cs.AI

Frequency-Separable Hamiltonian Neural Network for Multi-Timescale Dynamics

Dit artikel introduceert de Frequency-Separable Hamiltonian Neural Network (FS-HNN), een architectuur die de Hamiltoniaan parameteriseert via meerdere netwerken voor verschillende tijdschalen om zo de beperkingen van bestaande methoden bij het modelleren van complexe multi-tijdschaal dynamica te overwinnen en de generalisatie voor ODE's en PDE's te verbeteren.

Yaojun Li, Yulong Yang, Christine Allen-Blanchette2026-03-09🤖 cs.LG

Tiny, Hardware-Independent, Compression-based Classification

Deze paper presenteert een lichtgewicht, hardware-onafhankelijke classificatiemethode gebaseerd op de genormaliseerde compressiedistance die, ondanks het ontbreken van strikte metriek-eigenschappen, hoge nauwkeurigheid bereikt met weinig trainingsdata en zo privacyvriendelijke client-side machine learning mogelijk maakt.

Charles Meyers, Aaron MacSween, Erik Elmroth, Tommy Löfstedt2026-03-09🤖 cs.LG

CLAIRE: Compressed Latent Autoencoder for Industrial Representation and Evaluation -- A Deep Learning Framework for Smart Manufacturing

Dit paper introduceert CLAIRE, een hybride deep learning-framework voor slimme fabricage dat een geoptimaliseerde autoencoder combineert met een classifier en speltheoretische interpretatie voor nauwkeurige en verklaarbare foutdetectie in complexe industriële omgevingen.

Mohammadhossein Ghahramani, Mengchu Zhou2026-03-09🤖 cs.AI

Adaptive Lipschitz-Free Conditional Gradient Methods for Stochastic Composite Nonconvex Optimization

Deze paper introduceert ALFCG, het eerste adaptieve projectievrije raamwerk voor stochastische compositieve niet-convexe optimalisatie dat noch globale gladheidsconstanten noch lijnzoeken vereist, en dat via variatie-reductie en momentum optimale iteratiecomplexiteit bereikt die de bestaande methoden overtreft.

Ganzhao Yuan2026-03-09🤖 cs.LG

Kinetic-based regularization: Learning spatial derivatives and PDE applications

Deze paper introduceert een uitgebreide kinetische regularisatiemethode (KBR) voor het nauwkeurig schatten van ruimtelijke afgeleiden uit ruisachtige data, wat leidt tot stabiele oplossingen voor hyperbolische partiële differentiaalvergelijkingen op onregelmatige puntenwolkjes.

Abhisek Ganguly, Santosh Ansumali, Sauro Succi2026-03-09🤖 cs.AI

Talk Freely, Execute Strictly: Schema-Gated Agentic AI for Flexible and Reproducible Scientific Workflows

Dit paper introduceert schema-gated agentic AI als een oplossing die de tegenstrijdige eisen van deterministische uitvoering en conversatieve flexibiliteit in wetenschappelijke workflows verenigt door conversatie en uitvoeringsautoriteit te scheiden.

Joel Strickland, Arjun Vijeta, Chris Moores, Oliwia Bodek, Bogdan Nenchev, Thomas Whitehead, Charles Phillips, Karl Tassenberg, Gareth Conduit, Ben Pellegrini2026-03-09🤖 cs.AI

Efficient, Property-Aligned Fan-Out Retrieval via RL-Compiled Diffusion

Het paper introduceert R4T, een methode die reinforcement learning gebruikt om trainingsdata te genereren voor een efficiënte diffusiemodel-retriever die set-georiënteerde zoekopdrachten met hoge kwaliteit en lage latentie mogelijk maakt.

Pengcheng Jiang, Judith Yue Li, Moonkyung Ryu, R. Lily Hu, Kun Su, Zhong Yi Wan, Liam Hebert, Hao Peng, Jiawei Han, Dima Kuzmin, Craig Boutilier2026-03-09🤖 cs.LG

U6G XL-MIMO Radiomap Prediction: Multi-Config Dataset and Beam Map Approach

Dit artikel introduceert een nieuw XL-MIMO radiomap-dataset met 78.400 kaarten en een 'beam map'-benadering die fysische array-eigenschappen ontkoppelt van geleerde multipath-propagatie, waardoor de voorspellingsnauwkeurigheid voor onbekende configuraties en omgevingen aanzienlijk verbetert.

Xiaojie Li, Yu Han, Zhizheng Lu, Shi Jin, Chao-Kai Wen2026-03-09🤖 cs.LG

Adapter-Augmented Bandits for Online Multi-Constrained Multi-Modal Inference Scheduling

Deze paper introduceert M-CMAB, een adaptieve bandit-gebaseerde framework voor online scheduling van multi-modale LLM-inferenties dat door middel van een voorspeller, een constrainer en een planner effectief omgaat met heterogene backends en meervoudige budgetbeperkingen om de responskwaliteit te maximaliseren.

Xianzhi Zhang, Yue Xu, Yinlin Zhu, Di Wu, Yipeng Zhou, Miao Hu, Guocong Quan2026-03-09🤖 cs.LG

A Reference Architecture of Reinforcement Learning Frameworks

Dit artikel introduceert een referentiearchitectuur voor versterkingsleerframeworks, gebaseerd op een grondige analyse van 18 state-of-the-practice implementaties, om een gemeenschappelijke basis te bieden voor vergelijking, evaluatie en integratie.

Xiaoran Liu, Istvan David2026-03-09🤖 cs.AI

CLoPA: Continual Low Parameter Adaptation of Interactive Segmentation for Medical Image Annotation

Het artikel introduceert CLoPA, een strategie voor continue aanpassing van de nnInteractive-modellen met een klein aantal parameters die, zonder de bestaande werkstroom te veranderen, de prestaties van interactieve segmentatie voor medische beeldannotatie snel naar expertniveau tilt.

Parhom Esmaeili, Chayanin Tangwiriyasakul, Eli Gibson, Sebastien Ourselin, M. Jorge Cardoso2026-03-09🤖 cs.AI

Certified and accurate computation of function space norms of deep neural networks

Dit artikel introduceert een framework voor de gecertificeerde en nauwkeurige berekening van functieruimtenormen van diepe neurale netwerken door intervalrekening op as-uitgelijnde dozen te combineren met adaptieve verdeling en kwadratuur, waardoor gegarandeerde boven- en ondergrenzen worden verkregen voor integralen zoals $L^p$ - en Sobolev-normen.

Johannes Gründler, Moritz Maibaum, Philipp Petersen2026-03-09🤖 cs.LG

Toward Generative Quantum Utility via Correlation-Complexity Map

Dit artikel introduceert een Correlatie-Complexiteit-kaart als diagnostisch hulpmiddel om te bepalen of real-world data geschikt is voor IQP-quantumgeneratieve modellen, en demonstreert dat deze aanpak, gesteund door hoge QCLI- en CCI-waarden in turbulente data, concurrerende resultaten bereikt met minder trainingsdata dan klassieke modellen.

Chen-Yu Liu, Leonardo Placidi, Eric Brunner, Enrico Rinaldi2026-03-09⚛️ quant-ph

Quantum Diffusion Models: Score Reversal Is Not Free in Gaussian Dynamics

Het papier toont aan dat bij kwantum-gelimiteerde Gaussian-dynamica het omkeren van een noising-proces met een vaste score-drift de complete positiviteit schendt, waardoor extra diffusie noodzakelijk is om de fysieke geldigheid te herstellen.

Ammar Fayad2026-03-09⚛️ quant-ph

NOBLE: Accelerating Transformers with Nonlinear Low-Rank Branches

Het paper introduceert NOBLE, een architecturale uitbreiding die permanente niet-lineaire laag-rang takken toevoegt aan transformer-lijnen voor training vanaf nul, wat leidt tot aanzienlijke verbeteringen in trainingsefficiëntie en een snellere convergentie met minimaal extra parameteroverhead.

Ethan Smith (Canva Research)2026-03-09🤖 cs.AI

← Vorige Volgende →