cs.LG papers | Gist.Science

Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand

Dit paper introduceert twee nieuwe datagedreven algoritmen die offline versterkte leer- en overlevingsanalyse technieken combineren om optimale prijs- en voorraadbeheerstrategieën te leren in een omgeving met gecensureerde en afhankelijke vraag, waarbij de uitdagingen van ontbrekende winstinformatie en het verlies van de Markov-eigenschap worden overwonnen door het probleem te benaderen als een hoog-ordelijk Markov-beslissingsproces.

Korel Gundem, Zhengling Qi2026-03-12📊 stat

Score Matching Diffusion Based Feedback Control and Planning of Nonlinear Systems

Dit paper introduceert een deterministisch diffusiemodel voor de regeling en planning van niet-lineaire systemen, waarbij een feedbackwet wordt ontworpen om de toestandsdichtheid via een 'denoising'-proces te sturen naar een gewenste doelformatie.

Karthik Elamvazhuthi, Darshan Gadginmath, Fabio Pasqualetti2026-03-12⚡ eess

Scalable Multi-Task Learning through Spiking Neural Networks with Adaptive Task-Switching Policy for Intelligent Autonomous Agents

Dit paper introduceert SwitchMT, een nieuwe methode die adaptief taakwisselbeleid en diepe spiking Q-netwerken combineert om schaalbaar en energiezuinig meertaakleren voor autonome agenten mogelijk te maken zonder taakinterferentie of toegenomen netwerkcomplexiteit.

Rachmad Vidya Wicaksana Putra, Avaneesh Devkota, Muhammad Shafique2026-03-12🤖 cs.AI

Panda: A pretrained forecast model for chaotic dynamics

Dit paper introduceert Panda, een voorgetraind model dat, getraind op synthetische chaotische systemen, in staat is om zowel korte-termijnvoorspellingen als statistische verdelingen van onbekende chaotische dynamica, inclusief complexe real-world experimenten en partiële differentiaalvergelijkingen, zonder extra training nauwkeurig te voorspellen.

Jeffrey Lai, Anthony Bao, William Gilpin2026-03-12🌀 nlin

LLLMs: A Data-Driven Survey of Evolving Research on Limitations of Large Language Models

Deze data-gedreven survey analyseert de groeiende onderzoeksstroom naar beperkingen van grote taalmodellen (LLLMs) tussen 2022 en 2025, waarbij redeneren als meest bestudeerd thema naar voren komt en een significant verschuiving in onderzoekstrends tussen ACL en arXiv wordt vastgesteld.

Aida Kostikova, Zhipin Wang, Deidamea Bajri, Ole Pütz, Benjamin Paaßen, Steffen Eger2026-03-12💬 cs.CL

Consistency-based Abductive Reasoning over Perceptual Errors of Multiple Pre-trained Models in Novel Environments

Dit artikel introduceert een consistentie-gebaseerde abductieve redeneerframework dat testtijd-logische regels en meerdere pre-getrainde modellen combineert om prestatieverlies door distributieverschuivingen in nieuwe omgevingen effectief te mitigeren en zo zowel de precisie als het recall significant te verbeteren.

Mario Leiva, Noel Ngu, Joshua Shay Kricheli, Aditya Taparia, Ransalu Senanayake, Paulo Shakarian, Nathaniel Bastian, John Corcoran, Gerardo Simari2026-03-12🤖 cs.AI

CARTGen-IR: Synthetic Tabular Data Generation for Imbalanced Regression

Dit paper introduceert CARTGen-IR, een interpreteerbare methode voor het genereren van synthetische tabulaire data die het probleem van onevenwichtige regressie oplost door relevantie- en dichtheidsgeleide steekproefneming te combineren zonder willekeurige drempels, waardoor modellen beter presteren in gebieden met zeldzame doelwaarden.

António Pedro Pinheiro, Rita P. Ribeiro2026-03-12🤖 cs.LG

Comparative Analysis of Modern Machine Learning Models for Retail Sales Forecasting

Deze studie concludeert dat voor de verkoopvoorspelling in de detailhandel, ondanks de complexiteit van de data, geavanceerde deep learning-modellen onderpresteren ten opzichte van geoptimaliseerde boomgebaseerde ensemble-methoden zoals XGBoost, wat aantoont dat de afstemming op de probleemkarakteristiek belangrijker is dan architecturale complexiteit.

Luka Hobor, Mario Brcic, Lidija Polutnik, Ante Kapetanovic2026-03-12🤖 cs.LG

Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions

Dit paper introduceert ReLIFT, een nieuwe trainingsmethode die reinforcement learning en online fine-tuning afwisselt om de beperkingen van RL te overwinnen en modellen effectief nieuwe kennis en redeneervermogens voor de moeilijkste vragen aan te leren.

Lu Ma, Hao Liang, Meiyi Qiang, Lexiang Tang, Xiaochen Ma, Zhen Hao Wong, Junbo Niu, Chengyu Shen, Runming He, Yanhao Li, Bin Cui, Wentao Zhang2026-03-12🤖 cs.AI

Sequential-Parallel Duality in Prefix Scannable Models

Dit artikel introduceert Prefix-Scannable Models (PSMs), een generalisatie van bestaande architecturen die door het toestaan van niet-associatieve operatoren (zoals softmax) de expressiviteit van transformatoren combineert met de efficiënte, lineaire inferentie van state space-modellen.

Morris Yau, Sharut Gupta, Valerie Engelmayer, Kazuki Irie, Stefanie Jegelka, Jacob Andreas2026-03-12🤖 cs.LG

Differential Privacy in Machine Learning: A Survey from Symbolic AI to LLMs

Dit survey biedt een uitgebreid overzicht van differentiele privacy in machine learning, waarbij het de evolutie van de theorie, de integratie in modellen en de praktische evaluatie bespreekt om veilige en verantwoorde AI-systemen te bevorderen.

Francisco Aguilera-Martínez, Fernando Berzal2026-03-12🤖 cs.AI

Silhouette-Driven Instance-Weighted $k$ -means

Dit paper introduceert K-Sil, een silhouette-gedreven variant van k-means die punten weegt op basis van hun toewijzingszekerheid en een adaptieve temperatuur gebruikt om de centroidupdates te verfijnen, wat leidt tot betere clusteringresultaten op diverse real-world datasets.

Aggelos Semoglou, Aristidis Likas, John Pavlopoulos2026-03-12🤖 cs.LG

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

Dit paper introduceert het Yokai Learning Environment (YLE), een uitdagende nieuwe benchmark voor zero-shot coördinatie die de beperkingen van de bestaande Hanabi-benchmark blootlegt door te vereisen dat agenten geloofsoverdracht, ambiguïteit en spelbeëindiging beheren, waardoor wordt aangetoond dat huidige toonaangevende methoden in YLE falen terwijl ze in Hanabi uitstekend presteren.

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas Bulling2026-03-12🤖 cs.AI

Order Optimal Regret Bounds for Sharpe Ratio Optimization under Thompson Sampling

Dit artikel introduceert het SRTS-algoritme op basis van Thompson Sampling voor het maximaliseren van de Sharpe-ratio in een stochastisch bandit-probleem, waarbij het bewijst dat de regret logaritmisch is en orde-optimaal is, en experimenteel aantoont dat het bestaande methoden significantly overtreft.

Mohammad Taha Shah, Sabrina Khurshid, Gourab Ghatak2026-03-12🤖 cs.LG

Universal Dynamics with Globally Controlled Analog Quantum Simulators

Dit artikel bewijst dat analoge kwantumsimulatoren met globale besturing universeel zijn voor kwantumberekening, introduceert een direct optimalisatiekader voor de synthese van complexe interacties, en valideert experimenteel de realisatie van topologische dynamica en effectieve meerdeeltjesinteracties op Rydberg-atoomarrays.

Hong-Ye Hu, Abigail McClain Gomez, Liyuan Chen, Aaron Trowbridge, Andy J. Goldschmidt, Zachary Manchester, Frederic T. Chong, Arthur Jaffe, Susanne F. Yelin2026-03-12⚛️ quant-ph

Tensor Train Completion from Fiberwise Observations Along a Single Mode

Dit artikel introduceert een snelle methode voor het voltooien van tensores met 'fiber-wise' waarnemingen langs één modus, waarbij de tensor-train decompositie uitsluitend met standaard lineaire algebra wordt berekend onder deterministische voorwaarden.

Shakir Showkat Sofi, Lieven De Lathauwer2026-03-12⚡ eess

Zero-Shot Transferable Solution Method for Parametric Optimal Control Problems

Dit artikel introduceert een overdraagbare methode voor parametrische optimale besturingsproblemen die, door het gebruik van een functie-encoderbeleid en een offline-online decompositie, nieuwe doelen in real-time en zonder extra training (zero-shot) kan oplossen met minimale rekenkosten.

Xingjian Li, Kelvin Kan, Deepanshu Verma, Krishna Kumar, Stanley Osher, Ján Drgona2026-03-12🤖 cs.LG

Global Minimizers of Sigmoid Contrastive Loss

Dit artikel biedt een theoretische verklaring voor de voordelen van het synchroniseren van trainbare inverse temperatuur en bias onder de sigmoid-verliesfunctie, zoals gebruikt in SigLIP-modellen, door een nieuw combinatorisch object genaamd $(\mathsf{m}, \mathsf{b}_{\mathsf{rel}})$ -Constellations te introduceren dat de succesvolle prestaties, de modale kloof en de benodigde dimensie voor kwalitatief hoogwaardige representaties verklaart.

Kiril Bangachev, Guy Bresler, Iliyas Noman, Yury Polyanskiy2026-03-12🤖 cs.LG

Deep Learning for Clouds and Cloud Shadow Segmentation in Methane Satellite and Airborne Imaging Spectroscopy

Dit onderzoek toont aan dat diepe leermodellen, met name U-Net en SCAN, superieur zijn aan conventionele methoden voor het detecteren van wolken en wolkschaduwen in hyperspectrale beelden van de MethaneSAT- en MethaneAIR-missies, waardoor de nauwkeurigheid van methaanretrievals aanzienlijk wordt verbeterd.

Manuel Perez-Carrasco, Maya Nasr, Sebastien Roche + 12 more2026-03-12🤖 cs.LG

Multi-modal Data Spectrum: Multi-modal Datasets are Multi-dimensional

Deze studie onthult dat veel huidige meermodale benchmarks onbedoeld afhankelijkheid van afzonderlijke modaliteiten (zoals alleen tekst of alleen afbeeldingen) versterken in plaats van hun interactie, wat leidt tot een nieuwe kwantitatieve karakterisering voor een betere evaluatie van meervoudige modaliteiten.

Divyam Madaan, Varshan Muhunthan, Kyunghyun Cho, Sumit Chopra2026-03-12💬 cs.CL

← Vorige Volgende →

cs.LG