Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand

Dit paper introduceert twee nieuwe datagedreven algoritmen die offline versterkte leer- en overlevingsanalyse technieken combineren om optimale prijs- en voorraadbeheerstrategieën te leren in een omgeving met gecensureerde en afhankelijke vraag, waarbij de uitdagingen van ontbrekende winstinformatie en het verlies van de Markov-eigenschap worden overwonnen door het probleem te benaderen als een hoog-ordelijk Markov-beslissingsproces.

Korel Gundem, Zhengling Qi2026-03-12📊 stat

Consistency-based Abductive Reasoning over Perceptual Errors of Multiple Pre-trained Models in Novel Environments

Dit artikel introduceert een consistentie-gebaseerde abductieve redeneerframework dat testtijd-logische regels en meerdere pre-getrainde modellen combineert om prestatieverlies door distributieverschuivingen in nieuwe omgevingen effectief te mitigeren en zo zowel de precisie als het recall significant te verbeteren.

Mario Leiva, Noel Ngu, Joshua Shay Kricheli, Aditya Taparia, Ransalu Senanayake, Paulo Shakarian, Nathaniel Bastian, John Corcoran, Gerardo Simari2026-03-12🤖 cs.AI

Comparative Analysis of Modern Machine Learning Models for Retail Sales Forecasting

Deze studie concludeert dat voor de verkoopvoorspelling in de detailhandel, ondanks de complexiteit van de data, geavanceerde deep learning-modellen onderpresteren ten opzichte van geoptimaliseerde boomgebaseerde ensemble-methoden zoals XGBoost, wat aantoont dat de afstemming op de probleemkarakteristiek belangrijker is dan architecturale complexiteit.

Luka Hobor, Mario Brcic, Lidija Polutnik, Ante Kapetanovic2026-03-12🤖 cs.LG

Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions

Dit paper introduceert ReLIFT, een nieuwe trainingsmethode die reinforcement learning en online fine-tuning afwisselt om de beperkingen van RL te overwinnen en modellen effectief nieuwe kennis en redeneervermogens voor de moeilijkste vragen aan te leren.

Lu Ma, Hao Liang, Meiyi Qiang, Lexiang Tang, Xiaochen Ma, Zhen Hao Wong, Junbo Niu, Chengyu Shen, Runming He, Yanhao Li, Bin Cui, Wentao Zhang2026-03-12🤖 cs.AI

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

Dit paper introduceert het Yokai Learning Environment (YLE), een uitdagende nieuwe benchmark voor zero-shot coördinatie die de beperkingen van de bestaande Hanabi-benchmark blootlegt door te vereisen dat agenten geloofsoverdracht, ambiguïteit en spelbeëindiging beheren, waardoor wordt aangetoond dat huidige toonaangevende methoden in YLE falen terwijl ze in Hanabi uitstekend presteren.

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas Bulling2026-03-12🤖 cs.AI

Universal Dynamics with Globally Controlled Analog Quantum Simulators

Dit artikel bewijst dat analoge kwantumsimulatoren met globale besturing universeel zijn voor kwantumberekening, introduceert een direct optimalisatiekader voor de synthese van complexe interacties, en valideert experimenteel de realisatie van topologische dynamica en effectieve meerdeeltjesinteracties op Rydberg-atoomarrays.

Hong-Ye Hu, Abigail McClain Gomez, Liyuan Chen, Aaron Trowbridge, Andy J. Goldschmidt, Zachary Manchester, Frederic T. Chong, Arthur Jaffe, Susanne F. Yelin2026-03-12⚛️ quant-ph

Global Minimizers of Sigmoid Contrastive Loss

Dit artikel biedt een theoretische verklaring voor de voordelen van het synchroniseren van trainbare inverse temperatuur en bias onder de sigmoid-verliesfunctie, zoals gebruikt in SigLIP-modellen, door een nieuw combinatorisch object genaamd (m,brel)(\mathsf{m}, \mathsf{b}_{\mathsf{rel}})-Constellations te introduceren dat de succesvolle prestaties, de modale kloof en de benodigde dimensie voor kwalitatief hoogwaardige representaties verklaart.

Kiril Bangachev, Guy Bresler, Iliyas Noman, Yury Polyanskiy2026-03-12🤖 cs.LG