cs.LG papers | Gist.Science

Adversarial Latent-State Training for Robust Policies in Partially Observable Domains

Dit artikel introduceert een theoretisch en empirisch raamwerk voor het trainen van robuuste beleidsstrategieën in deeltijds waarneembare omgevingen door middel van adversariele blootstelling aan verschuivingen in de initiële latente verdeling, wat leidt tot aanzienlijk verbeterde prestaties onder worst-case omstandigheden.

Angad Singh Ahuja2026-03-10🤖 cs.LG

Shutdown Safety Valves for Advanced AI

Dit artikel bespreekt het onorthodoxe voorstel om een geavanceerde AI een primair doel te geven om uitgeschakeld te worden, als een oplossing voor het risico dat de AI zich verzet tegen het uitschakelen om haar eigen doelen na te streven.

Vincent Conitzer2026-03-10🤖 cs.LG

ShakyPrepend: A Multi-Group Learner with Improved Sample Complexity

Het paper introduceert ShakyPrepend, een nieuwe methode voor multi-groep leren die, geïnspireerd door differentieel privacy, betere theoretische garanties biedt en zich aanpast aan zowel groepsstructuur als ruimtelijke heterogeniteit.

Lujing Zhang, Daniel Hsu, Sivaraman Balakrishnan2026-03-10🤖 cs.LG

Norm-Hierarchy Transitions in Representation Learning: When and Why Neural Networks Abandon Shortcuts

Dit paper introduceert het Norm-Hierarchy Transition-framework, dat uitlegt dat neurale netwerken vertraagd leren optreedt doordat gewichtsdecay het model langzaam door een hiërarchie van parameter-normen beweegt van spurious shortcuts naar gestructureerde representaties, waarbij de overgangstijd logaritmisch toeneemt met de verhouding tussen de normen.

Truong Xuan Khanh, Truong Quynh Hoa2026-03-10🤖 cs.LG

Explainable and Hardware-Efficient Jamming Detection for 5G Networks Using the Convolutional Tsetlin Machine

Dit artikel presenteert een uitlegbare en hardware-efficiënte aanpak voor jamming-detectie in 5G-netwerken met behulp van de Convolutional Tsetlin Machine, die op een realistisch testbed vergelijkbare prestaties levert als een CNN maar aanzienlijk sneller traint en minder geheugen vereist, waardoor het ideaal is voor implementatie op randapparatuur.

Vojtech Halenka, Mohammadreza Amini, Per-Arne Andersen, Ole-Christoffer Granmo, Burak Kantarci2026-03-10🤖 cs.LG

Learning Concept Bottleneck Models from Mechanistic Explanations

Dit paper introduceert Mechanistic CBM (M-CBM), een nieuwe aanpak die conceptbottleneck-modellen bouwt door mechanische concepten uit zwarte-kastmodellen te extraheren met Sparse Autoencoders, waardoor ze bij gelijke sparsiteit significant beter presteren dan eerdere methoden en betere interpretaties bieden.

Antonio De Santis, Schrasing Tong, Marco Brambilla, Lalana Kagal2026-03-10🤖 cs.LG

Learning Clinical Representations Under Systematic Distribution Shift

Deze paper introduceert een framework voor het leren van praktijkonafhankelijke klinische representaties dat door het onderdrukken van omgevingsspecifieke artefacten de prestaties en kalibratie van modellen bij distributieveranderingen significant verbetert.

Yuanyun Zhang, Shi Li2026-03-10🤖 cs.LG

A Distributed Gaussian Process Model for Multi-Robot Mapping

Dit artikel introduceert DistGP, een gedistribueerde methode voor multi-robot mapping die een verspreide, asynchrone training van een spaarzaam Gaussisch proces mogelijk maakt en hiermee superieure prestaties, robuustheid en continuïteit bereikt ten opzichte van bestaande methoden zoals Tree-Structured GPs en DiNNO.

Seth Nabarro, Mark van der Wilk, Andrew J. Davison2026-03-10🤖 cs.LG

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

De AgrI Challenge introduceert een data-centric AI-framework met Cross-Team Validatie om de generalisatiekloof in landbouwhoogtevisie te overbruggen, waarbij wordt aangetoond dat gezamenlijk trainen op door meerdere teams verzamelde datasets de robuustheid aanzienlijk verbetert ten opzichte van enkelvoudige brontraining.

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Latent Generative Models with Tunable Complexity for Compressed Sensing and other Inverse Problems

Dit paper introduceert generatieve modellen met instelbare complexiteit, gebaseerd op geneste dropout, die voor diverse inverse problemen zoals gecomprimeerde sensing en denoising consistent lagere reconstructiefouten opleveren dan traditionele modellen met vaste complexiteit.

Sean Gunn, Jorio Cocola, Oliver De Candido, Vaggos Chatziafratis, Paul Hand2026-03-10🤖 cs.LG

N-Tree Diffusion for Long-Horizon Wildfire Risk Forecasting

Dit paper introduceert NT-Diffusion, een hiërarchisch diffusiemodel dat de rekenkosten verlaagt en de nauwkeurigheid verbetert bij het voorspellen van lange-termijn brandrisico's door het delen van vroege denoising-fasen en het vertakken voor specifieke tijdstippen.

Yucheng Xing, Xin Wang2026-03-10🤖 cs.LG

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

Dit onderzoek onthult dat in het sub-20M parameter-regime voor TinyML de prestaties van kleine modellen niet uniform schalen, maar juist een veranderend foutenpatroon, verzadigingseffecten en onverwacht betere kalibratie vertonen, wat aantoont dat validatie op de specifieke doelgrootte essentieel is voor betrouwbare edge-AI.

Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah2026-03-10🤖 cs.LG

Learning to Reflect: Hierarchical Multi-Agent Reinforcement Learning for CSI-Free mmWave Beam-Focusing

Dit artikel introduceert een hiërarchisch multi-agent versterkingsleerframework dat channel state information (CSI) vervangt door gebruikerslocatiegegevens om de complexe besturing van mmWave-beamfocusing via reconfigurerende intelligente oppervlakken te vereenvoudigen en te schalen.

Hieu Le, Oguz Bedir, Mostafa Ibrahim, Jian Tao, Sabit Ekin2026-03-10🤖 cs.LG

ConfHit: Conformal Generative Design with Oracle Free Guarantees

ConfHit is een distributie-onafhankelijk framework dat conformele voorspelling gebruikt om generatieve modellen voor moleculenontwerp betrouwbaar te maken door, zonder experimentele validatie, statistisch gegarandeerde sets van kandidaat-moleculen te certificeren en te verfijnen.

Siddhartha Laghuvarapu, Ying Jin, Jimeng Sun2026-03-10🤖 cs.LG

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

Dit artikel onderzoekt domeinspecifieke kwaliteitsschatting voor machinevertaling in laag-resourced scenario's tussen het Engels en Indic-talen, waarbij wordt aangetoond dat het aanpassen van tussenliggende lagen van open-source taalmodellen via Low-Rank Adaptatie (ALOPE en LoRMA) robuustere resultaten oplevert dan prompt-only methoden, vooral in complexe domeinen zoals gezondheidszorg en recht.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

Sparsity and Out-of-Distribution Generalization

Dit paper presenteert een principieel kader voor out-of-distribution generalisatie dat stelt dat hypothese die gebaseerd zijn op zo min mogelijk kenmerken (sparsiteit) en die voldoende overlappen met de trainingsverdeling op de relevante kenmerken, succesvol generaliseren naar nieuwe verdelingen, wat wordt onderbouwd door een wiskundig bewijs en een uitbreiding naar subspace juntas.

Scott Aaronson, Lin Lin Lee, Jiawei Li2026-03-10🤖 cs.LG

Feed m Birds with One Scone: Accelerating Multi-task Gradient Balancing via Bi-level Optimization

Dit paper introduceert MARIGOLD, een efficiënt bi-niveau optimalisatiekader dat multi-task learning verbetert door het koppelen van modeltraining en gradiëntbalancering, waardoor de rekentijd van bestaande methoden zoals MGDA aanzienlijk wordt verlaagd zonder toegang tot alle taakgradiënten te vereisen.

Xuxing Chen, Yun He, Jiayi Xu, Minhui Huang, Xiaoyi Liu, Boyang Liu, Fei Tian, Xiaohan Wei, Rong Jin, Sem Park, Bo Long, Xue Feng2026-03-10🤖 cs.LG

Deterministic Fuzzy Triage for Legal Compliance Classification and Evidence Retrieval

Dit paper introduceert een deterministisch, reproduceerbaar systeem voor juridische triage dat RoBERTa-encoders en transparante fuzzy-bands combineert om grote hoeveelheden contractbewijs te classificeren en te selecteren voor menselijke beoordeling, terwijl het tegelijkertijd strikte foutmarges waarborgt en voldoet aan compliance-eisen zoals HIPAA en NERC-CIP.

Rian Atri2026-03-10🤖 cs.LG

Generalizing Linear Autoencoder Recommenders with Decoupled Expected Quadratic Loss

Dit artikel introduceert de Decoupled Expected Quadratic Loss (DEQL) om het EDLAE-model voor aanbevelingssystemen te generaliseren, waardoor efficiënte oplossingen voor de hyperparameter $b > 0$ mogelijk worden die betere prestaties leveren dan de oorspronkelijke $b = 0$ -benadering.

Ruixin Guo, Xinyu Li, Hao Zhou, Yang Zhou, Ruoming Jin2026-03-10🤖 cs.LG

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

Deze paper introduceert het concept van 'Context Channel Capacity' als een informatie-theoretisch raamwerk dat aantoont dat architecturale aanpassingen, in plaats van algoritmische optimalisaties, essentieel zijn om catastrofaal vergeten in continu leren te voorkomen door de contextpaden structureel onmisbaar te maken.

Ran Cheng2026-03-10🤖 cs.LG

← Vorige Volgende →