cs.LG papers | Gist.Science

Continual uncertainty learning

Dit artikel introduceert een nieuw curriculum-gebaseerd framework voor continu leren dat door het sequentieel ontleden van meerdere onzekerheden en het combineren van modelgebaseerde regeling met diepe versterkingsturing, robuuste besturing van niet-lineaire mechanische systemen mogelijk maakt met succesvolle simulatie-naar-realiteit-overdracht, zoals gedemonstreerd bij actieve trillingsregeling voor auto-aandrijflijnen.

Heisei Yonezawa, Ansei Yonezawa, Itsuro Kajiwara2026-03-11🤖 cs.AI

Breaking the Factorization Barrier in Diffusion Language Models

Dit paper introduceert Coupled Discrete Diffusion (CoDD), een hybride framework dat de factorisatiebarrière in diffusie-taalmodellen doorbreekt door een lichtgewicht probabilistische inferentielaag te gebruiken die complexe afhankelijkheden tussen tokens modelleert zonder de prestaties of efficiëntie te schaden.

Ian Li, Zilei Shao, Benjie Wang, Rose Yu, Guy Van den Broeck, Anji Liu2026-03-11🤖 cs.AI

Detecting Transportation Mode Using Dense Smartphone GPS Trajectories and Transformer Models

In dit onderzoek wordt SpeedTransformer, een nieuw Transformer-model dat uitsluitend op snelheidsgegevens van dichte smartphone-GPS-trajecten vertrouwt, voorgesteld als een superieur en flexibel alternatief voor traditionele deep learning-modellen voor het detecteren van vervoersmodi, zelfs in complexe omgevingen en bij gebrek aan grote datasets.

Yuandong Zhang, Othmane Echchabi, Tianshu Feng, Wenyi Zhang, Hsuai-Kai Liao, Charles Chang2026-03-11🤖 cs.LG

Non-Rectangular Average-Reward Robust MDPs: Optimal Policies and Their Transient Values

Deze studie toont aan dat voor niet-rechthoekige robuuste Markov-beslissingsprocessen met gemiddelde beloning, elk beleid met sublineaire regret robuust optimaal is zonder de gebruikelijke rechthoekigheidsvoorwaarde, en introduceert een nieuw kader voor het analyseren van en verbeteren van de tijdelijke prestaties via een epoch-gebaseerd beleid.

Shengbo Wang, Nian Si2026-03-11🤖 cs.LG

DUEL: Exact Likelihood for Masked Diffusion via Deterministic Unmasking

Dit paper introduceert DUEL, een raamwerk dat exacte waarschijnlijkheidsberekening mogelijk maakt voor gemaskerde diffusiemodellen via deterministische onmaskering, waardoor deze modellen aanzienlijk betere prestaties tonen dan eerder werd gedacht en een eerlijke vergelijking met autoregressieve modellen mogelijk wordt.

Gilad Turok, Chris De Sa, Volodymyr Kuleshov2026-03-11🤖 cs.LG

Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search

Dit paper introduceert \textsc{Gome}, een MLE-agent die gradiëntgebaseerde optimalisatie toepast in plaats van boomzoektechnieken, wat leidt tot state-of-the-art prestaties op MLE-Bench en aantoont dat deze aanpak bij sterkere redeneermodellen steeds effectiever wordt dan traditionele exhaustieve zoekmethodes.

Yifei Zhang, Xu Yang, Xiao Yang, Bowen Xian, Qizheng Li, Shikai Fang, Jingyuan Li, Jian Wang, Mingrui Xu, Weiqing Liu, Jiang Bian2026-03-11🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

Dit paper introduceert FinTexTS, een nieuw groot dataset voor gepaarde financiële tekst en tijdreeksen dat gebruikmaakt van een semantisch en meer-niveau koppelingsframework om complexe marktinteracties beter vast te leggen dan bestaande methoden op basis van trefwoorden, wat leidt tot verbeterde voorspellingen van aandelenprijzen.

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin Ahn2026-03-11🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

Dit paper introduceert twee software-only technieken, Overflow-Aware Scaling en Macro Block Scaling, die de nauwkeurigheidskloof tussen het MXFP4- en NVFP4-quantisatieformaat voor grote taalmodellen van ongeveer 10% tot minder dan 1% verkleinen zonder hardware-aanpassingen.

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu Kim2026-03-11🤖 cs.AI

Equitable Multi-Task Learning for AI-RANs

Dit paper introduceert het OWO-FMTL-framework, een online-within-online methode voor eerlijk multi-task learning in AI-RAN's die door middel van een dubbele leerlus en alpha-fairness langdurige eerlijkheid en schaalbaarheid op edge-apparaten garandeert.

Panayiotis Raptis, Fatih Aslan, George Iosifidis2026-03-11🤖 cs.LG

KernelCraft: Benchmarking for Agentic Close-to-Metal Kernel Generation on Emerging Hardware

Dit paper introduceert KernelCraft, het eerste benchmarkkader dat aantoont dat agentische LLM-systemen via een feedback-gedreven workflow effectief lage-niveau kernels kunnen genereren en optimaliseren voor nieuwe hardware-architecturen, waardoor de ontwikkelingstijd en -kosten voor dergelijke accelerators aanzienlijk worden verlaagd.

Jiayi Nie, Haoran Wu, Yao Lai, Zeyu Cao, Cheng Zhang, Binglei Lou, Erwei Wang, Jianyi Cheng, Timothy M. Jones, Robert Mullins, Rika Antonova, Yiren Zhao2026-03-11🤖 cs.LG

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

Dit paper introduceert ALADIN, een framework voor nauwkeurigheids- en latentiebewuste ontwerpruimte-analyse dat de prestaties van gemengd-precisie kwantiseringsneuronale netwerken op ingebouwde AI-accelerators evalueert zonder fysieke implementatie, waardoor de ontwikkelingstijd en -kosten aanzienlijk worden verlaagd.

T. Baldi, D. Casini, A. Biondi2026-03-11🤖 cs.AI

Performance Analysis of Edge and In-Sensor AI Processors: A Comparative Review

Dit overzichtspaper analyseert de prestaties van ultra-low-power edge- en in-sensor AI-processoren door een theoretische vergelijking van architectuurparadigma's te combineren met empirische benchmarks van het PicoSAM2-model op de GAP9, STM32N6 en Sony IMX500, waarbij de IMX500 uitblinkt in energie-efficiëntie en in-sensor verwerking.

Luigi Capogrosso, Pietro Bonazzi, Michele Magno2026-03-11🤖 cs.LG

Data-Rate-Aware High-Speed CNN Inference on FPGAs

Dit artikel presenteert een data-rate-bewuste CNN-versnellerarchitectuur voor FPGAs die door middel van multi-pixelverwerking en geoptimaliseerde ontwerpverkenning de hardwarebenutting maximaliseert en de rekenmiddelen voor complexe netwerken aanzienlijk reduceert.

Tobias Habermann, Martin Kumm2026-03-11🤖 cs.LG

Memory-Augmented Spiking Networks: Synergistic Integration of Complementary Mechanisms for Neuromorphic Vision

Dit onderzoek toont aan dat de synergetische integratie van Leaky Integrate-and-Fire-neuronen, Supervised Contrastive Learning, Hopfield-netwerken en HGRN in spiking neural networks leidt tot een evenwichtige verbetering van nauwkeurigheid, energie-efficiëntie en geheugenstructuur voor neuromorfe visie.

Effiong Blessing, Chiung-Yi Tseng, Isaac Nkrumah, Junaid Rehman2026-03-11🤖 cs.LG

Hebbian-Oscillatory Co-Learning

Dit artikel introduceert HOC-L, een unificerend dynamisch kader dat hyperbolische structurele plasticiteit en Kuramoto-fasesynchronisatie combineert via een synchroon-gedreven leermechanisme om bio-geïnspireerde, schaarse neurale netwerken te stabiliseren met bewezen convergentie en lage complexiteit.

Hasi Hays2026-03-11🤖 cs.LG

Autonomous Edge-Deployed AI Agents for Electric Vehicle Charging Infrastructure Management

Dit artikel introduceert Auralink SDC, een architectuur met edge-geplaatste AI-agenten die autonome, veilige en responsieve beheeroplossingen biedt voor openbare laadinfrastructuur, waardoor de hoge uitvalpercentages en trage reparatietijden van bestaande cloudsystemen worden overwonnen.

Mohammed Cherifi2026-03-11🤖 cs.AI

Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

Dit artikel presenteert een compressieframework voor Reservoir Computing dat gebruikmaakt van een op gevoeligheid gebaseerde prune-mechanisme om de afweging tussen kwantisatie, pruning en hardware-efficiëntie te optimaliseren, wat resulteert in aanzienlijke verbeteringen in resourcegebruik en energie-efficiëntie op FPGA's zonder merkbare nauwkeurigheidsverlies.

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco Platzner2026-03-11🤖 cs.AI

The AetherFloat Family: Block-Scale-Free Quad-Radix Floating-Point Architectures for AI Accelerators

Het paper introduceert de AetherFloat-familie, een nieuw kwadratisch radix-4 floating-point architectuurontwerp dat door het elimineren van blokschaallogica en het gebruik van expliciete mantissen aanzienlijke verbeteringen in chipoppervlak, energieverbruik en latentie biedt voor AI-versnellers, met name in de vorm van het AF8-formaat dat dynamische schaling overbodig maakt ten koste van kwantiseringsbewust finetunen.

Keita Morisaki2026-03-11🤖 cs.LG

Robust Parameter and State Estimation in Multiscale Neuronal Systems Using Physics-Informed Neural Networks

Deze studie introduceert een Physics-Informed Neural Network (PINN)-framework dat robuust biophysieke parameters en verborgen toestandsvariabelen kan reconstrueren uit gedeeltelijke en ruisbeïnvloede waarnemingen in multischaal neuronale systemen, waarbij het de beperkingen van traditionele numerieke methoden overwint.

Changliang Wei, Yangyang Wang, Xueyu Zhu2026-03-11🤖 cs.LG

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

Dit paper introduceert het VI 2D SSM, een nieuw architecturaal kader voor multivariate tijdreeksen dat de inherente permutatie-symmetrie respecteert door variabele-afhankelijkheden te vervangen door een canonieke vorm van lokale zelfdynamiek en globale interactie, wat leidt tot state-of-the-art prestaties en verbeterde schaalbaarheid.

Seungwoo Jeong, Heung-Il Suk2026-03-11🤖 cs.AI

← Vorige Volgende →