cs.LG papers | Gist.Science

SR-TTT: Surprisal-Aware Residual Test-Time Training

Het artikel introduceert SR-TTT, een verbeterde Test-Time Training-architectuur die het probleem van vergeten cruciale informatie oplost door een verlies-gedreven, sparsere geheugenmechanisme toe te passen dat alleen onverwachte tokens naar een traditionele cache routeert, waardoor de O(1)-geheugenvoordeel behouden blijft terwijl de nauwkeurigheid bij exacte herinneringstaken wordt hersteld.

Swamynathan V P2026-03-10🤖 cs.LG

Quantum Deep Learning: A Comprehensive Review

Dit artikel biedt een uitgebreide review van Quantum Deep Learning door een operationele definitie en taxonomie te presenteren, de theoretische principes en hardware-implementaties te analyseren, claims van quantumvoordeel kritisch te beoordelen, en een roadmap te schetsen voor de overgang van huidige demonstraties naar schaalbare, fouttolerante systemen.

Yanjun Ji, Zhao-Yun Chen, Marco Roth, David A. Kreplin, Christian Schiffer, Martin King, Oliver Anton, M. Sahnawaz Alam, Markus Krutzik, Dennis Willsch, Ludwig Mathey, Frank K. Wilhelm, Guo-Ping Guo2026-03-10⚛️ quant-ph

Trust Aware Federated Learning for Secure Bone Healing Stage Interpretation in e-Health

Dit paper introduceert een vertrouwensbewust federatief leerframework dat een adaptief mechanisme voor het schalen en filteren van vertrouwen gebruikt om de interpretatie van botgenezing in e-Health te beveiligen tegen onbetrouwbare deelnemers en zo de modelintegriteit en voorspellingsprestaties te verbeteren.

Paul Shepherd, Tasos Dagiuklas, Bugra Alkan, Joaquim Bastos, Jonathan Rodriguez2026-03-10🤖 cs.LG

HURRI-GAN: A Novel Approach for Hurricane Bias-Correction Beyond Gauge Stations using Generative Adversarial Networks

Dit paper introduceert HURRI-GAN, een nieuw AI-gestuurd model dat fysieke simulaties van orkanen corrigeert met generatieve adversariale netwerken om de rekentijd te verkorten en nauwkeurige voorspellingen te genereren, zelfs op locaties waar geen meetstations aanwezig zijn.

Noujoud Nadera, Hadi Majed, Stefanos Giaremis, Rola El Osta, Clint Dawson, Carola Kaiser, Hartmut Kaiser2026-03-10🤖 cs.LG

Geodesic Gradient Descent: A Generic and Learning-rate-free Optimizer on Objective Function-induced Manifolds

Deze paper introduceert Geodesic Gradient Descent (GGD), een generieke en leerstap-grootte-vrije optimalisatie-algoritme dat de geometrie van objectief-functie-geïnduceerde oppervlakken beter benadert door lokale omgevingen te benaderen met n-dimensionale bollen, wat resulteert in aanzienlijke verbeteringen in testfouten en verlies ten opzichte van de Adam-algoritme.

Liwei Hu, Guangyao Li, Wenyong Wang, Xiaoming Zhang, Yu Xiang2026-03-10🤖 cs.LG

How the Graph Construction Technique Shapes Performance in IoT Botnet Detection

Dit onderzoek toont aan dat de keuze van de grafconstructietechniek, met name de Gabriel-graf, een aanzienlijke impact heeft op de prestaties van een Graph Attention Network voor het detecteren van IoT-botnetten, waarbij deze methode een nauwkeurigheid van 97,56% bereikte vergeleken met andere technieken.

Hassan Wasswa, Hussein Abbass, Timothy Lynar2026-03-10🤖 cs.LG

Approximate Nearest Neighbor Search for Modern AI: A Projection-Augmented Graph Approach

Dit paper introduceert PAG, een nieuw framework voor benaderde dichtstbijzijnde buurzoekopdrachten dat projectietechnieken integreert in een grafindex om tegelijkertijd hoge query-efficiëntie, snelle indexering, een beperkt geheugengebruik en schaalbaarheid te bieden, wat resulteert tot vijf keer snellere prestaties dan HNSW.

Kejing Lu, Zhenpeng Pan, Jianbin Qin, Yoshiharu Ishikawa, Chuan Xiao2026-03-10🤖 cs.LG

EnsAug: Augmentation-Driven Ensembles for Human Motion Sequence Analysis

Dit paper introduceert EnsAug, een trainingsparadigma dat een ensemble van specialistische modellen gebruikt, waarbij elk model is getraind op een unieke geometrische augmentatie, om de prestaties en modulariteit bij de analyse van menselijke bewegingssequenties te verbeteren ten opzichte van de traditionele aanpak van één model op een gecombineerd dataset.

Bikram De, Habib Irani, Vangelis Metsis2026-03-10🤖 cs.LG

HyperTokens: Controlling Token Dynamics for Continual Video-Language Understanding

Het paper introduceert HyperTokens, een transformer-gebaseerde token-generator die voortdurend video-taalbegrip verbetert door dynamische prompts te genereren en meta-geïnspireerde regularisatie te gebruiken om vergeten te voorkomen en de prestaties op benchmarks te maximaliseren.

Toan Nguyen, Yang Liu, Celso De Melo, Flora D. Salim2026-03-10🤖 cs.LG

ERP-RiskBench: Leakage-Safe Ensemble Learning for Financial Risk

Dit paper introduceert ERP-RiskBench, een reproduceerbaar en lekveilig ensemble-leerframework voor het detecteren van financiële risico's in ERP-systemen, dat door middel van strikte validatieprotocollen en een hybride dataset de prestaties van eerdere studies corrigeert en procurement-controles als belangrijkste voorspellers identificeert.

Sanjay Mishra2026-03-10🤖 cs.LG

Unmixing microinfrared spectroscopic images of cross-sections of historical oil paintings

De auteurs presenteren een onbewaakte CNN-autoencoder met een gewogen spectrale hoekafstand (WSAD) voor het automatisch ontwarren van micro-IR spectroscopische beelden van historische olieverfschilderingen, zoals de Ghentse Altaarstuk, om de interpretatie van complexe materiaalmengsels te versnellen en te objectiveren.

Shivam Pande, Nicolas Nadisic, Francisco Mederos-Henry, Aleksandra Pizurica2026-03-10🤖 cs.LG

GNN For Muon Particle Momentum estimation

Dit artikel toont aan dat Graph Neural Networks (GNNs) de traditionele TabNet-modellen overtreffen bij het schatten van het impuls van muonpartikels in het CMS-experiment, waarbij de dimensie van de knoopkenmerken een cruciale rol speelt voor de efficiëntie.

Vishak K Bhat, Eric A. F. Reinhardt, Sergei Gleyzer2026-03-10🤖 cs.LG

XAI and Few-shot-based Hybrid Classification Model for Plant Leaf Disease Prognosis

Dit artikel introduceert een hybride model dat Few-Shot Learning combineert met Explainable AI om plantenziekten bij maïs, rijst en tarwe ook bij beperkte data nauwkeurig te diagnosticeren en transparante inzichten te bieden.

Diana Susan Joseph, Pranav M Pawar, Raja Muthalagu, Mithun Mukharjee2026-03-10🤖 cs.LG

Chart Deep Research in LVLMs via Parallel Relative Policy Optimization

Dit paper introduceert PRPO, een trainingsmethode die conflicten tussen beloningssignalen en data oplost, en MCDR-Bench, een objectieve evaluatiebenchmark, om de diepe analysecapaciteiten van LVLMs voor diagrammen systematisch te verbeteren.

Jiajin Tang, Gaoyang, Wenjie Wang, Sibei Yang, Xing Chen2026-03-10🤖 cs.LG

One step further with Monte-Carlo sampler to guide diffusion better

Deze paper introduceert een plug-and-play strategie die Monte-Carlo-steekproeven en een extra achterwaartse stap combineert om de schattingsfouten bij stochastische differentiaalvergelijkingen te verminderen, waardoor de geleide generatie van afbeeldingen en andere data in diverse toepassingen significant verbetert.

Minsi Ren, Wenhao Deng, Ruiqi Feng, Tailin Wu2026-03-10🤖 cs.LG

High-Resolution Image Reconstruction with Unsupervised Learning and Noisy Data Applied to Ion-Beam Dynamics for Particle Accelerators

Dit artikel introduceert een nieuw, onbewaakt leerframework dat convolutiefilters en neurale netwerken gebruikt om ruisige ionenstraalbeelden te reconstrueeren en zo de resolutie van straalhalo's aanzienlijk verbetert zonder trainingsdata.

Francis Osswald (IPHC), Mohammed Chahbaoui (UNISTRA), Xinyi Liang (SU)2026-03-10🤖 cs.LG

Soft Equivariance Regularization for Invariant Self-Supervised Learning

Dit artikel introduceert Soft Equivariance Regularization (SER), een plug-in regularisatiemethode die invariance en equivariantie in zelftoezichtend leren ontkoppelt door equivariantie op een tussenlaag af te dwingen, wat leidt tot verbeterde prestaties op ImageNet en robuustheid tegen geometrische verstoringen zonder extra voorspellingskoppen.

Joohyung Lee, Changhun Kim, Hyunsu Kim, Kwanhyung Lee, Juho Lee2026-03-10🤖 cs.LG

On the Generalization Capacities of MLLMs for Spatial Intelligence

Dit paper stelt dat MLLMs die alleen RGB-gegevens verwerken fundamenteel tekortschieten in ruimtelijk inzicht door camera-parameters te negeren, en introduceert daarom een camera-bewust raamwerk dat door het integreren van camera-intrinsieke parameters en data-augmentatie zorgt voor robuustere en generaliseerbare ruimtelijke redeneerfähigheden.

Gongjie Zhang, Wenhao Li, Quanhao Qian, Jiuniu Wang, Deli Zhao, Shijian Lu, Ran Xu2026-03-10🤖 cs.LG

Uncertainty-Aware Solar Flare Regression

Dit artikel toont aan dat het toepassen van conformalized quantile regression op deep learning-modellen voor het voorspellen van zonnevlammen uit magnetische veldkaarten leidt tot betrouwbaardere voorspellingen met nauwkeurigere betrouwbaarheidsintervallen dan andere methoden.

Jinsu Hong, Chetraj Pandey, Berkay Aydin2026-03-10🔭 astro-ph

Scaling Agentic Capabilities, Not Context: Efficient Reinforcement Finetuning for Large Toolspaces

Dit paper introduceert ATLAS, een reinforcement finetuning-framework dat kleine taalmodellen in staat stelt om effectief te opereren in grote tool-ecosystemen door contextbeheer en uitvoering als leerbare beslissingen te behandelen, waardoor ze met beperkte middelen prestaties kunnen bereiken die dicht bij die van geavanceerde agenten liggen.

Karan Gupta, Pranav Vajreshwari, Yash Pandya, Raghav Magazine, Akshay Nambi, Ahmed Awadallah2026-03-10🤖 cs.LG

← Vorige Volgende →