cs.LG papers | Gist.Science

VSPrefill: Vertical-Slash Sparse Attention with Lightweight Indexing for Long-Context Prefilling

Dit paper introduceert VSPrefill, een methode voor verticale-slash-sparse attention met lichtgewicht indexering die de kwadratische complexiteit van self-attention tijdens de prefill-fase reduceert tot lineaire complexiteit, waardoor langere contexten efficiënter kunnen worden verwerkt met behoud van hoge nauwkeurigheid.

Chen Guanzhong2026-03-06💻 cs

MAD-SmaAt-GNet: A Multimodal Advection-Guided Neural Network for Precipitation Nowcasting

Dit artikel introduceert MAD-SmaAt-GNet, een multimodaal advectie-gestuurd neuronaal netwerk dat de bestaande SmaAt-UNet-architectuur uitbreidt met extra weervariabelen en een fysica-gedreven component om de nauwkeurigheid van neerslagvoorspellingen aanzienlijk te verbeteren.

Samuel van Wonderen, Siamak Mehrkanoon2026-03-06💻 cs

Understanding the Dynamics of Demonstration Conflict in In-Context Learning

Deze studie onthult hoe grote taalmodellen tijdens in-context learning conflicterende voorbeelden verwerken door een twee-fase computatiestructuur te doorlopen, waarbij vroege 'kwetsbare' koppen en late 'gevoelige' koppen verantwoordelijk zijn voor misleidende voorspellingen, wat leidt tot een verbetering van meer dan 10% na gerichte ablacie van deze koppen.

Difan Jiao, Di Wang, Lijie Hu2026-03-06💻 cs

Act-Observe-Rewrite: Multimodal Coding Agents as In-Context Policy Learners for Robot Manipulation

Dit paper introduceert Act-Observe-Rewrite (AOR), een framework waarin een multimodaal taalmodel robotmanipulatie verbetert door zonder gradiëntupdates, demonstraties of beloning-engineering visuele observaties te gebruiken om de uitvoerbare Python-controllercode tussen proeven te herschrijven op basis van gediagnosticeerde fouten.

Vaishak Kumar2026-03-06💻 cs

Towards Explainable Deep Learning for Ship Trajectory Prediction in Inland Waterways

Deze studie presenteert een interpreteerbaar LSTM-model voor het voorspellen van scheepsroutes op binnenwateren, dat ondanks een vergelijkbare nauwkeurigheid van circa 40 meter, aantoont dat de verbeterde prestaties niet volledig worden gedreven door een causaal verband met naburige schepen, wat de noodzaak benadrukt van transparante modellen voor veiligheidskritische toepassingen.

Tom Legel, Dirk Söffker, Roland Schätzle + 1 more2026-03-06💻 cs

Dictionary Based Pattern Entropy for Causal Direction Discovery

Dit artikel introduceert het Dictionary Based Pattern Entropy (DPE)-kader, dat causaliteit in symbolische tijdsreeksen onthult door de richting te bepalen waarin de kandidaat-oorzaak de meest compacte en deterministische patronen genereert die de variabiliteit van het effect minimaliseren.

Harikrishnan N B, Shubham Bhilare, Aditi Kathpalia + 1 more2026-03-06🔢 math

Activity Recognition from Smart Insole Sensor Data Using a Circular Dilated CNN

Dit artikel presenteert een CDCNN-model voor het herkennen van menselijke activiteiten op basis van multi-modale sensordata van slimme inlegzolen, dat in een subject-onafhankelijke evaluatie een nauwkeurigheid van 86,42% bereikte, waarbij inertiale sensoren als cruciaal bleken voor de classificatie.

Yanhua Zhao2026-03-06💻 cs

Standing on the Shoulders of Giants: Rethinking EEG Foundation Model Pretraining via Multi-Teacher Distillation

Deze paper introduceert het Multi-Teacher Distillation Pretraining (MTDP)-framework, dat de pretraining van EEG-foundationmodellen verbetert door kennis over te dragen van bestaande visuele en tijdreeksmodellen, waardoor de prestaties op downstream-taken stijgen met slechts 25% van de oorspronkelijke trainingsdata.

Chenqi Li, Yu Liu, Shuo Zhang + 2 more2026-03-06💻 cs

Bayesian Modeling of Collatz Stopping Times: A Probabilistic Machine Learning Perspective

Dit artikel presenteert een Bayesiaanse machine learning-analyse van de Collatz-stoptijden voor $n \le 10^7$ , waarbij een hiërarchisch Negatief Binomiaal regressiemodel en een mechanistische generatieve benadering worden vergeleken om aan te tonen dat modulaire structuur (met name modulo 8) cruciaal is voor het verklaren van de heterogeniteit in deze tijden.

Nicolò Bonacorsi, Matteo Bordoni2026-03-06🔢 math

AbAffinity: A Large Language Model for Predicting Antibody Binding Affinity against SARS-CoV-2

In deze studie presenteren de auteurs Ab-Affinity, een nieuw groot taalmodel dat de bindingsaffiniteit van antilichamen tegen SARS-CoV-2 nauwkeurig kan voorspellen om zo het ontwerp van neutraliserende antilichamen te ondersteunen.

Faisal Bin Ashraf, Animesh Ray, Stefano Lonardi2026-03-06💻 cs

Augmenting representations with scientific papers

Deze studie introduceert een contrastief leerframework dat X-ray spectra en wetenschappelijke literatuur in een gedeelde multimodale representatie verenigt, waardoor de interpretatie van astronomische bronnen wordt versneld en de schatting van fysische variabelen significant wordt verbeterd.

Nicolò Oreste Pinciroli Vago, Rocco Di Tella, Carolina Cuesta-Lázaro + 3 more2026-03-06✓ Author reviewed ⓘ🔭 astro-ph

Projected Hessian Learning: Fast Curvature Supervision for Accurate Machine-Learning Interatomic Potentials

Dit artikel introduceert Projected Hessian Learning (PHL), een schaalbaar trainingskader voor machine-learning interatomaire potentialen dat tweede-orde krommingsinformatie efficiënt injecteert via Hessian-vectorproducten, waardoor de hoge rekenkosten en geheugeneisen van volledige Hessiaan-matrices worden vermeden terwijl de nauwkeurigheid behouden blijft.

Austin Rodriguez, Justin S. Smith, Sakib Matin + 3 more2026-03-06🔬 physics

The Volterra signature

Dit paper introduceert de Volterra-signatuur als een interpreteerbare en universele feature-representatie voor niet-Markovse tijdreeksen, die wiskundig onderbouwde garanties biedt, efficiënte berekening via kernmethoden mogelijk maakt en superieure prestaties levert ten opzichte van bestaande methoden.

Paul P. Hager, Fabian N. Harang, Luca Pelizzari + 1 more2026-03-06💻 cs

Invariant Causal Routing for Governing Social Norms in Online Market Economies

Dit artikel introduceert Invariant Causal Routing (ICR), een causaal bestuurskader dat gebruikmaakt van contrafactueel redeneren en causale ontdekking om interpreteerbare beleidsregels te ontwikkelen die sociale normen in online markteconomieën effectief en stabiel sturen over diverse omgevingen heen.

Xiangning Yu, Qirui Mi, Xiao Xue + 4 more2026-03-06💻 cs

A Fast Generative Framework for High-dimensional Posterior Sampling: Application to CMB Delensing

Deze paper introduceert een snelle generatieve framework voor Bayesiaanse inferentie dat de achtergrondverdeling van de CMB effectief herstelt en aanzienlijk sneller is dan bestaande diffusiemethoden.

Hadi Sotoudeh, Pablo Lemos, Laurence Perreault-Levasseur2026-03-06🔭 astro-ph

An LLM-Guided Query-Aware Inference System for GNN Models on Large Knowledge Graphs

Dit paper introduceert KG-WISE, een taakgestuurd inferentiesysteem dat grote kennisgrafieken efficiënter maakt door geavanceerde taalmodellen te gebruiken voor het genereren van querytemplates en het dynamisch laden van fijngestructureerde GNN-componenten, wat resulteert in een tot 28 keer snellere inferentie en tot 98% minder geheugengebruik dan bestaande systemen.

Waleed Afandi, Hussein Abdallah, Ashraf Aboulnaga + 1 more2026-03-06💻 cs

Oracle-efficient Hybrid Learning with Constrained Adversaries

Deze paper presenteert een nieuw, oracle-efficiënt leeralgoritme voor het hybride online leerprobleem met beperkte tegenstanders dat statistische optimaliteit en computationele efficiëntie combineert door gebruik te maken van een gestructureerde labelklasse en nieuwe wiskundige hulpmiddelen.

Princewill Okoroafor, Robert Kleinberg, Michael P. Kim2026-03-06💻 cs

Weather-Related Crash Risk Forecasting: A Deep Learning Approach for Heterogenous Spatiotemporal Data

Deze studie introduceert een deep learning-framework dat een ensemble van ConvLSTM-modellen gebruikt om het risico op weersgerelateerde verkeersongevallen in Noord-Carolina nauwkeuriger te voorspellen door complexe ruimtelijke en temporele patronen in heterogene data te modelleren.

Abimbola Ogungbire, Srinivas Pulugurtha2026-03-06💻 cs

Latent Particle World Models: Self-supervised Object-centric Stochastic Dynamics Modeling

Dit paper introduceert het Latent Particle World Model (LPWM), een zelftoezichtend, objectgericht wereldmodel dat onbewaakt sleutelpunten en objectmaskers uit videodata leert om stochastische dynamica te modelleren en state-of-the-art resultaten te behalen voor zowel videopredictie als besluitvorming.

Tal Daniel, Carl Qi, Dan Haramati + 5 more2026-03-06💻 cs

Fusion and Grouping Strategies in Deep Learning for Local Climate Zone Classification of Multimodal Remote Sensing Data

Deze studie analyseert diverse fusie- en groeperingsstrategieën voor deep learning-modellen om de classificatie van lokale klimaatzones met multimodale satellietdata te optimaliseren, waarbij een hybride fusie-aanpak gecombineerd met bandgroepering en labelsamenvoeging de beste prestaties levert met een algehele nauwkeurigheid van 76,6%.

Ancymol Thomas, Jaya Sreevalsan-Nair2026-03-06💻 cs

← Vorige Volgende →