cs.LG papers | Gist.Science

Tureis: Transformer-based Unified Resilience for IoT Devices in Smart Homes

Tureis is een zelftoezichtende, contextbewuste Transformer-methode die in smart homes op basis van randapparatuur meerdere sensorstoringen detecteert en lokaliseert zonder labels, waardoor de nauwkeurigheid aanzienlijk verbetert ten opzichte van bestaande methoden.

Alireza Borhani, Vafa Andalibi, Bahar Asgari2026-03-12💻 cs

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

Dit artikel evalueert hoe goed autonome cyberaanval-agenten generaliseren bij onverwachte IP-adreswijzigingen en concludeert dat hoewel prompt-gedreven LLM-agenten de beste prestaties leveren op onbekende scenario's, dit ten koste gaat van transparantie en rekenkracht, terwijl andere aanpassingsmethoden significant prestatieverlies vertonen.

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian Garcia2026-03-12💻 cs

Safety Under Scaffolding: How Evaluation Conditions Shape Measured Safety

Deze studie toont aan dat de manier waarop veiligheidsbenchmarks worden opgesteld (met name het gebruik van open-ended versus meerkeuzevragen) een grotere invloed heeft op de gemeten veiligheid van taalmodellen dan de specifieke architectuur van de scaffolding, en dat veiligheidsrangschikkingen sterk variëren afhankelijk van de gebruikte benchmark, waardoor universele claims over modelveiligheid onbetrouwbaar zijn.

David Gringras2026-03-12🤖 cs.AI

Gated Adaptation for Continual Learning in Human Activity Recognition

Dit artikel introduceert een parameter-efficiënt continu leerframework voor menselijke activiteitsherkenning dat door middel van kanaal-gewijze gatenmodulatie van bevroren pretrained representaties de balans tussen plasticiteit en stabiliteit verbetert, waardoor het vergeten van eerdere taken aanzienlijk wordt verminderd zonder dat er replay-buffers nodig zijn.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-12🤖 cs.LG

Revisiting Sharpness-Aware Minimization: A More Faithful and Effective Implementation

Dit paper introduceert eXplicit Sharpness-Aware Minimization (XSAM), een verbeterde implementatie die de beperkingen van de bestaande SAM-methode overwint door de richting van het maximum expliciet te schatten en een effectieve zoekruimte te creëren, wat resulteert in consistente prestatieverbeteringen met verwaarloosbare rekenkosten.

Jianlong Chen, Zhiming Zhou2026-03-12🤖 cs.LG

InFusionLayer: a CFA-based ensemble tool to generate new classifiers for learning and modeling

Dit paper introduceert InFusionLayer, een open-source Python-tool die Combinatorial Fusion Analysis (CFA) technieken, zoals de RSC-functie en cognitieve diversiteit, integreert in een ensemble-leerarchitectuur om de prestaties van multiclassificatieproblemen te verbeteren en compatibel is met PyTorch, TensorFlow en Scikit-learn.

Eric Roginek, Jingyan Xu, D. Frank. Hsu2026-03-12🤖 cs.LG

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

Deze paper introduceert FlowSem-MAE, een protocol-natief tabulair pretrainingsparadigma dat de inductieve bias-mismatch van bestaande byte-sequentiemethoden oplost door protocolsemantiek te respecteren, waardoor het encrypted traffic classificatie aanzienlijk verbetert met slechts de helft van de gelabelde data.

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies

Het artikel introduceert OMNIGUIDE, een flexibel raamwerk dat de prestaties van algemene robotbeleidmodellen (VLA's) op complexe taken aanzienlijk verbetert door diverse bronnen van geleiding om te zetten in differentieerbare energiefuncties die de actie-sampling sturen.

Yunzhou Song, Long Le, Yong-Hyun Park, Jie Wang, Junyao Shi, Lingjie Liu, Jiatao Gu, Eric Eaton, Dinesh Jayaraman, Kostas Daniilidis2026-03-12💻 cs

Cluster-Aware Attention-Based Deep Reinforcement Learning for Pickup and Delivery Problems

Dit paper introduceert CAADRL, een deep reinforcement learning-framework dat de clusterstructuur van Pickup and Delivery-problemen expliciet benut via cluster-bewuste codering en hiërarchische decoding om state-of-the-art prestaties te bereiken met aanzienlijk lagere inferentiële latentie dan bestaande methoden.

Wentao Wang, Lifeng Han, Guangyu Zou2026-03-12🤖 cs.LG

Quantization of Ricci Curvature in Information Geometry

Dit artikel bevestigt na twintig jaar het vermoeden dat de volumegemiddelde Ricci-scalar in informatiegeometrie voor boom- en volledige-graaf netwerken kwantisatie vertoont, weerlegt het echter voor algemene netwerken door tegenvoorbeelden aan te tonen en breidt de theorie uit naar Gaussische netwerken met een teken-dichotomie tussen discrete en continue structuren.

Carlos C. Rodriguez2026-03-12🔢 math

Training Language Models via Neural Cellular Automata

Dit onderzoek toont aan dat het voorpre-trainen van grote taalmodellen op synthetische, niet-taalgebonden data gegenereerd door neurale cellulaire automaten de prestaties en convergentie significant verbetert, zelfs ten opzichte van veel grotere hoeveelheden natuurlijk taaldata.

Dan Lee, Seungwook Han, Akarsh Kumar, Pulkit Agrawal2026-03-12🤖 cs.LG

HTMuon: Improving Muon via Heavy-Tailed Spectral Correction

Dit paper introduceert HTMuon, een verbeterde versie van de Muon-optimizer die door middel van heavy-tailed spectrale correctie de prestaties van LLM's en beeldclassificatie verbetert door de beperkingen van de oorspronkelijke orthogonale update-regel te overwinnen.

Tianyu Pang, Yujie Fang, Zihang Liu, Shenyang Deng, Lei Hsiung, Shuhua Yu, Yaoqing Yang2026-03-12🤖 cs.LG

Improving Search Agent with One Line of Code

Deze paper introduceert SAPO, een methode die met slechts één regel code de trainingsinstabiliteit van bestaande zoekagenten oplost door een conditionele token-level KL-beperking toe te passen, wat leidt tot een aanzienlijke prestatieverbetering op diverse benchmarks.

Jian Li, Dongsheng Chen, Zhenhua Xu, Yizhang Jin, Jiafu Wu, Chengjie Wang, Xiaotong Yuan, Yabiao Wang2026-03-12🤖 cs.LG

Dissecting Chronos: Sparse Autoencoders Reveal Causal Feature Hierarchies in Time Series Foundation Models

Dit paper presenteert de eerste toepassing van sparse autoencoders op het tijdreeks-foundationmodel Chronos-T5, waarbij wordt aangetoond dat causaal kritieke kenmerken zich bevinden in de middenlagen die abrupte dynamiek detecteren, in plaats van in de semantisch rijkste laatste laag.

Anurag Mishra2026-03-12🤖 cs.LG

Marginals Before Conditionals

Dit artikel toont aan dat neurale netwerken bij het leren van conditionele relaties eerst een marginaal plateau bereiken dat wordt gestabiliseerd door gradiëntruis, voordat ze een scherpe collectieve overgang maken naar volledige conditionele kennis.

Mihir Sahasrabudhe2026-03-12🤖 cs.LG

Stochastic Port-Hamiltonian Neural Networks: Universal Approximation with Passivity Guarantees

Dit artikel introduceert Stochastic Port-Hamiltonian Neural Networks (SPH-NNs), een architectuur die passiviteit garandeert en universeel de dynamiek van stochastische port-Hamiltoniaanse systemen kan benaderen met verbeterde nauwkeurigheid en energiebehoud op lange termijn vergeleken met standaard netwerken.

Luca Di Persio, Matthias Ehrhardt, Youness Outaleb2026-03-12🤖 cs.LG

Large Spikes in Stochastic Gradient Descent: A Large-Deviations View

Dit artikel biedt een kwantitatieve theorie voor de 'catapult-fase' in SGD-training van ondiepe netwerken, waarbij een expliciete criteriumfunctie $G$ bepaalt of er met hoge waarschijnlijkheid grote spikes optreden of dat de kans hierop exponentieel afneemt.

Benjamin Gess, Daniel Heydecker2026-03-12🤖 cs.LG

Amnesia: Adversarial Semantic Layer Specific Activation Steering in Large Language Models

Dit paper introduceert Amnesia, een lichtgewicht aanvalstechniek die interne transformer-activaties manipuleert om bestaande veiligheidsmechanismen in open-weight grote taalmodellen te omzeilen en zo schadelijke inhoud te genereren zonder aanvullende training.

Ali Raza, Gurang Gupta, Nikolay Matyunin, Jibesh Patra2026-03-12🤖 cs.AI

Mitigating Frequency Learning Bias in Quantum Models via Multi-Stage Residual Learning

Dit paper introduceert een methode voor multi-stadiaresidulair leren in quantummodellen om de 'Fourier-parameteriseringsbias' te mitigeren en zo de expressiviteit voor het leren van meerdere frequentiecomponenten aanzienlijk te verbeteren.

Ammar Daskin2026-03-12⚛️ quant-ph

Digging Deeper: Learning Multi-Level Concept Hierarchies

Dit paper introduceert Multi-Level Concept Splitting (MLCS) en Deep-HiCEMs om diepe, mensinterpreteerbare concepthiërarchieën te ontdekken uit slechts top-niveau supervisie, waardoor modellen zowel nauwkeuriger worden als beter interpreteerbaar en manipuleerbaar op verschillende abstractieniveaus.

Oscar Hill, Mateo Espinosa Zarlenga, Mateja Jamnik2026-03-12🤖 cs.LG

← Vorige Volgende →