cs.AI papers | Gist.Science

HTMuon: Improving Muon via Heavy-Tailed Spectral Correction

Dit paper introduceert HTMuon, een verbeterde versie van de Muon-optimizer die door middel van heavy-tailed spectrale correctie de prestaties van LLM's en beeldclassificatie verbetert door de beperkingen van de oorspronkelijke orthogonale update-regel te overwinnen.

Tianyu Pang, Yujie Fang, Zihang Liu, Shenyang Deng, Lei Hsiung, Shuhua Yu, Yaoqing Yang2026-03-12🤖 cs.LG

ADVERSA: Measuring Multi-Turn Guardrail Degradation and Judge Reliability in Large Language Models

Het paper introduceert ADVERSA, een geautomatiseerd red-teaming-framework dat de degradatie van veiligheidsbarrières in grote taalmodellen tijdens meervoudige interacties meet en de betrouwbaarheid van beoordelaars kwantificeert, waarbij experimenten aantonen dat succesvolle jailbreaks zich voornamelijk in de vroege rondes voordoen in plaats van door langdurige druk te accumuleren.

Harry Owiredu-Ashley2026-03-12🤖 cs.AI

Dissecting Chronos: Sparse Autoencoders Reveal Causal Feature Hierarchies in Time Series Foundation Models

Dit paper presenteert de eerste toepassing van sparse autoencoders op het tijdreeks-foundationmodel Chronos-T5, waarbij wordt aangetoond dat causaal kritieke kenmerken zich bevinden in de middenlagen die abrupte dynamiek detecteren, in plaats van in de semantisch rijkste laatste laag.

Anurag Mishra2026-03-12🤖 cs.LG

Why LLMs Fail: A Failure Analysis and Partial Success Measurement for Automated Security Patch Generation

Deze studie analyseert 319 door LLM's gegenereerde beveiligingspatches en concludeert dat deze modellen, ondanks het behoud van functionaliteit, vaak falen in het correct oplossen van kwetsbaarheden door semantisch misverstand, wat strenge validatie voorafgaand aan implementatie noodzakelijk maakt.

Amir Al-Maamari2026-03-12🤖 cs.AI

Marginals Before Conditionals

Dit artikel toont aan dat neurale netwerken bij het leren van conditionele relaties eerst een marginaal plateau bereiken dat wordt gestabiliseerd door gradiëntruis, voordat ze een scherpe collectieve overgang maken naar volledige conditionele kennis.

Mihir Sahasrabudhe2026-03-12🤖 cs.LG

TASER: Task-Aware Spectral Energy Refine for Backdoor Suppression in UAV Swarms Decentralized Federated Learning

Dit paper introduceert TASER, een efficiënt decentraal verdedigingskader voor UAV-zwermen dat gebruikmaakt van spectrale energieconcentratie in plaats van complexe uitbijterdetectie om sluwe backdoor-aanvallen in Federated Learning-systemen effectief te onderdrukken.

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

Amnesia: Adversarial Semantic Layer Specific Activation Steering in Large Language Models

Dit paper introduceert Amnesia, een lichtgewicht aanvalstechniek die interne transformer-activaties manipuleert om bestaande veiligheidsmechanismen in open-weight grote taalmodellen te omzeilen en zo schadelijke inhoud te genereren zonder aanvullende training.

Ali Raza, Gurang Gupta, Nikolay Matyunin, Jibesh Patra2026-03-12🤖 cs.AI

Digging Deeper: Learning Multi-Level Concept Hierarchies

Dit paper introduceert Multi-Level Concept Splitting (MLCS) en Deep-HiCEMs om diepe, mensinterpreteerbare concepthiërarchieën te ontdekken uit slechts top-niveau supervisie, waardoor modellen zowel nauwkeuriger worden als beter interpreteerbaar en manipuleerbaar op verschillende abstractieniveaus.

Oscar Hill, Mateo Espinosa Zarlenga, Mateja Jamnik2026-03-12🤖 cs.LG

KernelSkill: A Multi-Agent Framework for GPU Kernel Optimization

Het paper introduceert KernelSkill, een multi-agent framework dat de efficiëntie van GPU-kernels verbetert door impliciete heuristieken te vervangen door kennisgedreven vaardigheden en een dubbel niveau van geheugen, wat resulteert in aanzienlijke snelheidswinsten en een hogere succesratio ten opzichte van eerdere methoden.

Qitong Sun, Jun Han, Tianlin Li, Zhe Tang, Sheng Chen, Fei Yang, Aishan Liu, Xianglong Liu, Yang Liu2026-03-12🤖 cs.LG

ES-dLLM: Efficient Inference for Diffusion Large Language Models by Early-Skipping

Deze paper introduceert ES-dLLM, een trainingsvrij raamwerk dat de inferentie van diffusion-taalmodellen versnelt door tokens in vroege lagen te overslaan op basis van variatie in tussentijdse representaties, wat resulteert in een tot 16,8 keer hogere snelheid zonder kwaliteitsverlies.

Zijian Zhu, Fei Ren, Zhanhong Tan, Kaisheng Ma2026-03-12🤖 cs.LG

Multi-Stream Perturbation Attack: Breaking Safety Alignment of Thinking LLMs Through Concurrent Task Interference

Dit paper introduceert de 'Multi-Stream Perturbation Attack', een methode die de veiligheidsuitlijning van denkende LLM's omzeilt door meerdere taakstromen te verweven, wat leidt tot een ineenstorting van het redeneerproces en een hoge succesgraad bij jailbreak-aanvallen.

Fan Yang2026-03-12🤖 cs.AI

Execution Is the New Attack Surface: Survivability-Aware Agentic Crypto Trading with OpenClaw-Style Local Executors

Dit paper introduceert 'Survivability-Aware Execution' (SAE), een middleware-standaard die de uitvoeringslaag van agentic crypto-trading-systemen (zoals OpenClaw) beschermt tegen schade door onbetrouwbare prompts of skills via strikte, niet te omzeilen invariants, wat resulteert in een drastische reductie van maximale drawdown en risico in backtests.

Ailiya Borjigin, Igor Stadnyk, Ben Bilski, Serhii Hovorov, Sofiia Pidturkina2026-03-12🤖 cs.AI

Equivariant Asynchronous Diffusion: An Adaptive Denoising Schedule for Accelerated Molecular Conformation Generation

Deze paper introduceert Equivariant Asynchronous Diffusion (EAD), een nieuw diffusion-model dat een adaptief, asynchroon ontmiddelingschema gebruikt om de hiërarchische structuur van moleculen beter te vangen en zo de prestaties bij het genereren van 3D-moleculaire conformaties te verbeteren.

Junyi An, Chao Qu, Yun-Fei Shi, Zhijian Zhou, Fenglei Cao, Yuan Qi2026-03-12🧬 q-bio

Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models

Dit paper introduceert Code-Space Response Oracles (CSRO), een nieuw raamwerk dat Large Language Models gebruikt om in plaats van ondoorzichtige neurale netten interpreteerbare, menselijke code te genereren voor multi-agent beleidsstrategieën, waardoor complexe speltheoretische evenwichten transparanter en betrouwbaarder worden.

Daniel Hennes, Zun Li, John Schultz, Marc Lanctot2026-03-12🤖 cs.AI

Hardware Efficient Approximate Convolution with Tunable Error Tolerance for CNNs

Dit paper introduceert een hardware-efficiënte "soft sparsity"-benadering met een instelbare fouttolerantie die, via een aangepaste RISC-V-instructie, de reken- en stroomverbruik van CNN's aanzienlijk verlaagt zonder in te leveren op nauwkeurigheid.

Vishal Shashidhar, Anupam Kumari, Roy P Paily2026-03-12🤖 cs.LG

CLIPO: Contrastive Learning in Policy Optimization Generalizes RLVR

Het CLIPO-papier introduceert een contrastief leermethode binnen beleidsoptimalisatie die het RLVR-framework generaliseert door de consistentie van tussenstappen te waarborgen, waardoor hallucinaties worden onderdrukt en de robuustheid en generalisatie van redenerende grote taalmodellen aanzienlijk worden verbeterd.

Sijia Cui, Pengyu Cheng, Jiajun Song, Yongbo Gai, Guojun Zhang, Zhechao Yu, Jianhe Lin, Xiaoxi Jiang, Guanjun Jiang2026-03-12🤖 cs.LG

Lost in the Middle at Birth: An Exact Theory of Transformer Position Bias

Dit artikel toont aan dat het "Lost in the Middle"-fenomeen een inherente geometrische eigenschap is van de architectuur van causal decoders die al bij initialisatie aanwezig is, ongeacht training of positiële encoding, en wordt veroorzaakt door de interactie tussen causale masking en residual connections.

Borun D Chowdhury2026-03-12🤖 cs.LG

AR-VLA: True Autoregressive Action Expert for Vision-Language-Action Models

Dit paper introduceert AR-VLA, een autonoom autoregressief actie-expert dat door het behouden van een langlevend geheugen en het synchroniseren van trage waarnemingen met snelle besturing, soepelere en contextbewustere robotacties genereert dan bestaande reactieve Vision-Language-Action-modellen.

Yutong Hu, Jan-Nico Zaech, Nikolay Nikolov, Yuanqi Yao, Sombit Dey, Giuliano Albanese, Renaud Detry, Luc Van Gool, Danda Paudel2026-03-12🤖 cs.AI

Agentic Control Center for Data Product Optimization

Dit paper introduceert een systeem dat data-producten automatiseert en optimaliseert door middel van gespecialiseerde AI-agenten in een continue cyclus, waarbij menselijke controle behouden blijft om betrouwbare en waardevolle inzichten te genereren.

Priyadarshini Tamilselvan, Gregory Bramble, Sola Shirai, Ken C. L. Wong, Faisal Chowdhury, Horst Samulowitz2026-03-12🤖 cs.AI

The Generation-Recognition Asymmetry: Six Dimensions of a Fundamental Divide in Formal Language Theory

Dit artikel identificeert zes onafhankelijke dimensies waarin generatie en herkenning binnen de formele taaltheorie fundamenteel verschillen, weerlegt het simplistische idee dat generatie altijd makkelijk is, en verbindt deze asymmetrie met concepten als verrassing (surprisal) en de operationele beperkingen van grote taalmodellen.

Romain Peyrichou2026-03-12💬 cs.CL

← Vorige Volgende →