cs.AI articles | Gist.Science

HTMuon: Improving Muon via Heavy-Tailed Spectral Correction

Cet article présente HTMuon, une méthode d'optimisation qui améliore l'algorithme Muon en introduisant une correction spectrale à queues lourdes pour générer des mises à jour plus robustes et réduire la perplexité lors de l'entraînement de modèles de langage, tout en offrant une garantie théorique de convergence.

Tianyu Pang, Yujie Fang, Zihang Liu, Shenyang Deng, Lei Hsiung, Shuhua Yu, Yaoqing Yang2026-03-12🤖 cs.LG

ADVERSA: Measuring Multi-Turn Guardrail Degradation and Judge Reliability in Large Language Models

L'article présente ADVERSA, un cadre de test automatisé qui évalue la dégradation progressive des garde-fous des grands modèles de langage lors d'interactions adversariales multi-tours, révélant que les jailbreaks réussis se concentrent principalement dans les premiers tours de conversation.

Harry Owiredu-Ashley2026-03-12🤖 cs.AI

Dissecting Chronos: Sparse Autoencoders Reveal Causal Feature Hierarchies in Time Series Foundation Models

Cette étude présente la première application d'autoencodeurs clairsemés au modèle Chronos-T5, révélant une hiérarchie causale où les couches intermédiaires, et non la dernière, sont essentielles à la détection des changements abrupts pour des prévisions temporelles fiables.

Anurag Mishra2026-03-12🤖 cs.LG

Why LLMs Fail: A Failure Analysis and Partial Success Measurement for Automated Security Patch Generation

Cette étude analyse les échecs des modèles de langage dans la génération de correctifs de sécurité pour 64 vulnérabilités Java, révélant que bien que ces modèles préservent souvent la fonctionnalité, ils échouent majoritairement à résoudre les problèmes de sécurité en raison d'incompréhensions sémantiques, ce qui justifie la nécessité d'une validation rigoureuse avant déploiement.

Amir Al-Maamari2026-03-12🤖 cs.AI

Marginals Before Conditionals

Cette étude révèle que les réseaux de neurones apprennent d'abord une distribution marginale, stabilisée par le bruit du gradient et caractérisée par un plateau de perte d'entropie conditionnelle, avant de subir une transition collective abrupte vers l'apprentissage complet de la conditionnalité une fois qu'une tête de routage sélective s'est assemblée.

Mihir Sahasrabudhe2026-03-12🤖 cs.LG

TASER: Task-Aware Spectral Energy Refine for Backdoor Suppression in UAV Swarms Decentralized Federated Learning

Le papier propose TASER, un cadre de défense décentralisé innovant pour les essaims de drones utilisant l'apprentissage fédéré, qui supprime les attaques par porte dérobée en exploitant la concentration spectrale des gradients pour préserver les coefficients de fréquence pertinents pour la tâche principale tout en éliminant les composantes malveillantes.

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

Amnesia: Adversarial Semantic Layer Specific Activation Steering in Large Language Models

L'article présente Amnesia, une attaque légère par déviation d'activation dans l'espace des représentations qui permet de contourner les mécanismes de sécurité des grands modèles de langage à poids ouverts pour générer du contenu nuisible sans nécessiter de réentraînement.

Ali Raza, Gurang Gupta, Nikolay Matyunin, Jibesh Patra2026-03-12🤖 cs.AI

Digging Deeper: Learning Multi-Level Concept Hierarchies

Cet article présente Multi-Level Concept Splitting (MLCS) et Deep-HiCEMs, deux approches capables de découvrir et de modéliser des hiérarchies de concepts multi-niveaux à partir d'une supervision de haut niveau, permettant ainsi des interventions interprétables à plusieurs niveaux d'abstraction tout en maintenant de hautes performances.

Oscar Hill, Mateo Espinosa Zarlenga, Mateja Jamnik2026-03-12🤖 cs.LG

KernelSkill: A Multi-Agent Framework for GPU Kernel Optimization

Le papier présente KernelSkill, un cadre multi-agents qui améliore l'optimisation des noyaux GPU en remplaçant les heuristiques implicites des modèles de langage par des compétences d'experts explicites et une architecture de mémoire double niveau, atteignant des accélérations significatives par rapport aux méthodes existantes.

Qitong Sun, Jun Han, Tianlin Li, Zhe Tang, Sheng Chen, Fei Yang, Aishan Liu, Xianglong Liu, Yang Liu2026-03-12🤖 cs.LG

ES-dLLM: Efficient Inference for Diffusion Large Language Models by Early-Skipping

Le papier présente ES-dLLM, un cadre d'accélération d'inférence sans entraînement pour les modèles de diffusion de langage (dLLM) qui améliore considérablement le débit en sautant dynamiquement les calculs dans les premières couches basés sur l'importance estimée des tokens, tout en préservant la qualité de génération.

Zijian Zhu, Fei Ren, Zhanhong Tan, Kaisheng Ma2026-03-12🤖 cs.LG

Multi-Stream Perturbation Attack: Breaking Safety Alignment of Thinking LLMs Through Concurrent Task Interference

Cet article propose une attaque par perturbation multi-flux qui exploite les vulnérabilités du mode de réflexion des grands modèles de langage en intercalant plusieurs tâches pour contourner leurs mécanismes de sécurité et provoquer l'effondrement de leur processus de raisonnement.

Fan Yang2026-03-12🤖 cs.AI

Execution Is the New Attack Surface: Survivability-Aware Agentic Crypto Trading with OpenClaw-Style Local Executors

Cet article propose le standard d'exécution SAE (Survivability-Aware Execution), une couche middleware qui sécurise les agents de trading crypto de type OpenClaw en imposant des invariants non contournables et en mesurant l'écart de délégation, réduisant ainsi drastiquement les pertes maximales et les risques d'attaques lors de l'exécution de stratégies.

Ailiya Borjigin, Igor Stadnyk, Ben Bilski, Serhii Hovorov, Sofiia Pidturkina2026-03-12🤖 cs.AI

Equivariant Asynchronous Diffusion: An Adaptive Denoising Schedule for Accelerated Molecular Conformation Generation

Le papier présente l'EAD, un modèle de diffusion équivariant et asynchrone doté d'un mécanisme de planification dynamique qui surpasse les méthodes existantes en générant des conformations moléculaires 3D en combinant les avantages des approches auto-régressives et synchrones.

Junyi An, Chao Qu, Yun-Fei Shi, Zhijian Zhou, Fenglei Cao, Yuan Qi2026-03-12🧬 q-bio

Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models

Cet article présente CSRO, un cadre novateur qui remplace les oracles d'apprentissage par renforcement par des modèles de langage pour générer des politiques multi-agents interprétables sous forme de code, tout en maintenant des performances compétitives.

Daniel Hennes, Zun Li, John Schultz, Marc Lanctot2026-03-12🤖 cs.AI

Hardware Efficient Approximate Convolution with Tunable Error Tolerance for CNNs

Cet article propose une méthode d'épissage « doux » basée sur un proxy de bit de poids fort intégré à une instruction RISC-V personnalisée, qui permet de réduire considérablement le nombre d'opérations MAC et la consommation énergétique des CNNs sur des dispositifs embarqués sans perte de précision, surpassant ainsi les techniques d'épissage traditionnelles.

Vishal Shashidhar, Anupam Kumari, Roy P Paily2026-03-12🤖 cs.LG

CLIPO: Contrastive Learning in Policy Optimization Generalizes RLVR

Le papier CLIPO propose d'intégrer un mécanisme d'apprentissage contrastif à l'optimisation de politique pour généraliser l'apprentissage par renforcement avec récompenses vérifiables (RLVR), permettant ainsi de corriger les incohérences de raisonnement et les hallucinations en se concentrant sur la structure invariante des étapes intermédiaires correctes plutôt que sur le seul résultat final.

Sijia Cui, Pengyu Cheng, Jiajun Song, Yongbo Gai, Guojun Zhang, Zhechao Yu, Jianhe Lin, Xiaoxi Jiang, Guanjun Jiang2026-03-12🤖 cs.LG

Lost in the Middle at Birth: An Exact Theory of Transformer Position Bias

Cette paper démontre que le phénomène « Lost in the Middle », caractérisé par une courbe de performance en U, est une propriété géométrique inhérente aux transformateurs décodeurs causaux dès l'initialisation, résultant de la divergence logarithmique de l'influence au début du contexte et d'un ancrage résiduel à la fin, laissant une zone morte factorielle au milieu qui persiste même après l'entraînement standard.

Borun D Chowdhury2026-03-12🤖 cs.LG

AR-VLA: True Autoregressive Action Expert for Vision-Language-Action Models

Ce papier propose AR-VLA, un expert d'action autonome et autorégressif qui maintient une mémoire à long terme pour générer des trajectoires d'action spatio-temporellement cohérentes et fluides, surpassant ainsi les modèles VLA réactifs actuels tout en assurant un taux de réussite élevé dans des tâches de manipulation robotique.

Yutong Hu, Jan-Nico Zaech, Nikolay Nikolov, Yuanqi Yao, Sombit Dey, Giuliano Albanese, Renaud Detry, Luc Van Gool, Danda Paudel2026-03-12🤖 cs.AI

Agentic Control Center for Data Product Optimization

Ce papier propose un système automatisé utilisant des agents IA spécialisés dans une boucle d'optimisation continue pour améliorer les produits de données en générant des actifs d'appui et en surveillant la qualité, tout en intégrant un contrôle humain pour garantir la fiabilité.

Priyadarshini Tamilselvan, Gregory Bramble, Sola Shirai, Ken C. L. Wong, Faisal Chowdhury, Horst Samulowitz2026-03-12🤖 cs.AI

The Generation-Recognition Asymmetry: Six Dimensions of a Fundamental Divide in Formal Language Theory

Cet article propose une synthèse unifiée de l'asymétrie fondamentale entre génération et reconnaissance en théorie des langages formels en identifiant six dimensions distinctes, dont deux nouvelles (directionnalité et temporalité), pour démontrer que cette divergence opérationnelle persiste malgré l'unification architecturale des modèles de langage modernes.

Romain Peyrichou2026-03-12💬 cs.CL

← Précédent Suivant →