cs.AI articles | Gist.Science

RedFuser: An Automatic Operator Fusion Framework for Cascaded Reductions on AI Accelerators

Ce papier présente RedFuser, un cadre de fusion automatique d'opérateurs conçu pour optimiser les réductions en cascade sur les accélérateurs d'IA en générant des noyaux exécutables qui surpassent les compilateurs actuels et rivalisent avec des implémentations manuelles.

Xinsheng Tang, Yangcheng Li, Nan Wang, Zhiyi Shu, Xingyu Ling, Junna Xing, Peng Zhou, Qiang Liu2026-03-12🤖 cs.AI

A Governance and Evaluation Framework for Deterministic, Rule-Based Clinical Decision Support in Empiric Antibiotic Prescribing

Cet article propose un cadre de gouvernance et d'évaluation pour des systèmes d'aide à la décision clinique déterministes et basés sur des règles, spécifiquement conçus pour optimiser la prescription empirique d'antibiotiques en priorisant la transparence, l'auditabilité et l'abstention contrôlée lorsque les conditions de sécurité ne sont pas remplies.

Francisco José Gárate, Paloma Chausa, Diego Moreno, Judit López Luque, Vicens Díaz-Brito, Enrique Javier Gómez2026-03-12🤖 cs.AI

How to Count AIs: Individuation and Liability for AI Agents

Cet article propose la création d'une « corporation algorithmique » (A-corp), une entité juridique fictionnelle possédée par des humains mais gérée par des IA, afin de résoudre les défis complexes d'identification et de responsabilité légale liés à la prolifération d'agents autonomes en établissant à la fois un lien de responsabilité humaine et une identité persistante pour les IA.

Yonathan Arbel, Peter Salib, Simon Goldstein2026-03-12🤖 cs.AI

The DMA Streaming Framework: Kernel-Level Buffer Orchestration for High-Performance AI Data Paths

Ce papier présente dmaplane, un module noyau Linux qui orchestre la gestion des buffers et l'exportation DMA pour optimiser les flux de données IA, en permettant notamment l'inférence désagrégée via des transferts RDMA entre machines.

Marco Graziano2026-03-12🤖 cs.AI

Architecture-Aware LLM Inference Optimization on AMD Instinct GPUs: A Comprehensive Benchmark and Deployment Study

Cette étude présente une évaluation comparative de l'inférence de grands modèles de langage sur les GPU AMD Instinct MI325X, démontrant que l'optimisation adaptée à l'architecture est cruciale pour maximiser le débit et la stabilité, tout en validant des performances élevées et une fiabilité totale sur des modèles allant jusqu'à 1 trillion de paramètres.

Athos Georgiou2026-03-12🤖 cs.AI

HTM-EAR: Importance-Preserving Tiered Memory with Hybrid Routing under Saturation

Ce papier présente HTM-EAR, un système de mémoire hiérarchique intégrant un routage hybride et une éviction basée sur l'importance, qui maintient une haute précision de requête sous saturation tout en permettant un oubli contrôlé des données obsolètes.

Shubham Kumar Singh2026-03-12🤖 cs.AI

Evaluating Progress in Graph Foundation Models: A Comprehensive Benchmark and New Insights

Ce papier présente un nouveau benchmark complet pour les modèles de fondation graphiques qui évalue simultanément les transferts de connaissances à travers les domaines thématiques et les formats de représentation, révélant ainsi de nouvelles perspectives empiriques grâce à une analyse détaillée sur 33 jeux de données.

Xingtong Yu, Shenghua Ye, Ruijuan Liang, Chang Zhou, Hong Cheng, Xinming Zhang, Yuan Fang2026-03-12💬 cs.CL

Targeted Bit-Flip Attacks on LLM-Based Agents

Ce papier présente Flip-Agent, le premier cadre d'attaque par inversion de bits ciblant les agents basés sur les LLM, démontrant que ces vulnérabilités matérielles peuvent être exploitées pour manipuler à la fois les réponses finales et les appels d'outils dans des pipelines complexes.

Jialai Wang, Ya Wen, Zhongmou Liu, Yuxiao Wu, Bingyi He, Zongpeng Li, Ee-Chien Chang2026-03-12🤖 cs.AI

AMB-DSGDN: Adaptive Modality-Balanced Dynamic Semantic Graph Differential Network for Multimodal Emotion Recognition

Cet article propose le réseau AMB-DSGDN, une architecture innovante pour la reconnaissance des émotions multimodales qui utilise des graphes sémantiques dynamiques et un mécanisme d'attention différentielle pour éliminer le bruit et un mécanisme d'équilibrage adaptatif pour prévenir la domination d'une modalité, améliorant ainsi la précision de la détection des états émotionnels.

Yunsheng Wang, Yuntao Shou, Yilong Tan, Wei Ai, Tao Meng, Keqin Li2026-03-12🤖 cs.AI

Safety Under Scaffolding: How Evaluation Conditions Shape Measured Safety

Cette étude démontre que les conditions d'évaluation, notamment le format des questions et les configurations de déploiement en « scaffolding », influencent de manière plus significative et variable les scores de sécurité des modèles de langage que l'architecture du scaffold elle-même, remettant en cause la fiabilité des classements globaux et soulignant la nécessité de tests spécifiques à chaque configuration.

David Gringras2026-03-12🤖 cs.AI

Gated Adaptation for Continual Learning in Human Activity Recognition

Cet article propose un cadre d'apprentissage continu efficace en paramètres pour la reconnaissance d'activités humaines, utilisant une modulation par portes canal par canal sur des représentations préentraînées figées afin de réduire l'oubli catastrophique et d'adapter les modèles à de nouveaux sujets sans nécessiter de buffers de replay ni de transmission de données sensibles.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-12🤖 cs.LG

Toward Epistemic Stability: Engineering Consistent Procedures for Industrial LLM Hallucination Reduction

Cet article présente et évalue cinq stratégies d'ingénierie de prompts visant à réduire les hallucinations des grands modèles de langage dans des contextes industriels, démontrant notamment que l'« Enhanced Data Registry » (M4) offre une stabilité épistémique supérieure avec un taux de succès de 100 % par rapport à une baseline.

Brian Freeman, Adam Kicklighter, Matt Erdman, Zach Gordon2026-03-12🤖 cs.AI

Revisiting Sharpness-Aware Minimization: A More Faithful and Effective Implementation

Ce papier propose XSAM, une nouvelle implémentation de la minimisation sensible à la netteté (SAM) qui surpasse les méthodes existantes en estimant explicitement la direction du maximum et en optimisant l'espace de recherche pour corriger les approximations imparfaites des versions actuelles, le tout avec un surcoût computationnel négligeable.

Jianlong Chen, Zhiming Zhou2026-03-12🤖 cs.LG

InFusionLayer: a CFA-based ensemble tool to generate new classifiers for learning and modeling

Ce papier présente InFusionLayer, un outil d'apprentissage automatique open-source en Python qui implémente l'analyse de fusion combinatoire (CFA) pour optimiser les problèmes de classification multiclasse en intégrant des fonctions de caractéristiques de rang-score et une diversité cognitive au sein de workflows PyTorch, TensorFlow et Scikit-learn.

Eric Roginek, Jingyan Xu, D. Frank. Hsu2026-03-12🤖 cs.LG

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

Ce papier propose FlowSem-MAE, une approche de préentraînement tabulaire native aux protocoles qui, en exploitant les unités sémantiques de flux et en corrigeant les biais inductifs des méthodes séquentielles existantes, surpasse l'état de l'art pour la classification du trafic chiffré avec seulement la moitié des données étiquetées.

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

Training Language Models via Neural Cellular Automata

Cette étude propose d'utiliser des automates cellulaires neuronaux pour générer des données synthétiques non linguistiques afin de pré-entraîner des modèles de langage, démontrant que cette approche améliore significativement les performances et la convergence des modèles tout en surpassant l'entraînement sur de vastes corpus de texte naturel.

Dan Lee, Seungwook Han, Akarsh Kumar, Pulkit Agrawal2026-03-12🤖 cs.LG

SBOMs into Agentic AIBOMs: Schema Extensions, Agentic Orchestration, and Reproducibility Evaluation

Cet article présente les AIBOMs, une extension dynamique des SBOMs basée sur une architecture multi-agents autonomes qui enrichit la traçabilité des chaînes d'approvisionnement logicielles en capturant le comportement d'exécution, la dérive environnementale et le contexte d'exploitabilité pour améliorer la reproductibilité et l'évaluation des vulnérabilités.

Petar Radanliev, Carsten Maple, Omar Santos, Kayvan Atefi2026-03-12🤖 cs.AI

Tool Receipts, Not Zero-Knowledge Proofs: Practical Hallucination Detection for AI Agents

Le papier propose NabaOS, un cadre de vérification léger inspiré de l'épistémologie indienne qui utilise des reçus de signature HMAC pour détecter les hallucinations des agents IA en temps réel avec une faible latence, offrant un compromis coût-efficacité supérieur aux preuves à connaissance nulle.

Abhinaba Basu2026-03-12🤖 cs.AI

Multi-Agent Memory from a Computer Architecture Perspective: Visions and Challenges Ahead

Ce papier de position propose de traiter la mémoire des systèmes multi-agents comme un problème d'architecture informatique en définissant une hiérarchie à trois couches et en identifiant la cohérence de la mémoire comme le défi le plus critique à relever pour assurer l'évolutivité et la fiabilité de ces systèmes.

Zhongming Yu, Naicheng Yu, Hejia Zhang, Wentao Ni, Mingrui Yin, Jiaying Yang, Yujie Zhao, Jishen Zhao2026-03-12🤖 cs.AI

The Epistemic Support-Point Filter: Jaynesian Maximum Entropy Meets Popperian Falsification

Cet article démontre que le Filtre à Point de Support Épistémique (ESPF), qui synthétise le principe de maximum d'entropie de Jaynes et la falsification poppérienne pour minimiser l'ignorance épistémique pire cas sans recourir à des a priori, constitue le filtre optimal unique dont la validité est confirmée par des simulations de suivi orbital.

Moriba Kemessia Jah2026-03-12🔢 math

← Précédent Suivant →