cs.LG articles | Gist.Science

GATech at AbjadGenEval Shared Task: Multilingual Embeddings for Arabic Machine-Generated Text Classification

L'équipe GATech a participé à la tâche partagée AbjadGenEval en démontrant que, pour la détection de textes arabes générés par IA, un simple pooling moyen appliqué à un encodeur multilingue E5-large surpasse des stratégies de regroupement complexes et révèle que les textes humains sont significativement plus longs que ceux générés par des machines.

Ahmed Khaled Khamis2026-03-12💬 cs.CL

GATech at AbjadMed: Bidirectional Encoders vs. Causal Decoders: Insights from 82-Class Arabic Medical Classification

Cette étude démontre que les encodeurs bidirectionnels spécialisés, tels qu'AraBERTv2, surpassent les décodeurs causaux pour la classification précise de textes médicaux arabes en 82 catégories, grâce à une meilleure capture du contexte global malgré les déséquilibres et le bruit des données.

Ahmed Khaled Khamis2026-03-12💬 cs.CL

Personalized Group Relative Policy Optimization for Heterogenous Preference Alignment

Ce papier propose P-GRPO, une nouvelle méthode d'alignement qui améliore l'adaptation aux préférences individuelles hétérogènes des grands modèles de langage en découplant l'estimation des avantages des statistiques de lot immédiates pour éviter les biais vers les préférences dominantes.

Jialu Wang, Heinrich Peters, Asad A. Butt, Navid Hashemi, Alireza Hashemi, Pouya M. Ghari, Joseph Hoover, James Rae, Morteza Dehghani2026-03-12🤖 cs.LG

Defining AI Models and AI Systems: A Framework to Resolve the Boundary Problem

Cet article propose un cadre conceptuel et opérationnel pour définir clairement la distinction entre les modèles et les systèmes d'IA, afin de résoudre les ambiguïtés réglementaires et d'attribuer avec précision les responsabilités le long de la chaîne de valeur de l'IA.

Yuanyuan Sun, Timothy Parker, Lara Gierschmann, Sana Shams, Teo Canmetin, Mathieu Duteil, Rokas Gipiškis, Ze Shen Chin2026-03-12🤖 cs.AI

LWM-Temporal: Sparse Spatio-Temporal Attention for Wireless Channel Representation Learning

LWM-Temporal est un modèle fondamental auto-supervisé pour les canaux sans fil qui utilise une attention spatio-temporelle parcimonieuse alignée sur la propagation physique pour apprendre des représentations universelles et transférables, surpassant les méthodes existantes en prédiction de canal, notamment sur de longues horizons et avec peu de données d'ajustement.

Sadjad Alikhani, Akshay Malhotra, Shahab Hamidi-Rad, Ahmed Alkhateeb2026-03-12🤖 cs.LG

HTM-EAR: Importance-Preserving Tiered Memory with Hybrid Routing under Saturation

Ce papier présente HTM-EAR, un système de mémoire hiérarchique intégrant un routage hybride et une éviction basée sur l'importance, qui maintient une haute précision de requête sous saturation tout en permettant un oubli contrôlé des données obsolètes.

Shubham Kumar Singh2026-03-12🤖 cs.AI

Tureis: Transformer-based Unified Resilience for IoT Devices in Smart Homes

Le papier présente Tureis, une méthode auto-supervisée basée sur un Transformer léger qui détecte et localise avec précision les défaillances de capteurs dans les maisons intelligentes, même dans des scénarios multi-défaillances et multi-résidents, sans nécessiter de données étiquetées tout en restant adaptée au déploiement sur des périphériques à ressources limitées.

Alireza Borhani, Vafa Andalibi, Bahar Asgari2026-03-12💻 cs

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

Cette étude évalue la capacité de généralisation d'agents cyberattaquants autonomes face à des réaffectations d'adresses IP inattendues, révélant que bien que les agents basés sur les grands modèles de langage obtiennent les meilleurs résultats sur des scénarios non vus, ils le font au prix d'une complexité computationnelle accrue et de défaillances pratiques telles que des boucles d'actions invalides.

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian Garcia2026-03-12💻 cs

Safety Under Scaffolding: How Evaluation Conditions Shape Measured Safety

Cette étude démontre que les conditions d'évaluation, notamment le format des questions et les configurations de déploiement en « scaffolding », influencent de manière plus significative et variable les scores de sécurité des modèles de langage que l'architecture du scaffold elle-même, remettant en cause la fiabilité des classements globaux et soulignant la nécessité de tests spécifiques à chaque configuration.

David Gringras2026-03-12🤖 cs.AI

Gated Adaptation for Continual Learning in Human Activity Recognition

Cet article propose un cadre d'apprentissage continu efficace en paramètres pour la reconnaissance d'activités humaines, utilisant une modulation par portes canal par canal sur des représentations préentraînées figées afin de réduire l'oubli catastrophique et d'adapter les modèles à de nouveaux sujets sans nécessiter de buffers de replay ni de transmission de données sensibles.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-12🤖 cs.LG

Revisiting Sharpness-Aware Minimization: A More Faithful and Effective Implementation

Ce papier propose XSAM, une nouvelle implémentation de la minimisation sensible à la netteté (SAM) qui surpasse les méthodes existantes en estimant explicitement la direction du maximum et en optimisant l'espace de recherche pour corriger les approximations imparfaites des versions actuelles, le tout avec un surcoût computationnel négligeable.

Jianlong Chen, Zhiming Zhou2026-03-12🤖 cs.LG

InFusionLayer: a CFA-based ensemble tool to generate new classifiers for learning and modeling

Ce papier présente InFusionLayer, un outil d'apprentissage automatique open-source en Python qui implémente l'analyse de fusion combinatoire (CFA) pour optimiser les problèmes de classification multiclasse en intégrant des fonctions de caractéristiques de rang-score et une diversité cognitive au sein de workflows PyTorch, TensorFlow et Scikit-learn.

Eric Roginek, Jingyan Xu, D. Frank. Hsu2026-03-12🤖 cs.LG

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

Ce papier propose FlowSem-MAE, une approche de préentraînement tabulaire native aux protocoles qui, en exploitant les unités sémantiques de flux et en corrigeant les biais inductifs des méthodes séquentielles existantes, surpasse l'état de l'art pour la classification du trafic chiffré avec seulement la moitié des données étiquetées.

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies

Le papier présente OMNIGUIDE, un cadre universel qui améliore les performances des politiques robotiques généralistes sur des tâches complexes en intégrant diverses sources de guidance sous forme de fonctions énergétiques différentiables qui guident l'exploration des actions dans l'espace 3D.

Yunzhou Song, Long Le, Yong-Hyun Park, Jie Wang, Junyao Shi, Lingjie Liu, Jiatao Gu, Eric Eaton, Dinesh Jayaraman, Kostas Daniilidis2026-03-12💻 cs

Cluster-Aware Attention-Based Deep Reinforcement Learning for Pickup and Delivery Problems

Cet article propose CAADRL, une méthode d'apprentissage par renforcement profond qui exploite la structure en grappes des problèmes de ramassage et de livraison via un codage attentionnel hiérarchique et un décodage dual dynamique, permettant d'obtenir des performances compétitives avec une inférence plus rapide que les approches collaboratives existantes.

Wentao Wang, Lifeng Han, Guangyu Zou2026-03-12🤖 cs.LG

Quantization of Ricci Curvature in Information Geometry

Cet article résout une conjecture de vingt ans en démontrant que la courbure de Ricci moyennée dans les réseaux bayésiens binaires est quantifiée pour les structures arborescentes et complètes, mais réfutée dans le cas général par des contre-exemples cycliques, tout en établissant une dichotomie de signe entre la courbure positive des réseaux discrets et la courbure négative des réseaux gaussiens.

Carlos C. Rodriguez2026-03-12🔢 math

Training Language Models via Neural Cellular Automata

Cette étude propose d'utiliser des automates cellulaires neuronaux pour générer des données synthétiques non linguistiques afin de pré-entraîner des modèles de langage, démontrant que cette approche améliore significativement les performances et la convergence des modèles tout en surpassant l'entraînement sur de vastes corpus de texte naturel.

Dan Lee, Seungwook Han, Akarsh Kumar, Pulkit Agrawal2026-03-12🤖 cs.LG

HTMuon: Improving Muon via Heavy-Tailed Spectral Correction

Cet article présente HTMuon, une méthode d'optimisation qui améliore l'algorithme Muon en introduisant une correction spectrale à queues lourdes pour générer des mises à jour plus robustes et réduire la perplexité lors de l'entraînement de modèles de langage, tout en offrant une garantie théorique de convergence.

Tianyu Pang, Yujie Fang, Zihang Liu, Shenyang Deng, Lei Hsiung, Shuhua Yu, Yaoqing Yang2026-03-12🤖 cs.LG

Improving Search Agent with One Line of Code

Ce papier présente SAPO, une méthode de simple mise en œuvre (une seule ligne de code) qui stabilise l'apprentissage par renforcement des agents de recherche en corrigeant la dérive de distribution d'échantillonnage d'importance via une contrainte KL conditionnelle, permettant ainsi d'améliorer significativement les performances par rapport à l'algorithme GRPO.

Jian Li, Dongsheng Chen, Zhenhua Xu, Yizhang Jin, Jiafu Wu, Chengjie Wang, Xiaotong Yuan, Yabiao Wang2026-03-12🤖 cs.LG

Dissecting Chronos: Sparse Autoencoders Reveal Causal Feature Hierarchies in Time Series Foundation Models

Cette étude présente la première application d'autoencodeurs clairsemés au modèle Chronos-T5, révélant une hiérarchie causale où les couches intermédiaires, et non la dernière, sont essentielles à la détection des changements abrupts pour des prévisions temporelles fiables.

Anurag Mishra2026-03-12🤖 cs.LG

← Précédent Suivant →