GATech at AbjadGenEval Shared Task: Multilingual Embeddings for Arabic Machine-Generated Text Classification

L'équipe GATech a participé à la tâche partagée AbjadGenEval en démontrant que, pour la détection de textes arabes générés par IA, un simple pooling moyen appliqué à un encodeur multilingue E5-large surpasse des stratégies de regroupement complexes et révèle que les textes humains sont significativement plus longs que ceux générés par des machines.

Ahmed Khaled Khamis2026-03-12💬 cs.CL

Personalized Group Relative Policy Optimization for Heterogenous Preference Alignment

Ce papier propose P-GRPO, une nouvelle méthode d'alignement qui améliore l'adaptation aux préférences individuelles hétérogènes des grands modèles de langage en découplant l'estimation des avantages des statistiques de lot immédiates pour éviter les biais vers les préférences dominantes.

Jialu Wang, Heinrich Peters, Asad A. Butt, Navid Hashemi, Alireza Hashemi, Pouya M. Ghari, Joseph Hoover, James Rae, Morteza Dehghani2026-03-12🤖 cs.LG

LWM-Temporal: Sparse Spatio-Temporal Attention for Wireless Channel Representation Learning

LWM-Temporal est un modèle fondamental auto-supervisé pour les canaux sans fil qui utilise une attention spatio-temporelle parcimonieuse alignée sur la propagation physique pour apprendre des représentations universelles et transférables, surpassant les méthodes existantes en prédiction de canal, notamment sur de longues horizons et avec peu de données d'ajustement.

Sadjad Alikhani, Akshay Malhotra, Shahab Hamidi-Rad, Ahmed Alkhateeb2026-03-12🤖 cs.LG

Tureis: Transformer-based Unified Resilience for IoT Devices in Smart Homes

Le papier présente Tureis, une méthode auto-supervisée basée sur un Transformer léger qui détecte et localise avec précision les défaillances de capteurs dans les maisons intelligentes, même dans des scénarios multi-défaillances et multi-résidents, sans nécessiter de données étiquetées tout en restant adaptée au déploiement sur des périphériques à ressources limitées.

Alireza Borhani, Vafa Andalibi, Bahar Asgari2026-03-12💻 cs

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

Cette étude évalue la capacité de généralisation d'agents cyberattaquants autonomes face à des réaffectations d'adresses IP inattendues, révélant que bien que les agents basés sur les grands modèles de langage obtiennent les meilleurs résultats sur des scénarios non vus, ils le font au prix d'une complexité computationnelle accrue et de défaillances pratiques telles que des boucles d'actions invalides.

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian Garcia2026-03-12💻 cs

Safety Under Scaffolding: How Evaluation Conditions Shape Measured Safety

Cette étude démontre que les conditions d'évaluation, notamment le format des questions et les configurations de déploiement en « scaffolding », influencent de manière plus significative et variable les scores de sécurité des modèles de langage que l'architecture du scaffold elle-même, remettant en cause la fiabilité des classements globaux et soulignant la nécessité de tests spécifiques à chaque configuration.

David Gringras2026-03-12🤖 cs.AI

Gated Adaptation for Continual Learning in Human Activity Recognition

Cet article propose un cadre d'apprentissage continu efficace en paramètres pour la reconnaissance d'activités humaines, utilisant une modulation par portes canal par canal sur des représentations préentraînées figées afin de réduire l'oubli catastrophique et d'adapter les modèles à de nouveaux sujets sans nécessiter de buffers de replay ni de transmission de données sensibles.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-12🤖 cs.LG

InFusionLayer: a CFA-based ensemble tool to generate new classifiers for learning and modeling

Ce papier présente InFusionLayer, un outil d'apprentissage automatique open-source en Python qui implémente l'analyse de fusion combinatoire (CFA) pour optimiser les problèmes de classification multiclasse en intégrant des fonctions de caractéristiques de rang-score et une diversité cognitive au sein de workflows PyTorch, TensorFlow et Scikit-learn.

Eric Roginek, Jingyan Xu, D. Frank. Hsu2026-03-12🤖 cs.LG

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

Ce papier propose FlowSem-MAE, une approche de préentraînement tabulaire native aux protocoles qui, en exploitant les unités sémantiques de flux et en corrigeant les biais inductifs des méthodes séquentielles existantes, surpasse l'état de l'art pour la classification du trafic chiffré avec seulement la moitié des données étiquetées.

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies

Le papier présente OMNIGUIDE, un cadre universel qui améliore les performances des politiques robotiques généralistes sur des tâches complexes en intégrant diverses sources de guidance sous forme de fonctions énergétiques différentiables qui guident l'exploration des actions dans l'espace 3D.

Yunzhou Song, Long Le, Yong-Hyun Park, Jie Wang, Junyao Shi, Lingjie Liu, Jiatao Gu, Eric Eaton, Dinesh Jayaraman, Kostas Daniilidis2026-03-12💻 cs

Cluster-Aware Attention-Based Deep Reinforcement Learning for Pickup and Delivery Problems

Cet article propose CAADRL, une méthode d'apprentissage par renforcement profond qui exploite la structure en grappes des problèmes de ramassage et de livraison via un codage attentionnel hiérarchique et un décodage dual dynamique, permettant d'obtenir des performances compétitives avec une inférence plus rapide que les approches collaboratives existantes.

Wentao Wang, Lifeng Han, Guangyu Zou2026-03-12🤖 cs.LG

Quantization of Ricci Curvature in Information Geometry

Cet article résout une conjecture de vingt ans en démontrant que la courbure de Ricci moyennée dans les réseaux bayésiens binaires est quantifiée pour les structures arborescentes et complètes, mais réfutée dans le cas général par des contre-exemples cycliques, tout en établissant une dichotomie de signe entre la courbure positive des réseaux discrets et la courbure négative des réseaux gaussiens.

Carlos C. Rodriguez2026-03-12🔢 math

Improving Search Agent with One Line of Code

Ce papier présente SAPO, une méthode de simple mise en œuvre (une seule ligne de code) qui stabilise l'apprentissage par renforcement des agents de recherche en corrigeant la dérive de distribution d'échantillonnage d'importance via une contrainte KL conditionnelle, permettant ainsi d'améliorer significativement les performances par rapport à l'algorithme GRPO.

Jian Li, Dongsheng Chen, Zhenhua Xu, Yizhang Jin, Jiafu Wu, Chengjie Wang, Xiaotong Yuan, Yabiao Wang2026-03-12🤖 cs.LG