cs.AI articles | Gist.Science

Enhancing Network Intrusion Detection Systems: A Multi-Layer Ensemble Approach to Mitigate Adversarial Attacks

Cet article propose une nouvelle approche de défense en couches combinant des classificateurs empilés et un autoencodeur, renforcée par un entraînement adversarial, pour améliorer la robustesse des systèmes de détection d'intrusion réseau face aux attaques générées par GAN et FGSM.

Nasim Soltani, Shayan Nejadshamsi, Zakaria Abou El Houda, Raphael Khoury, Kelton A. P. Costa, Tiago H. Falk, Anderson R. Avila2026-03-12🤖 cs.AI

Domain-Adaptive Health Indicator Learning with Degradation-Stage Synchronized Sampling and Cross-Domain Autoencoder

Cet article propose un cadre d'apprentissage adaptatif aux domaines pour les indicateurs de santé, intégrant un échantillonnage synchronisé par étapes de dégradation et un autoencodeur à noyaux larges avec mécanismes d'attention croisée, afin de surmonter les décalages de distribution et les limites structurelles des méthodes existantes pour améliorer la surveillance de l'état des machines.

Jungho Choo, Hanbyeol Park, Gawon Lee, Yunkyung Park, Hyerim Bae2026-03-12🤖 cs.LG

The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

Ce papier démontre que la soustraction de la moyenne, une opération simple et efficace, élimine le biais moyen de rang un responsable de l'instabilité numérique dans l'entraînement des grands modèles de langage en faible précision (FP4), permettant ainsi de retrouver la stabilité et les performances du format BF16 sans recourir à des méthodes spectrales coûteuses.

Hengjie Cao, Zhendong Huang, Mengyi Chen, Yifeng Yang, Fanqi Yu, Ruijun Huang, Fang Dong, Xin Zhang, Jixian Zhou, Anrui Chen, Mingzhi Dong, Yujiang Wang, Jinlong Hou, Qin Lv, Yuan Cheng, Tun Lu, Fan Yang, Li Shang2026-03-12🤖 cs.LG

FAR-Dex: Few-shot Data Augmentation and Adaptive Residual Policy Refinement for Dexterous Manipulation

Le papier présente FAR-Dex, un cadre hiérarchique qui combine l'augmentation de données en peu d'exemples et un raffinement adaptatif par résidus pour surmonter le manque de démonstrations et la complexité des espaces d'action, permettant ainsi une coordination robuste et précise bras-main pour la manipulation habile avec des taux de réussite élevés en simulation et dans le monde réel.

Yushan Bai, Fulin Chen, Hongzheng Sun, Yuchuang Tong, En Li, Zhengtao Zhang2026-03-12🤖 cs.AI

UniPINN: A Unified PINN Framework for Multi-task Learning of Diverse Navier-Stokes Equations

Le papier présente UniPINN, un cadre unifié d'apprentissage multi-tâches pour les équations de Navier-Stokes qui surmonte les limitations des méthodes existantes en intégrant une architecture partagée-spécialisée, un mécanisme d'attention inter-flux et une allocation dynamique des poids pour améliorer la précision et la stabilité de l'entraînement.

Dengdi Sun, Jie Chen, Xiao Wang, Jin Tang2026-03-12🤖 cs.AI

G-STAR: End-to-End Global Speaker-Tracking Attributed Recognition

Le papier présente G-STAR, un système de reconnaissance automatique de la parole attribué aux locuteurs de bout en bout qui couple un module de suivi temporel des locuteurs avec un modèle de langage pour assurer une cohérence des identités à l'échelle de la réunion tout en générant des transcriptions étiquetées et horodatées.

Jing Peng, Ziyi Chen, Haoyu Li, Yucheng Wang, Duo Ma, Mengtian Li, Yunfan Du, Dezhu Xu, Kai Yu, Shuai Wang2026-03-12⚡ eess

Modeling Stage-wise Evolution of User Interests for News Recommendation

Cet article propose un cadre unifié pour la recommandation de nouvelles qui modélise l'évolution des intérêts des utilisateurs en combinant une perspective temporelle globale pour les préférences à long terme et une approche locale par étapes avec des mécanismes LSTM et d'attention pour capturer les dynamiques à court terme, surpassant ainsi les méthodes existantes sur des jeux de données réels.

Zhiyong Cheng, Yike Jin, Zhijie Zhang, Huilin Chen, Zhangling Duan, Meng Wang2026-03-12🤖 cs.AI

Aligning Large Language Models with Searcher Preferences

Ce papier présente SearchLLM, le premier grand modèle de langage conçu pour la recherche générative ouverte, qui utilise un système de récompense hiérarchique et une stratégie d'agrégation sélective pour optimiser la qualité des réponses et l'engagement des utilisateurs tout en garantissant la sécurité et la fiabilité, comme le démontrent les tests réussis déployés sur la plateforme RedNote.

Wei Wu, Peilun Zhou, Liyi Chen, Qimeng Wang, Chengqiang Lu, Yan Gao, Yi Wu, Yao Hu, Hui Xiong2026-03-12💬 cs.CL

Learning to Negotiate: Multi-Agent Deliberation for Collective Value Alignment in LLMs

Cet article propose un cadre d'alignement multi-agents basé sur la négociation et l'apprentissage par renforcement (RLAIF) qui permet aux grands modèles de langage de résoudre les conflits de valeurs tout en maintenant un alignement avec l'objectif d'agence collective, sans dégrader leurs capacités linguistiques générales.

Panatchakorn Anantaprayoon, Nataliia Babina, Nima Asgharbeygi, Jad Tarifi2026-03-12💬 cs.CL

JEDI: Jointly Embedded Inference of Neural Dynamics

Ce papier présente JEDI, un modèle hiérarchique qui infère les dynamiques neuronales à travers diverses tâches en apprenant un espace d'embedding partagé sur les poids des réseaux de neurones récurrents, permettant ainsi d'extraire des mécanismes robustes et généralisables à partir de données expérimentales complexes.

Anirudh Jamkhandi, Ali Korojy, Olivier Codol, Guillaume Lajoie, Matthew G. Perich2026-03-12🧬 q-bio

Naïve Exposure of Generative AI Capabilities Undermines Deepfake Detection

Ce papier démontre que l'exposition naïve des capacités de raffinement d'images et de raisonnement des IA génératives commerciales, via des interfaces de chatbot accessibles, compromet fondamentalement les détecteurs de deepfakes les plus avancés en permettant aux utilisateurs non experts de créer des images authentiques et indétectables sans violer les politiques de sécurité.

Sunpill Kim, Chanwoo Hwang, Minsu Kim, Jae Hong Seo2026-03-12🤖 cs.AI

Resource-constrained Amazons chess decision framework integrating large language models and graph attention

Cet article propose un cadre hybride léger intégrant des modèles de langage et des mécanismes d'attention graphique pour surmonter les contraintes de ressources dans le jeu des Amazones, démontrant une amélioration significative de la précision décisionnelle et une capacité à surpasser le modèle de base (GPT-4o-mini) grâce à l'apprentissage à partir de données synthétiques bruitées.

Tianhao Qian, Zhuoxuan Li, Jinde Cao, Xinli Shi, Hanjie Liu, Leszek Rutkowski2026-03-12🤖 cs.AI

IH-Challenge: A Training Dataset to Improve Instruction Hierarchy on Frontier LLMs

Ce papier présente IH-Challenge, un ensemble de données d'apprentissage par renforcement conçu pour améliorer la hiérarchie des instructions des modèles de langage avancés, permettant ainsi de renforcer leur robustesse face aux attaques tout en préservant leur utilité.

Chuan Guo (Michael Pokorny), Juan Felipe Ceron Uribe (Michael Pokorny), Sicheng Zhu (Michael Pokorny), Christopher A. Choquette-Choo (Michael Pokorny), Steph Lin (Michael Pokorny), Nikhil Kandpal (Michael Pokorny), Milad Nasr (Michael Pokorny), Rai (Michael Pokorny), Sam Toyer, Miles Wang, Yaodong Yu, Alex Beutel, Kai Xiao2026-03-12🤖 cs.AI

UAV-MARL: Multi-Agent Reinforcement Learning for Time-Critical and Dynamic Medical Supply Delivery

Cet article présente un cadre d'apprentissage par renforcement multi-agents basé sur l'algorithme PPO pour coordonner efficacement des flottes de drones dans la livraison de fournitures médicales critiques, en optimisant l'allocation des ressources et la priorisation des tâches au sein d'environnements dynamiques et partiellement observables.

Islam Guven, Mehmet Parlak2026-03-12🤖 cs.LG

Prompting with the human-touch: evaluating model-sensitivity of foundation models for musculoskeletal CT segmentation

Cette étude évalue la sensibilité de onze modèles fondationnels promptables à la segmentation CT musculo-squelettique, révélant que leurs performances varient considérablement selon les stratégies d'incitation et les structures anatomiques, et que l'utilisation de prompts humains réels entraîne une baisse de performance par rapport aux résultats obtenus avec des prompts idéaux, rendant le choix du modèle optimal pour un usage clinique humain complexe.

Caroline Magg, Maaike A. ter Wee, Johannes G. G. Dobbe, Geert J. Streekstra, Leendert Blankevoort, Clara I. Sánchez, Hoel Kervadec2026-03-12🤖 cs.AI

SCORE: Replacing Layer Stacking with Contractive Recurrent Depth

Ce papier propose SCORE, une architecture récurrente discrète et contractive qui remplace l'empilement de couches par l'itération d'un bloc neuronal partagé, offrant une convergence accélérée et une réduction des paramètres sans recourir à des solveurs d'équations différentielles.

Guillaume Godin2026-03-12🤖 cs.LG

Towards Cognitive Defect Analysis in Active Infrared Thermography with Vision-Text Cues

Cet article propose un cadre novateur de détection de défauts en zéro-shot pour les polymères renforcés de fibres de carbone en thermographie infrarouge active, utilisant des modèles vision-langage préentraînés adaptés via un connecteur léger pour éliminer le besoin de jeux de données d'entraînement coûteux tout en obtenant des performances de localisation élevées.

Mohammed Salah, Eman Ouda, Giuseppe Dell'Avvocato, Fabrizio Sarasini, Ester D'Accardi, Jorge Dias, Davor Svetinovic, Stefano Sfarra, Yusra Abdulrahman2026-03-12⚡ eess

Adaptive RAN Slicing Control via Reward-Free Self-Finetuning Agents

Cet article propose un cadre novateur d'auto-affinement sans récompense pour les agents génératifs, permettant un contrôle adaptatif continu dans le découpage de réseaux d'accès radio (RAN) en internalisant l'expérience via un mécanisme de réflexion bi-perspective, surpassant ainsi les méthodes d'apprentissage par renforcement traditionnelles en efficacité et en stabilité.

Yuanhao Li, Haozhe Wang, Geyong Min, Nektarios Georgalas, Wang Miao2026-03-12🤖 cs.AI

CUAAudit: Meta-Evaluation of Vision-Language Models as Auditors of Autonomous Computer-Use Agents

Ce papier présente CUAAudit, une méta-évaluation de cinq modèles vision-langage en tant qu'auditeurs autonomes des agents d'utilisation d'ordinateurs, révélant que bien que ces modèles affichent une bonne précision, ils souffrent de limitations significatives dans des environnements complexes et d'un manque de consensus, soulignant ainsi la nécessité de prendre en compte leur fiabilité et leur incertitude pour un déploiement réel.

Marta Sumyk, Oleksandr Kosovan2026-03-12🤖 cs.AI

Does LLM Alignment Really Need Diversity? An Empirical Study of Adapting RLVR Methods for Moral Reasoning

Cette étude empirique démontre que, contrairement à l'hypothèse initiale, l'alignement des modèles de langage sur des tâches de raisonnement moral ne nécessite pas d'algorithmes favorisant la diversité, car les méthodes de maximisation de récompense (RLVR) s'avèrent tout aussi efficaces grâce à une distribution de réponses à haute récompense plus concentrée que dans le raisonnement mathématique.

Zhaowei Zhang, Xiaohan Liu, Xuekai Zhu, Junchao Huang, Ceyao Zhang, Zhiyuan Feng, Yaodong Yang, Xiaoyuan Yi, Xing Xie2026-03-12🤖 cs.AI

← Précédent Suivant →