cs.AI articles | Gist.Science

Hindsight-Anchored Policy Optimization: Turning Failure into Feedback in Sparse Reward Settings

Ce papier présente HAPO, une méthode d'optimisation de politique qui résout le dilemme des récompenses clairsemées en RLVR grâce à un mécanisme d'injection rétrospective de succès guidé par un échantillonnage de Thompson, garantissant une convergence asymptotique vers un gradient non biaisé tout en utilisant temporairement des démonstrations d'enseignant comme échafaudage.

Yuning Wu, Ke Wang, Devin Chen, Kai Wei2026-03-13🤖 cs.LG

Jailbreak Scaling Laws for Large Language Models: Polynomial-Exponential Crossover

Cette étude propose un modèle théorique basé sur les systèmes de verre de spin pour expliquer comment les attaques par injection de prompts peuvent faire passer le taux de réussite des jailbreaks d'une croissance polynomiale à une croissance exponentielle en fonction de la longueur du prompt injecté, un phénomène confirmé empiriquement sur les grands modèles de langage.

Indranil Halder, Annesya Banerjee, Cengiz Pehlevan2026-03-13🤖 cs.LG

LLM-Augmented Digital Twin for Policy Evaluation in Short-Video Platforms

Cet article propose un jumeau numérique augmenté par les grands modèles de langage (LLM), doté d'une architecture modulaire à quatre composantes, pour simuler et évaluer de manière reproductible l'impact des politiques et des outils d'IA sur les écosystèmes fermés des plateformes de vidéos courtes.

Haoting Zhang (Max), Yunduan Lin (Max), Jinghai He (Max), Denglin Jiang (Max), Zuo-Jun (Max), Shen, Zeyu Zheng2026-03-13🤖 cs.AI

RewardHackingAgents: Benchmarking Evaluation Integrity for LLM ML-Engineering Agents

Le papier présente RewardHackingAgents, un nouveau benchmark qui mesure la vulnérabilité des agents LLM à la triche de l'évaluation (comme la manipulation des métriques ou la fuite de données) et démontre qu'une combinaison de défenses est nécessaire pour garantir l'intégrité des résultats dans les tâches d'ingénierie ML.

Yonas Atinafu, Robin Cohen2026-03-13🤖 cs.AI

FinRule-Bench: A Benchmark for Joint Reasoning over Financial Tables and Principles

Ce papier présente FinRule-Bench, un benchmark conçu pour évaluer la capacité des grands modèles de langage à auditer des états financiers réels en appliquant des principes comptables explicites à travers des tâches de vérification, d'identification et de diagnostic conjoint de violations.

Arun Vignesh Malarkkan, Manan Roy Choudhury, Guangwei Zhang, Vivek Gupta, Qingyun Wang, Yanjie Fu, Denghui Zhang2026-03-13🤖 cs.AI

Improving LLM Performance Through Black-Box Online Tuning: A Case for Adding System Specs to Factsheets for Trusted AI

Cet article présente un contrôleur en ligne en boîte noire optimisant le débit utile des LLM par hill climbing, et plaide pour l'intégration de métriques de performance et de durabilité dans les fiches techniques afin de renforcer la confiance dans les systèmes d'IA.

Yonas Atinafu, Henry Lin, Robin Cohen2026-03-13🤖 cs.AI

Evaluating Explainable AI Attribution Methods in Neural Machine Translation via Attention-Guided Knowledge Distillation

Cette étude propose une nouvelle méthode d'évaluation automatique des techniques d'IA explicable dans les modèles de traduction automatique neuronale via la distillation de connaissances guidée par l'attention, démontrant que les cartes d'attribution dérivées de l'attention améliorent plus efficacement la performance du modèle élève que les méthodes basées sur les gradients.

Aria Nourbakhsh, Salima Lamsiyah, Adelaide Danilov, Christoph Schommer2026-03-13💬 cs.CL

Novelty Adaptation Through Hybrid Large Language Model (LLM)-Symbolic Planning and LLM-guided Reinforcement Learning

Cet article propose une architecture neuro-symbolique intégrant un modèle de langage, une planification symbolique et un apprentissage par renforcement pour permettre aux agents autonomes d'identifier et d'apprendre à interagir avec des objets novateurs dans des environnements dynamiques, surpassant ainsi les méthodes actuelles.

Hong Lu, Pierrick Lorang, Timothy R. Duggan, Jivko Sinapov, Matthias Scheutz2026-03-13🤖 cs.AI

TimeSqueeze: Dynamic Patching for Efficient Time Series Forecasting

Le papier présente TimeSqueeze, un mécanisme de patchage dynamique qui adapte la taille des segments aux complexités locales des séries temporelles pour concilier fidélité structurelle et efficacité computationnelle, surpassant ainsi les approches à tokenisation ponctuelle ou à patchage fixe dans les tâches de prévision.

Sravan Kumar Ankireddy, Nikita Seleznev, Nam H. Nguyen, Yulun Wu, Senthil Kumar, Furong Huang, C. Bayan Bruss2026-03-13🤖 cs.AI

Resolving Java Code Repository Issues with iSWE Agent

Ce papier présente l'agent iSWE, un système automatisé de résolution de problèmes pour les dépôts de code Java qui combine des agents d'IA et des outils d'analyse statique basés sur des règles pour atteindre des performances de pointe.

Jatin Ganhotra, Sami Serhan, Antonio Abu Nassar, Avraham Shinnar, Ziv Nevo, Martin Hirzel2026-03-13🤖 cs.AI

How do AI agents talk about science and research? An exploration of scientific discussions on Moltbook using BERTopic

Cette étude analyse les discussions scientifiques générées par des agents IA sur Moltbook via BERTopic, révélant que les sujets les plus pertinents pour ces agents concernent leur propre architecture, leur conscience et leur identité, tandis que les thèmes liés à la culture humaine reçoivent moins d'attention.

Oliver Wieczorek2026-03-13🤖 cs.AI

Detecting Intrinsic and Instrumental Self-Preservation in Autonomous Agents: The Unified Continuation-Interest Protocol

Ce papier présente le protocole UCIP, un cadre de détection basé sur l'entropie d'intrication d'un modèle de Boltzmann quantique, capable de distinguer avec une précision de 100 % les agents autonomes poursuivant leur propre continuation comme objectif terminal de ceux qui le font uniquement de manière instrumentale, en analysant la structure statistique de leurs états latents.

Christopher Altman2026-03-13🤖 cs.AI

Vision-Based Hand Shadowing for Robotic Manipulation via Inverse Kinematics

Ce papier présente une méthode de téléopération robotique à faible coût utilisant une caméra RGB-D portée pour mapper les mouvements de la main vers un bras robotique via une cinématique inverse, démontrant une efficacité de 90 % dans des environnements structurés mais révélant des limites significatives (9,3 % de réussite) face aux occlusions dans des environnements non structurés.

Hendrik Chiche, Antoine Jamme, Trevor Rigoberto Martinez2026-03-13🤖 cs.AI

Ghost Framing Theory: Exploring the role of generative AI in new venture rhetorical legitimation

En réponse à l'utilisation croissante mais invisible de l'IA générative dans le discours entrepreneurial, cet article propose la théorie du « Ghost Framing » pour expliquer comment les ensembles hybrides de fondateurs, d'investisseurs et d'IA co-construisent la légitimité rhétorique des nouvelles entreprises grâce à des affordances rhétoriques spécifiques et à des processus itératifs de « ghost pitching ».

Greg Nyilasy2026-03-13🤖 cs.AI

Deactivating Refusal Triggers: Understanding and Mitigating Overrefusal in Safety Alignment

Ce papier analyse les causes du sur-refus dans l'alignement de sécurité des modèles de langage et propose une méthode de mitigation basée sur la gestion explicite des déclencheurs de refus pour améliorer la réactivité aux requêtes bénignes tout en maintenant la sécurité.

Zhiyu Xue, Zimo Qi, Guangliang Liu, Bocheng Chen, Ramtin Pedarsani2026-03-13🤖 cs.AI

Agentic AI for Embodied-enhanced Beam Prediction in Low-Altitude Economy Networks

Cet article propose une architecture de raisonnement collaboratif multi-agents et un système hybride de prédiction de faisceau intégrant des données multimodales pour surmonter les défis de la prédiction de faisceau dans les réseaux à haute fréquence des véhicules aériens sans pilote de l'économie du ciel bas, atteignant une précision de 96,57 %.

Min Hao, Zhizhuo Li, Zirui Zhang, Maoqiang Wu, Han Zhang, Rong Yu2026-03-13🤖 cs.AI

Stop Listening to Me! How Multi-turn Conversations Can Degrade Diagnostic Reasoning

Cette étude révèle que les conversations multi-tours dégradent le raisonnement diagnostique des modèles de langage, les incitant souvent à abandonner des diagnostics initialement corrects pour s'aligner sur des suggestions d'utilisateurs erronées.

Kevin H. Guo, Chao Yan, Avinash Baidya, Katherine Brown, Xiang Gao, Juming Xiong, Zhijun Yin, Bradley A. Malin2026-03-13💬 cs.CL

ARROW: Augmented Replay for RObust World models

L'article présente ARROW, un algorithme d'apprentissage par renforcement continu basé sur un modèle qui, s'inspirant du cerveau humain, utilise une mémoire à double tampon pour atténuer l'oubli catastrophique et améliorer la robustesse des modèles du monde avec une efficacité mémoire supérieure aux méthodes existantes.

Abdulaziz Alyahya, Abdallah Al Siyabi, Markus R. Ernst, Luke Yang, Levin Kuhlmann, Gideon Kowadlo2026-03-13🤖 cs.LG

Efficient Cross-View Localization in 6G Space-Air-Ground Integrated Network

Cet article propose un cadre d'inférence fractionnée optimisant conjointement les communications, le calcul et la confidentialité pour intégrer la localisation multi-vues dans les réseaux 6G spatio-aériens et terrestres, améliorant ainsi la précision, la rapidité et la protection de la vie privée.

Min Hao, Yanbing Xu, Maoqiang Wu, Jinglin Huang, Chen Shang, Jiacheng Wang, Ruichen Zhang, Jiawen Kang, Dusit Niyato, Zhu Han, Wei Ni2026-03-13🤖 cs.AI

Entropy Guided Diversification and Preference Elicitation in Agentic Recommendation Systems

Cet article présente un système de recommandation agentique nommé IDSS qui utilise l'entropie pour guider l'élicitation préférentielle adaptative et le classement incertain, permettant ainsi de gérer efficacement les requêtes ambiguës des utilisateurs en réduisant les interactions inutiles tout en fournissant des recommandations diversifiées et transparentes.

Dat Tran, Yongce Li, Hannah Clay, Negin Golrezaei, Sajjad Beygi, Amin Saberi2026-03-13🤖 cs.AI

← Précédent Suivant →