Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

Cette étude évalue la présence de biais cognitifs humains, notamment l'effet de victime vertueuse et l'effet de halo, dans cinq grands modèles de langage appliqués à l'aide à la décision judiciaire, révélant que bien que ces modèles présentent des variations limitant leur usage immédiat, ils affichent une réduction modeste de ces biais par rapport aux humains, à l'exception notable de l'effet de prestige lié aux credentials.

Sierra S. Liu2026-03-12💻 cs

The science and practice of proportionality in AI risk evaluations

Cet article examine comment le principe de proportionnalité du droit de l'Union européenne peut guider le développement de méthodes scientifiques pour évaluer les risques systémiques des modèles d'IA générative, afin d'équilibrer une régulation efficace et l'innovation technique.

Carlos Mougan, Lauritz Morlock, Jair Aguirre, James R. M. Black, Jan Brauner, Simeon Campos, Sunishchal Dev, David Fernández Llorca, Alberto Franzin, Mario Fritz, Emilia Gómez, Friederike Grosse-Holz, Eloise Hamilton, Max Hasin, Jose Hernandez-Orallo, Dan Lahav, Luca Massarelli, Vasilios Mavroudis, Malcolm Murray, Patricia Paskov, Jaime Raldua, Wout Schellaert2026-03-12💻 cs

Prompts and Prayers: the Rise of GPTheology

Cet article examine l'émergence de la « GPThéologie », un phénomène techno-religieux où l'intelligence artificielle est perçue comme divine, en analysant comment les interactions quotidiennes avec les modèles de langage et les récits communautaires recréent des structures religieuses traditionnelles tout en soulevant des enjeux éthiques et sociétaux majeurs.

Ioana Cheres, Adrian Groza, Ioana Moldovan, Mick O'Hara, Connell Vaughan2026-03-12💻 cs

A Review of the Negative Effects of Digital Technology on Cognition

Cette revue intégrative de plus de 500 études synthétise les risques cognitifs liés aux technologies numériques, mettant en évidence un paradoxe d'efficacité-atrophie où l'optimisation à court terme des tâches pourrait entraîner une érosion à long terme des capacités cognitives supérieures, tout en soulignant le besoin urgent d'études longitudinales.

Urška Žnidarič, Erik Štrumbelj, Octavian Machidon2026-03-12💻 cs

Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

Cet article propose un cadre d'évaluation théorique des grands modèles de langage basé sur l'équilibre de réponse quantale, permettant de mesurer leur sophistication stratégique sur une échelle continue calibrée sur des données humaines et révélant à la fois la validité de cette approche et sa sensibilité aux variations de formulation des prompts.

Mateo Pechon-Elkins, Jon Chun2026-03-12💻 cs

Tureis: Transformer-based Unified Resilience for IoT Devices in Smart Homes

Le papier présente Tureis, une méthode auto-supervisée basée sur un Transformer léger qui détecte et localise avec précision les défaillances de capteurs dans les maisons intelligentes, même dans des scénarios multi-défaillances et multi-résidents, sans nécessiter de données étiquetées tout en restant adaptée au déploiement sur des périphériques à ressources limitées.

Alireza Borhani, Vafa Andalibi, Bahar Asgari2026-03-12💻 cs

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

Cette étude évalue la capacité de généralisation d'agents cyberattaquants autonomes face à des réaffectations d'adresses IP inattendues, révélant que bien que les agents basés sur les grands modèles de langage obtiennent les meilleurs résultats sur des scénarios non vus, ils le font au prix d'une complexité computationnelle accrue et de défaillances pratiques telles que des boucles d'actions invalides.

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian Garcia2026-03-12💻 cs

OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies

Le papier présente OMNIGUIDE, un cadre universel qui améliore les performances des politiques robotiques généralistes sur des tâches complexes en intégrant diverses sources de guidance sous forme de fonctions énergétiques différentiables qui guident l'exploration des actions dans l'espace 3D.

Yunzhou Song, Long Le, Yong-Hyun Park, Jie Wang, Junyao Shi, Lingjie Liu, Jiatao Gu, Eric Eaton, Dinesh Jayaraman, Kostas Daniilidis2026-03-12💻 cs

Model-Free Co-Optimization of Manufacturable Sensor Layouts and Deformation Proprioception

Cet article présente une méthode d'optimisation conjointe sans modèle qui détermine automatiquement la disposition optimale de capteurs flexibles et les paramètres d'un réseau de prédiction de forme pour améliorer la proprioception des déformations libres dans la robotique douce et les dispositifs portables.

Yingjun Tian, Guoxin Fang, Aoran Lyu, Xilong Wang, Zikang Shi, Yuhu Guo, Weiming Wang, Charlie C. L. Wang2026-03-12💻 cs

Decision-Aware Uncertainty Evaluation of Vision-Language Model-Based Early Action Anticipation for Human-Robot Interaction

Cet article présente la première évaluation systématique de l'incertitude des modèles vision-langage pour l'anticipation précoce des actions humaines en interaction homme-robot, introduisant un protocole d'évaluation et des métriques pour garantir la fiabilité des prédictions dans des conditions d'observation partielle.

Zhaoda Du, Michael Bowman, Qiaojie Zheng, Xiaoli Zhang2026-03-12💻 cs

Building Privacy-and-Security-Focused Federated Learning Infrastructure for Global Multi-Centre Healthcare Research

Cet article présente FLA³, une plateforme d'apprentissage fédéré intégrant des mécanismes de gouvernance stricts (authentification, autorisation et comptabilité) pour permettre des recherches cliniques collaboratives transfrontalières tout en garantissant la confidentialité des données et la conformité réglementaire.

Fan Zhang, Daniel Kreuter, Javier Fernandez-Marques, BloodCounts Consortium, Gregory Verghese, Bernard Butler, Nicholas Lane, Suthesh Sivapalaratnam, Joseph Taylor, Norbert C. J. de Wit, Nicholas S. Gleadall, Carola-Bibiane Schönlieb, Michael Roberts2026-03-12💻 cs

Pooling Engram Conditional Memory in Large Language Models using CXL

Ce papier propose d'utiliser un pool de mémoire CXL pour stocker la mémoire conditionnelle des engrammes dans les grands modèles de langage, offrant une solution de stockage évolutive et rentable qui maintient des performances d'inférence proches de celles de la DRAM grâce à l'intégration dans SGLang.

Ruiyang Ma, Teng Ma, Zhiyuan Su, Hantian Zha, Xinpeng Zhao, Xuchun Shang, Xingrui Yi, Zheng Liu, Zhu Cao, An Wu, Zhichong Dou, Ziqian Liu, Daikang Kuang, Guojie Luo2026-03-12💻 cs