Modulation of feature attention by reward prediction error explains value learning behavior
En s'appuyant sur des données comportementales de macaques et des analyses neuronales, cette étude démontre que l'apprentissage de la valeur chez les primates est optimisé par un mécanisme d'attention « à bascule » où les erreurs de prédiction négatives inversent temporairement le focus attentionnel, favorisant ainsi une adaptation rapide aux changements environnementaux au détriment d'une précision asymptotique.