Modulation of feature attention by reward prediction error explains value learning behavior
Questo studio dimostra che l'apprendimento del valore nei macachi è guidato da un meccanismo di attenzione a risorse limitate che inverte temporaneamente il proprio focus in seguito a errori di previsione della ricompensa negativi, spiegando così come i primati sacrificino la precisione asintotica per una rapida adattamento in ambienti volatili.