Correctness is its own reward: bootstrapping error signals in self-guided reinforcement learning
Este estudio propone que la memorización del canto tutor y la evaluación del rendimiento en los pinzones cebra comparten un mismo circuito neuronal que, mediante cancelación predictiva y plasticidad anti-hebbiana, genera señales de error internas capaces de guiar el aprendizaje autónomo mediante refuerzo.