A Function-Centric Perspective on Flat and Sharp Minima
This paper challenges the conventional view that flat minima inherently ensure better generalization, arguing through extensive empirical studies that sharpness is a function-dependent property — sharper minima often correlate with improved performance, robustness, and calibration when models are properly regularized, though distinguishing task-driven sharpness from memorization-driven sharpness remains an open practical question.
Ao contrário da visão tradicional que equipara agudeza a overfitting, a nova perspectiva sugere que um mínimo agudo pode ser tão estável quanto um mínimo plano, dependendo do contexto. Imagine a diferença entre uma fita elástica e um fio de aço: ambos podem parecer tensos, mas respondem de maneiras distintas à perturbação. Da mesma forma, um modelo pode ocupar um "mínimo agudo" não porque memorizou ruído, mas porque a tarefa exige uma solução precisa e específica. No entanto, é crucial notar um caveat: a agudeza ainda *pode* indicar uma solução memorizada em certos cenários. O ponto central não é que a agudeza seja sempre boa, mas sim que a agudeza, por si só, não é um sinal confiável nem de generalização nem de memorização.
A analogia do cirurgião e da faca de manteiga ilustra bem essa nuance: uma lâmina afiada (aguda) é essencial para uma cirurgia de precisão, enquanto uma faca de manteiga (plana) seria ineficaz, embora ambas sejam "ferramentas". A questão não é se a ferramenta é afiada, mas se ela é a ferramenta certa para o trabalho.
**Takeaway**
* A agudeza nem sempre é um defeito — às vezes, é uma característica essencial.
* A generalização depende da função e do contexto, não apenas da forma do mínimo.
* A robustez pode coexistir com a precisão de uma solução aguda.
Em última análise, separar "agudo porque a tarefa é complexa" de "agudo porque o modelo memorizou" permanece uma questão em aberto na prática. Este trabalho demonstra que a regra antiga é excessivamente simplista, mas não nos entrega uma nova regra definitiva para identificar memorização apenas pela agudeza. O caminho para distinguir entre uma solução afiada e necessária e uma solução afiada e perigosa ainda exige investigação.
Israel Mason-Williams, Gabryel Mason-Williams, Helen Yannakoudakis2026-04-16✓ Author reviewed ⓘ🤖 cs.LG