Badacze z arXiv kwestionują teorię płaskich minimów w optymalizacji sieci neuronowych, sugerując że mogą być artefaktem stosowanych metryk. Płaskie minima długo uważano za wyjaśnienie dla lepszej generalizacji modeli, ale nowe analizy pokazują że pojęcie to może być bardziej złożone niż dotychczas sądzono. Odkrycie to wpływa na nasze zrozumienie trenowania modeli i może zmienić podejście do projektowania algorytmów optymalizacji w deep learningu.