Badanie wykazuje, że uniwersalne transformery wymagają mechanizmów pamięci do efektywnego rekurencyjnego rozumowania. Autorzy analizują kompromisy między głębokością sieci a stanem podczas adaptacyjny