Badacze zaprezentowali SignMuon, nową metodę optymalizacji dla treningu rozproszonych modeli deep learning. Algorytm zmniejsza koszty komunikacji między węzłami, co jest kluczowym wąskim gardłem w treningu dużych modeli. Innowacja łączy mechanizm sign-based compression z algorytmem Muon, potencjalnie przyspieszając trenowanie przy jednoczesnym zachowaniu zbieżności.