Badawczy artykuł przedstawiający metodę umożliwiającą osiągnięcie różnych prędkości inference'u z jednego checkpointa modelu. Technika pozwala na elastyczne dostosowanie szybkości przetwarzania bez ko