Nowa metoda kompresji modeli Transformer, która identyfikuje i chroni krytyczne warstwy podczas redukcji rozmiaru modelu, zachowując wysoką wydajność przy mniejszej liczbie parametrów.