Nowe badanie wykazuje, że kwantyzacja - technika zmniejszająca rozmiar modeli językowych poprzez redukcję precyzji - prowadzi do pojawienia się uprzedzeń i pogorszenia alignment'u modeli. Problem dotyczy wielu modeli i różnych poziomów precyzji, co stanowi poważne wyzwanie dla wdrażania efektywnych i bezpiecznych dużych modeli. Odkrycie sugeruje, że standardowe procedury optymalizacji modeli mogą nieintencjonalnie podważać wcześniejsze wysiłki wyrównania wartości AI.
Badania
arXiv CS.LG