VibeThinker-3B: model rozumowania 3B na bazie Qwen2.5-Coder z nową metodą treningu

VibeThinker-3B to nowy model rozumowania o 3 miliardach parametrów, który osiąga wyniki porównywalne z większymi i bardziej zaawansowanymi modelami DeepSeek V3.2 i Kimi K2.5 w benchmark testach. Model licencjonowany jest na warunkach MIT, co oznacza pełną otwartość i możliwość komercyjnego wykorzystania.

Model powstał w wyniku dostrojenia Qwen2.5-Coder-3B, modelu bazowego ze zoptymalizowaną architekturą dla zadań programistycznych. Kluczową innowacją jest zastosowanie nowego podejścia treningowego zwanego Spectrum-to-Signal Post-Training Pipeline, które pozwala wydajnie szkolić małe modele w zdolności głębokich rozumowań logicznych i złożonych obliczeń.

Znaczenie tej pracy leży w demokracji dostępu do zaawansowanych zdolności AI. Dotychczas modele z najlepszymi możliwościami rozumowania były duże i wymagające, co ograniczało ich praktyczne zastosowanie na urządzeniach brzegowych czy w środowiskach z ograniczonymi zasobami. VibeThinker-3B pokazuje, że kompaktowe modele mogą konkurować z czołowymi rozwiązaniami, otwierając drzwi dla szerszej adopcji zaawansowanej sztucznej inteligencji w aplikacjach komercyjnych i badawczych.