SALSA: Efektywna jednoprzepustowa detekcja kodu generowanego przez AI

Zespół Dream opracował metodę SALSA (Single-pass Autoregressive LLM Structured Classification) do detekcji kodu wygenerowanego przez modele języka w ramach konkursu SemEval-2026 Task 13. Rozwiązanie mapuje każdą klasę na dedykowany token wyjściowy, pozwalając modelowi emitować etykietę jedno-tokenową w ustrukturyzowanej odpowiedzi, zamiast polegać na ręcznie wytworzonych cechach czy regułach decyzyjnych.

Wykrywanie kodu generowanego przez AI stało się krytyczną kwestią w dobie transformacji technologicznej dokonanej przez LLM - podnosi to pytania o autentyczność, integralność oceny i wiarygodność oprogramowania. Zadanie SemEval-2026 Subtask A koncentruje się szczególnie na generalizacji out-of-distribution (OOD), czyli zdolności modelu do działania na nieznanych językach programowania i w nieznanych domenach aplikacyjnych - to znacznie trudniejszy scenariusz niż zwykłe testowanie na danych z tego samego rozkładu.

Team Dream zastosował kombinację strategii: zrównoważone próbkowanie danych dla różnych języków, parameter-efficient fine-tuning oraz konserwatywny trening (niska learning rate, jeden epoch) aby uniknąć przeuczenia się na konkretnej domenie treningowej. Ich najlepszy system uzyskał F1 0,789 na oficjalnej tablicy wyników - dla porównania, baseline CodeBERT osiągnął zaledwie F1 0,305, co pokazuje znaczną przewagę podejścia SALSA w zdolności do generalizacji na nowe dane.