Naukowcy zaprezentowali nową metodę łączącą sieci neuronowe z symbolicznym AI dla autonomicznych pojazdów. Zamiast trenować modele VLA (Vision Language Action) na wyjaśnieniach wygenerowanych a posteriori, używają wewnętrznych śladów decyzyjnych z reguł opartych plannerów - systemów, które już funkcjonują jako wykonywalne silniki rozumowania w symulacjach. Te ślady są bezpośrednio powiązane ze stanami planera, które determinują akcję pojazdu.

Klucz do podejścia tkwi w obserwacji, że klasyczne planery symboliczne już robią to, co potrzebne: rozumują o ograniczeniach bezpieczeństwa, przeszukują kandydatów na manewry i wybierają ostateczną trajektorię. Zespół instrumentalizował te planery, aby przechwytywać zarówno wykonane trajektorie, jak i wewnętrzne ślady decyzji na każdym kroku oceny reguł. Każdy ślad został znormalizowany w strukturalne rozumowanie oparte na regułach i sparowany z trajektorią do fine-tuningu modelu Qwen3.5-4B jako driving VLA.

Wyniki są imponujące. Na benchmarku wygenerowanym w symulatorze detalne rozumowanie oparte na regułach zmniejszyło średni błąd dystansu (ADE@3s) z 0,47 do 0,26 metra i wskaźnik nieudanych manewrów z 8,3% do 6,4% w warunkach percepcji z trzema kamerami. Podejście zapewnia, że rozumowanie jest strukturalnie powiązane z generacją ruchu przez konstrukcję, a nie przez wyrównanie post-hoc. To znacząca poprawa dla bezpieczeństwa i niezawodności autonomicznych systemów jazdy.