Naprawa skrótów opartych na kształcie w 3D skanowaniu fringowym na duże odległości

Zespół badaczy zaprezentował kompleksowe badanie dotyczące naprawy błędów w sieciach neuronowych stosowanych do profilometrii fringowej na dużych odległościach (powyżej 1 metra). Problem stanowił głównie niedoreprezentowany reżim długovasiłośćopaści, gdzie spadek natężenia zgodny z prawem odwrotnych kwadratów degraduje stosunek sygnału do szumu i pogarsza dokładność pomiarów fizycznych.

Diagnoza problemu wykazała, że standardowe sieci UNet rozwiązywały zadanie poprzez uczenie się przybliżeń kształtu obiektu (shape priors) zamiast rzeczywistego dekodowania informacji fazowej z jednotych obrazów fringowych. Naukowcy użyli trzech niezależnych narzędzi diagnostycznych: linear probing, Grad-CAM i test out-of-distribution płaszczyzny, które zbiegały się na wspólnym wniosku. Bazowa sieć UNet osiągała średni błąd bezwzględny 14,54 mm na syntetycznym benchmarku zawierającym 15 600 obrazów fringowych.

Rozwiązaniem był projekt nowej architektury PhiCalNet, która zmienia fundamentalne podejście: zamiast bezpośrednio przewidywać głębokość, sieć wychodzi fazie owinięta, a następnie zastosowana jest stała warstwa kalibracji wyliczająca fazę na głębokość. Ta zmiana architektoniczna całkowicie usuwa możliwość polegania na przybliżeniach kształtu z przestrzeni hipotez sieci. Badanie pokazało, że tradycyjne podejścia z physics-informed loss (fizyką uznaną w funkcji straty) nie przyniosły mierzalnych usprawnień w standardowych sieciach regresji głębokości, wyraźnie wskazując że architektura, a nie sama funkcja straty, jest rozstrzygającym czynnikiem.