Naukowcy przeprowadzili szczegółowe badanie mechanistyczne modeli vision-language, analizując jak uwaga i stany ukryte wpływają na niezawodność tych systemów. Badanie identyfikuje konkretne obwody przyczynowe odpowiadające za poprawne działanie modeli w zadaniach łączenia obrazów z tekstem. Odkrycia mogą pomóc w lepszym zrozumieniu, debugowaniu i poprawie bezpieczeństwa multimodalnych modeli AI.