Google DeepMind zaprezentował Vision Banana, model generatywny ze instruction-tuningiem, który osiąga lepsze wyniki niż SAM 3 w segmentacji obrazów oraz Depth Anything V3 w estymacji głębi metrycznej.
Badania
MarkTechPost
Google DeepMind zaprezentował Vision Banana, model generatywny ze instruction-tuningiem, który osiąga lepsze wyniki niż SAM 3 w segmentacji obrazów oraz Depth Anything V3 w estymacji głębi metrycznej.