Laboratoria zajmujące się sztuczną inteligencją fizyczną napotykają poważny problem: podczas gdy modele języków mogą być trenowane na miliardach tekstów dostępnych online, roboty potrzebują konkretnych, rzeczywistych danych o interakcji z otoczeniem. Ta różnica wymusiła pojawienie się nowej branży specjalistów zajmujących się gromadzeniem danych treningowych.
Firmy takie jak XDOF już otrzymują płatności od laboratoriów AI za zbieranie tych cennych danych. Praca polega na ręcznym manipulowaniu przedmiotami, rejestrowaniu ruchu, otagowaniu scen — wszystko to żmudne, powtarzalne czynności wykonywane w kontrolowanych warunkach. To diametralnie inne zadanie niż web scraping czy automatyczne zbieranie tekstu, które napędzało trening LLM.
Pycha tego trendu jest jak duża: bez wysokiej jakości danych o rzeczywistych interakcjach fizycznych, roboty nie będą w stanie nauczyć się umiejętności potrzebnych do niezawodnej pracy w świecie rzeczywistym. Podobnie jak LLM wymagały ogromnych zbiorów danych tekstowych, fizyczne systemy AI będą potrzebować tylu samo zasobów — tyle że zebranych ręcznie i znacznie droższych.