Zespół naukowców przedstawił zautomatyzowany system przeszukiwania do systematycznego badania heterogenicznych architektur Mixture-of-Experts z czterema ekspertami w ramach ekosystemu LEMUR. Zamiast ręcznego projektowania, wykorzystano generator kodu do kombinowania rodzin architektur bazowych w zespoły MoE4, każde zarządzane przez sieć gating splotową z skalowaniem temperatury, augmentacją mixup i harmonogramem uczenia cosine-annealed.

W ciągu 28-dniowej kampanii na GPU NVIDIA RTX 4090 system wygenerował 4463 modele kandydujące podzielone na 197 partii, z czego 1021 zostało pomyślnie ocenionych. Odkrycie krytyczne dotyczyło nieoczekiwanego błędu systematycznego: całe przeszukiwana przestrzeń (4,8 procent z teoretycznie możliwych 23,751 kombinacji czterech rodzin) została zakotwiczona do pojedynczej rodziny AirNet z powodu alfabetycznego porządku z funkcji itertools.combinations. Ta stronniczość pokrycia była całkowicie przypadkowa i wynikała z implementacji generatora.

Wśród zidentyfikowanych rodzin architektur ShuffleNet i MobileNetV3 konsekwentnie tworzyły zespoły o najwyższej dokładności, osiągając średnio 0,632 na benchmark testowym. Z drugiej strony FractalNet i MNASNet wykazały się niską wydajnością i zostały oznaczone jako kandydaci do wykluczenia z przyszłych eksperymentów. Badacze zaproponowali poprawkę wykorzystującą stratyfikowane losowe próbkowanie oraz opublikowali cały potok, artefakty analizy i poprawiony generator jako część open-source'owego projektu NNGPT.