Nowy test badający zdolność modelów AI do matematycznego rozumowania w kontekście komunikacji między agentami. Badanie ocenia, czy systemy mogą rozwiązywać problemy poprzez wymianę informacji.