Artykuł odsłania pracę zespołu kernels Together AI, który optymalizuje wydajność modeli AI poprzez tworzenie wydajnych implementacji na sprzęcie. Zespół skupia się na rozwoju kerneli CUDA do uruchamia