NVIDIA i Amazon Web Services rozszerzają współpracę, wprowadzając nowe instance EC2 G7 z przyspieszeniem dla obciążeń sztucznej inteligencji. Nowe instancje G7 napędzane kartami NVIDIA RTX PRO 4500 Blackwell Server Edition oferują do 4,6 raza wyższą wydajność inferencji AI oraz do 2,1 raza lepszą wydajność graficzną w stosunku do generacji G6. Poza tym znacznie przyspieszają przetwarzanie danych w Amazon EMR, stanowiąc nowy typ instancji dedykowany obciążeniom produkcyjnym, które wymagają wysokiej wydajności bez złożoności zarządzania platformą GPU.
Spolna praca obu firm adresuje kluczowe wyzwania związane z budowaniem systemów AI na dużą skalę - latencję inferencji, szybkość wyszukiwania wektorowego i efektywność kosztową. Kluczowym elementem jest biblioteka NVIDIA cuVS, która uczynia indeksowanie wektorowe na GPU domyślnym rozwiązaniem w OpenSearch Serverless, przyspieszając warstwę wyszukiwania. Rozwiązania pozwalają przedsiębiorstwom wdrażać AI w produkcji bez znaczącego wzrostu złożoności operacyjnej.
WSA uzyskało także status NVIDIA Exemplar Cloud dla karty GB300, co oznacza, że klienci mogą liczyć na optymalną wydajność podczas trenowania modeli na infrastrukturze AWS. Ten certyfikat potwierdza, że AWS spełnia najwyższe standardy optymalizacji dla obliczeń AI i jest preferowanym partnerem dla przedsiębiorstw inwestujących w infrastrukturę do trenowania zaawansowanych modeli.