Firma Nvidia ogłosiła dzisiaj, że wypuszcza rodzinę podstawowych modeli sztucznej inteligencji o nazwie Cosmos, których można używać do szkolenia humanoidów, robotów przemysłowych i samochodów autonomicznych. Podczas gdy modele językowe uczą się generować tekst, ucząc się na licznych książkach, artykułach i postach w mediach społecznościowych, Cosmos został zaprojektowany do generowania obrazów i modeli 3D świata fizycznego.
Podczas głównej prezentacji na dorocznej konferencji CES w Las Vegas dyrektor generalny Nvidii Jensen Huang pokazał przykłady Cosmos do symulacji działań wewnątrz magazynów. Kosmos został przeszkolony na podstawie 20 milionów godzin prawdziwego materiału filmowego przedstawiającego „ludzi chodzących, poruszających rękami i manipulujących przedmiotami” – powiedział Jensen. „Nie chodzi o tworzenie kreatywnych treści, ale o uczenie sztucznej inteligencji rozumienia świata fizycznego”.
Naukowcy i start-upy mają nadzieję, że tego typu podstawowe modele mogą zapewnić bardziej wyrafinowane możliwości robotom używanym w fabrykach i domach. Na przykład Cosmos może wygenerować realistyczny materiał wideo przedstawiający pudełka spadające z półek w magazynie, który można wykorzystać do szkolenia robotów w zakresie rozpoznawania wypadków. Użytkownicy mogą również dostroić model, korzystając z własnych danych.
Nvidia twierdzi, że kilka firm korzysta już z Cosmos, w tym start-upy w zakresie robotów humanoidalnych Agility i Figura AI, a także producenci samochodów autonomicznych, tacy jak Uber, Wabi i Wave.
Nvidia ogłosiła także oprogramowanie, które ma pomóc różnym typom robotów w nauce efektywniejszego wykonywania nowych zadań. Nowa funkcja jest częścią istniejącej platformy symulacyjnej robotów Isaac firmy Nvidia, która umożliwi konstruktorom robotów wzięcie niewielkiej liczby przykładów pożądanego zadania, np. uchwycenia określonego obiektu, i wygenerowanie dużych ilości syntetycznych danych szkoleniowych.
Nvidia ma nadzieję, że Cosmos i Isaac przypadną do gustu firmom, które chcą budować i wykorzystywać humanoidalne roboty. Na scenie CES do Jensena dołączyły naturalnej wielkości obrazy 14 różnych humanoidalnych robotów opracowanych przez takie firmy, jak Tesla, Boston Dynamics, Agility i Figma.
Wraz z Cosmos, Nvidia ogłosiła także Project Digits, „osobisty superkomputer AI” o wartości 3000 dolarów, który może obsługiwać duży model językowy zawierający do 200 miliardów parametrów bez potrzeby korzystania z usług w chmurze, takich jak AWS czy Microsoft. Ogłosiła także długo oczekiwane procesory graficzne RTX Blackwell nowej generacji oraz nadchodzące narzędzia programowe, które pomogą w tworzeniu agentów AI.