Wszystko zostało ogłoszone w 12 minut na wydarzeniu Nvidii na targach CES
Na targach CES 2025 dyrektor generalny Nvidii, Jensen Huang, rozpoczął CES, największe na świecie targi elektroniki użytkowej, prezentacją nowego chipa do gier RTX, aktualizacji chipa AI Grace Blackwell i planów na przyszłość związanych z robotyką i samochodami autonomicznymi.
Oto jest. Nasza nowa seria GForce RTX 50, architektura Blackwell, procesor graficzny to po prostu bestia, 92 miliardy tranzystorów, 4000 wierzchołków, 4 petaflopy AI, 3 razy więcej niż Ada poprzedniej generacji i potrzebujemy jej do wygenerowania tych wszystkich pikseli, które ci pokazałem . 380 teraflopów ze śledzeniem promieni, abyśmy mogli obliczyć najpiękniejszy obraz, jaki tylko możemy dla pikseli, które musimy obliczyć, i oczywiście 125 teraflopów shaderów. W rzeczywistości współbieżny moduł cieniujący jest całkowitą jednostką teraflopów i ma podobną wydajność. Zatem dwa podwójne shadery, jeden dla liczby ruchomej, 0,1 dla liczby całkowitej. Pamięć G7 od Micron 1,8 terabajta na sekundę, dwukrotnie większa wydajność w porównaniu z naszą poprzednią generacją, a teraz mamy możliwość łączenia obciążeń AI z obciążeniami grafiki komputerowej. Jedną z niesamowitych rzeczy w tej generacji jest to, że programowalny moduł cieniujący może teraz przetwarzać także sieci neuronowe. Zatem moduł cieniujący może przejąć te sieci neuronowe i w rezultacie wymyśliliśmy. Kompresja tekstur Neuro i cieniowanie treści neuronowych dzięki wydajności karty RTX 5070, 4090 z rodziny Blackwell w czasie 5:49. Niemożliwe bez sztucznej inteligencji, niemożliwe bez czterech wierzchołków, 4 operacje przerwania rdzenia tensorowego AI. G7 niemożliwy bez wspomnień. OK, więc wydajność 5070, 4090, 549 USD, a oto cała rodzina, począwszy od 5070 aż do 5090 USD, 5090, dwukrotnie większa wydajność niż 4090. Oczywiście od stycznia produkujemy bardzo masową dostępność. Cóż, to niewiarygodne, ale udało nam się umieścić te niezwykle wydajne procesory graficzne w laptopie. To laptop 5070 o wartości 1299. Wydajność tego laptopa 5070 wynosi 4090. I tak 5090, 5090. Zmieści się do laptopa, cienkiego laptopa. Ten ostatni laptop miał 14,4,9 milimetra. Masz 5080, 5070 Ti i 5070. Ale w zasadzie mamy 72 procesory graficzne Blackwell lub 144 kości. Tutaj jest to chip 1,4 exaflops. Największy superkomputer świata, ostatnio najszybszy superkomputer. Ten superkomputer obsługujący cały pokój osiągnął niedawno wynik exaflops plus. Jest to 1,4 eksaflopa wydajności zmiennoprzecinkowej AI. Ma 14 terabajtów pamięci, ale zaskakujące jest to, że przepustowość pamięci wynosi 1,2 petabajta na sekundę. Jest zasadniczo, zasadniczo doskonały. Ruch internetowy, który ma miejsce obecnie. Na tych chipach przetwarzany jest ruch internetowy całego świata, prawda? Mamy łącznie 10 130 bilionów tranzystorów, 2592 rdzenie procesorów. Cała masa networkingu, więc chciałbym móc to zrobić. Chyba nie, więc to Blackwells. To są nasze ConnectX. Chipy sieciowe, to są łącza SN i staramy się pochwalić kręgosłupem łącza SN, ale to nie jest możliwe, OK. A to cała pamięć HBM, 1214 terabajtów pamięci HBM. Właśnie to staramy się robić i to jest cud, to cud systemu czarnych ścian, więc wykorzystujemy naszą wiedzę i umiejętności, aby je naprawić i przekształcić je w kombinezony lamy nemotron z modelami otwartymi. Są mniejsze, które współdziałają z bardzo krótkim czasem reakcji, bardzo małe, nazywamy je super lama nemotron super, są w zasadzie główną wersją twojego modelu lub twojego ultra modelu, ultra. Modelu można używać. Zostań wzorem nauczyciela dla całej masy innych modeli. Może to być osoba oceniająca model nagrody. Uh, sędzia przygotowuje odpowiedź dla innych modeli i decyduje, czy jest to dobra odpowiedź, czy nie, w zasadzie przekazuje informację zwrotną innym modelom. Można go destylować na wiele różnych sposobów, w zasadzie jako model nauczyciela, destylacja wiedzy, uh, uh, model, bardzo duży, bardzo zdolny, więc wszystko jest teraz dostępne online i za pośrednictwem Cosmos, pierwszego na świecie Is. Podstawowy model świata. Jest przeszkolony na 20 milionach godzin wideo. 20 milionów godzin filmów przedstawiających rzeczy dynamiczne fizycznie, tak dynamiczną przyrodę, motywy natury, uh, ludzie, uh, chodzenie, uh, poruszanie rękami, uh, manipulowanie rzeczami, uh, wiesz, rzeczy, które są, uh, szybkie Jest skupiony NA. Ruch kamery. Tak naprawdę chodzi o nauczanie sztucznej inteligencji, a nie o tworzenie kreatywnych treści, ale o to, aby sztuczna inteligencja zrozumiała świat fizyczny i uczyła się na tej fizycznej sztucznej inteligencji. Istnieje wiele dalszych działań, które możemy wykonać, których efektem będzie syntetyczne generowanie danych w celu uczenia modeli. Aby zobaczyć początek modelu robotyki, możemy go wydestylować i skutecznie przekształcić. Możesz sprawić, że będzie to oparte na fizyce, fizycznie wiarygodne, wygenerować wiele przyszłych scenariuszy, po prostu zrobić Doktora Strange. Um, możesz to zrobić, uh, ponieważ ponieważ ten model rozumie świat fizyczny, oczywiście widziałeś całą masę obrazów, które generują ten model, który rozumie świat fizyczny, to oczywiście. Potrafi także dodawać napisy i dzięki czemu może nagrać film, opatrzyć go niewiarygodnie dobrymi napisami, a napisy i wideo można wykorzystać do szkoleń. Duże modele językowe. Multimodalność dużych modeli językowych i hm, więc można używać tej technologii do używania tego podstawowego modelu do szkolenia robotów robotyki, a także dużych modeli językowych, więc to jest wszechświat Nvidii. Platforma posiada model autoregresyjny do zastosowań w czasie rzeczywistym jako model propagacyjny umożliwiający generowanie obrazów o bardzo wysokiej jakości. To ten niesamowity tokenizator, który w zasadzie uczy się terminologii ze świata rzeczywistego i potoku danych, więc jeśli chcesz to wszystko wziąć, a następnie wytrenować na swoich danych, tym potoku danych, ponieważ wymaga to tak dużej ilości danych, przyspieszyliśmy wszystko. To się dla Ciebie skończy, dlatego jest to pierwszy na świecie potok przetwarzania danych, który można przyspieszyć, a także sztuczną inteligencję. Wszystko to jest częścią platformy Cosmos i dzisiaj to ogłaszamy. Ten Kosmos ma licencję otwartą. Jest ogólnodostępny na GitHubie. Cóż, dzisiaj ogłaszamy, że nasz procesor nowej generacji do samochodu, nasz komputer nowej generacji do samochodu, nazywa się Thor. Mam jednego tutaj. Poczekaj chwilę. OK, to Thor. To jest Thor, to jest komputer-robot. To komputer-robot, który pobiera czujniki i niesamowitą ilość informacji z czujników i przetwarza je, wiesz. Niezliczone kamery, radar o wysokiej rozdzielczości, LIDAR – wszystko to trafia do tego chipa, a ten chip musi przetworzyć wszystkie te czujniki, zamienić je w tokeny, umieścić w transformatorach i przewidzieć następną ścieżkę. Ten komputer AV jest teraz w pełnej produkcji. Thor jest 20 razy większy. Możliwości przetwarzania naszej poprzedniej generacji Orin, co jest dziś naprawdę standardem dla pojazdów autonomicznych. To jest naprawdę całkiem, całkiem niewiarygodne. Thor jest w pełnej produkcji. Nawiasem mówiąc, ten robotyczny procesor również trafia do pełnego robota, więc może to być AMR, może to być człowiek lub robot, uh, może to być mózg, może to być, uh, manipulator, uh, Procesor ten jest w zasadzie uniwersalnym komputerem robotycznym. Czatuj chwile GPT. Robotyka w ogóle jest tuż za rogiem. I rzeczywiście, to są technologie wspomagające, o których mówię. W ciągu najbliższych kilku lat będziemy świadkami bardzo szybkich, niesamowitych przełomów w szeroko pojętej robotyce. Powodem, dla którego ogólna robotyka jest obecnie tak ważna, jest to, że roboty z gąsienicami i kołami wymagają specjalnego środowiska, aby je pomieścić. Są 3 roboty. 3 roboty na świecie, które możemy zbudować i które nie wymagają żadnych zielonych pól. Optymalizacja pola brunatnego jest doskonała. Gdybyśmy mogli zbudować te niesamowite roboty, moglibyśmy wdrożyć je w świecie, który sami stworzyliśmy. Te 3 roboty to robot agentyczny i agentyczna sztuczna inteligencja, ponieważ wiadomo, że są pracownikami informacyjnymi, o ile mogą pomieścić komputery, które mamy w naszych biurach, byłoby wspaniale. Numer 2, samochody autonomiczne, a powodem tego jest fakt, że spędziliśmy ponad 100 lat na budowie dróg i miast. A następnie numer 3, człowiek lub robot. Jeśli będziemy dysponować technologią pozwalającą rozwiązać te 3 problemy, będzie to największy przemysł technologiczny, jaki kiedykolwiek widział świat. To najnowszy superkomputer AI firmy Nvidia. I w końcu nazywa się to teraz Project Digit i jeśli masz dla niego dobrą nazwę, skontaktuj się z nami. Um, uh, to niesamowite, to superkomputer AI. Obsługuje cały stos Nvidia AI. Całe oprogramowanie Nvidii na nim działa. Na tym działa DGX Cloud. W porządku, gdzie indziej jest to połączenie bezprzewodowe lub wiesz, że jest podłączone do twojego komputera, jest to także stacja robocza, jeśli chcesz, i możesz uzyskać do niej dostęp, dzięki czemu możesz uzyskać do niej dostęp jak do superkomputera w chmurze. AI Nvidii na nim pracuje i hm, jest na nim oparta super tajny chip, nad którym pracujemy, zwany GB 110, to najmniejszy Grace Blackwell, jaki produkujemy i to ten chip, który jest w środku Jest. Jest w produkcji. Ten ściśle tajny chip, uh, zrobiliśmy we współpracy z procesorem, szary procesor został, uh, stworzony dla Nvidii we współpracy z MediaTek. Uh, to wiodąca na świecie firma zajmująca się SoC i współpracowali z nami przy tworzeniu tego procesora, procesora SoC i układu łączącego z chipem i procesorem graficznym Blackwell, a ta mała rzecz jest już w fazie pełnej produkcji. Oczekujemy, że ten komputer będzie dostępny około maja.