Dołącz do naszych codziennych i cotygodniowych biuletynów, aby otrzymywać najnowsze aktualizacje i ekskluzywne treści na temat wiodącego w branży zakresu sztucznej inteligencji. dowiedz się więcej


wystartowała Nvidia Schemat dla agentów AI Film można dziś przeanalizować w ramach przemówienia otwierającego targi CES 2025 wygłoszonego przez dyrektora generalnego Jensena Huanga.

Nowy projekt Nvidia AI oparty na Metropolis pozwala organizacjom i osobom zwiększać produktywność i bezpieczeństwo, a nawet może pomóc dyrektorom generalnym Nvidii w ulepszaniu ich szybkich boisk.

Następny ważny moment w AI jest tuż za rogiem – dosłownie.

Obecnie ponad 1,5 miliarda kamer klasy korporacyjnej rozmieszczonych na całym świecie generuje około 7 bilionów godzin wideo rocznie. Jednak tylko część z nich jest analizowana.

Szacuje się, że ludzie oglądają na żywo mniej niż 1% obrazu z kamer przemysłowych, co oznacza, że ​​krytyczne zdarzenia operacyjne mogą w dużej mierze pozostać niezauważone.

to dużo kosztuje. Na przykład producenci tracą biliony dolarów rocznie z powodu złej jakości produktów lub wad, które mogli już zauważyć lub nawet przewidzieć, korzystając z agentów AI, które wymagałyby podjęcia działań przez człowieka. Mogą asystować, analizować i pomagać.

Mogą działać interaktywni agenci AI z wbudowanymi funkcjami percepcji wizualnej
Zawsze aktywni analitycy wideo pomagają fabrykom działać wydajniej, zwiększają bezpieczeństwo pracowników, pilnują, aby wszystko działało sprawnie, a nawet poprawiają grę sportowca.

Aby przyspieszyć tworzenie takich agentów, Nvidia ogłosiła dziś wczesny dostęp
Nowa wersja Nvidia AI Blueprint do wyszukiwania i podsumowywania wideo. Zbudowany na platformie Nvidia Metropolis – a teraz wzbogacony przez Nvidia Cosmos Nemotron Vision Language Model (VLM), Nvidia Llama Nemotron Large Language Model (LLM) i Nvidia Nemo Retriever – projekt zapewnia programistom narzędzia do tworzenia i wdrażania sztucznej inteligencji agentów zapewnia sprzęt. Które mogą analizować duże ilości treści wideo i obrazów.

Blueprint integruje platformę oprogramowania Nvidia AI Enterprise Software Platform, która
Obejmuje VLM, mikrousługi Nvidia NIM dla LLM oraz zaawansowane platformy AI do generowania usprawnionego wyszukiwania – aby umożliwić wsadowe przetwarzanie wideo, które jest do 30 razy szybsze niż oglądanie w czasie rzeczywistym.

Blueprint zawiera kilka funkcji agentycznej sztucznej inteligencji – takich jak rozumowanie oparte na łańcuchu myślowym, planowanie zadań i wywoływanie narzędzi – które mogą pomóc programistom w usprawnieniu tworzenia potężnych i różnorodnych agentów wizualnych do rozwiązywania szerokiej gamy problemów.

Agentów AI z funkcjami analizy wideo można łączyć z innymi agentami o różnych zestawach umiejętności, aby zapewnić jeszcze bardziej wyrafinowane usługi agentów AI.

Przedsiębiorstwa mają elastyczność w budowaniu i wdrażaniu agentów AI od brzegu do chmury.

Jak agenci AI zajmujący się analizą wideo mogą pomóc przedsiębiorstwom przemysłowym

Agenci AI posiadający umiejętności percepcji wizualnej i analizy mogą zostać dostrojeni, aby pomóc firmom w operacjach przemysłowych:

● Zwiększanie produktywności i ograniczanie ilości odpadów: Agenci mogą pomóc to zapewnić
Podczas skomplikowanych procesów przemysłowych przestrzegane są standardowe procedury operacyjne
Procesy takie jak montaż produktu. Można je również naprawić ostrożnie
Obserwuj i zrozum mikrodziałania oraz kolejność, w jakiej występują
Został wdrożony.

● Promowanie efektywności zarządzania aktywami poprzez lepsze wykorzystanie przestrzeni:
Agenci mogą pomóc zoptymalizować przechowywanie zapasów w magazynach, wykonując obraz 3D
Centralizacja szacowania objętości i zrozumienia danych z różnych kamer
strumienie

● Popraw bezpieczeństwo poprzez automatyczne generowanie raportów o incydentach i
Podsumowanie: Agenci mogą przetwarzać duże ilości filmów i podsumowywać je w odpowiednich raportach informacyjnych z wypadków. Mogą również pomóc zapewnić
Zgodność środków ochrony indywidualnej w fabrykach, doskonalenie pracowników
Bezpieczeństwo w warunkach przemysłowych.

● Zapobieganie wypadkom i problemom produkcyjnym: agenci AI mogą zidentyfikować
Aby szybko złagodzić ryzyko operacyjne i ryzyko związane z bezpieczeństwem, nietypowe działania, czy to w
w magazynie, fabryce lub na lotnisku, na skrzyżowaniu lub w innym miejscu miejskim.

● Wyciąganie wniosków z przeszłości: agenci mogą przeszukiwać filmy z operacji
Archiwizuj i wykorzystuj istotne informacje z przeszłości oraz wykorzystuj je do rozwiązywania problemów lub tworzenia nowych procesów.

Analizator wideo dla sportu, rozrywki i nie tylko

Kolejną branżą, w której agenci AI zajmujący się analizą wideo mogą odcisnąć swoje piętno, jest sport – światowy rynek o wartości 500 miliardów dolarów, który według przewidywań wzrośnie o setki miliardów dolarów w ciągu najbliższych kilku lat.

Trenerzy, drużyny i ligi – zarówno profesjonaliści, jak i amatorzy – polegają na analityce wideo, aby oceniać i poprawiać wyniki zawodników, stawiać na pierwszym miejscu bezpieczeństwo i zwiększać zaangażowanie fanów za pośrednictwem platform analitycznych zawodników i wizualizacji danych. Dzięki wizualnie dostrzegalnym agentom AI sportowcy mają teraz bezprecedensowy dostęp do głębokich spostrzeżeń i możliwości doskonalenia.

Podczas swojego przemówienia otwierającego targi CES Huang z Nvidii zademonstrował agenta analizy wideo AI, który oceniał umiejętności szybkiego rzucania piłki amatorskiego gracza w baseball w porównaniu z profesjonalistą. Korzystanie z przechwyconego wideo
Z uroczystego pierwszego narzutu rzuconego przez Huanga dla San Francisco Giants
Zespół baseballowy i agent AI zajmujący się analizą wideo byli w stanie zasugerować obszary
Poprawa.

Warta 3 biliony dolarów branża mediów i rozrywki również odniesie korzyści z agentów AI zajmujących się analizą wideo. Dzięki inicjatywie Nvidia Media2 agenci ci pomogą w tworzeniu inteligentniejszych, bardziej zoptymalizowanych i wywierających większy wpływ treści, które można dostosować do indywidualnych preferencji odbiorców.

Przyjęcie i dostępność na całym świecie

Partnerzy na całym świecie, w tym Accenture, Infosys, Linker Vision, Pegatron, Tata Consultancy Services (TCS), Telit Cinterion i VAST, integrują projekt, aby zbudować agentów AI do analizy wideo z własnymi przepływami pracy dla programistów.


Source link