Dołącz do naszych codziennych i cotygodniowych biuletynów, aby otrzymywać najnowsze aktualizacje i ekskluzywne treści na temat wiodącego w branży zakresu sztucznej inteligencji. dowiedz się więcej
wystartowała Nvidia Schemat dla agentów AI Film można dziś przeanalizować w ramach przemówienia otwierającego targi CES 2025 wygłoszonego przez dyrektora generalnego Jensena Huanga.
Nowy projekt Nvidia AI oparty na Metropolis pozwala organizacjom i osobom zwiększać produktywność i bezpieczeństwo, a nawet może pomóc dyrektorom generalnym Nvidii w ulepszaniu ich szybkich boisk.
Następny ważny moment w AI jest tuż za rogiem – dosłownie.
Obecnie ponad 1,5 miliarda kamer klasy korporacyjnej rozmieszczonych na całym świecie generuje około 7 bilionów godzin wideo rocznie. Jednak tylko część z nich jest analizowana.
Szacuje się, że ludzie oglądają na żywo mniej niż 1% obrazu z kamer przemysłowych, co oznacza, że krytyczne zdarzenia operacyjne mogą w dużej mierze pozostać niezauważone.
to dużo kosztuje. Na przykład producenci tracą biliony dolarów rocznie z powodu złej jakości produktów lub wad, które mogli już zauważyć lub nawet przewidzieć, korzystając z agentów AI, które wymagałyby podjęcia działań przez człowieka. Mogą asystować, analizować i pomagać.
Mogą działać interaktywni agenci AI z wbudowanymi funkcjami percepcji wizualnej
Zawsze aktywni analitycy wideo pomagają fabrykom działać wydajniej, zwiększają bezpieczeństwo pracowników, pilnują, aby wszystko działało sprawnie, a nawet poprawiają grę sportowca.
Aby przyspieszyć tworzenie takich agentów, Nvidia ogłosiła dziś wczesny dostęp
Nowa wersja Nvidia AI Blueprint do wyszukiwania i podsumowywania wideo. Zbudowany na platformie Nvidia Metropolis – a teraz wzbogacony przez Nvidia Cosmos Nemotron Vision Language Model (VLM), Nvidia Llama Nemotron Large Language Model (LLM) i Nvidia Nemo Retriever – projekt zapewnia programistom narzędzia do tworzenia i wdrażania sztucznej inteligencji agentów zapewnia sprzęt. Które mogą analizować duże ilości treści wideo i obrazów.
Blueprint integruje platformę oprogramowania Nvidia AI Enterprise Software Platform, która
Obejmuje VLM, mikrousługi Nvidia NIM dla LLM oraz zaawansowane platformy AI do generowania usprawnionego wyszukiwania – aby umożliwić wsadowe przetwarzanie wideo, które jest do 30 razy szybsze niż oglądanie w czasie rzeczywistym.
Blueprint zawiera kilka funkcji agentycznej sztucznej inteligencji – takich jak rozumowanie oparte na łańcuchu myślowym, planowanie zadań i wywoływanie narzędzi – które mogą pomóc programistom w usprawnieniu tworzenia potężnych i różnorodnych agentów wizualnych do rozwiązywania szerokiej gamy problemów.
Agentów AI z funkcjami analizy wideo można łączyć z innymi agentami o różnych zestawach umiejętności, aby zapewnić jeszcze bardziej wyrafinowane usługi agentów AI.
Przedsiębiorstwa mają elastyczność w budowaniu i wdrażaniu agentów AI od brzegu do chmury.
Jak agenci AI zajmujący się analizą wideo mogą pomóc przedsiębiorstwom przemysłowym
Agenci AI posiadający umiejętności percepcji wizualnej i analizy mogą zostać dostrojeni, aby pomóc firmom w operacjach przemysłowych:
● Zwiększanie produktywności i ograniczanie ilości odpadów: Agenci mogą pomóc to zapewnić
Podczas skomplikowanych procesów przemysłowych przestrzegane są standardowe procedury operacyjne
Procesy takie jak montaż produktu. Można je również naprawić ostrożnie
Obserwuj i zrozum mikrodziałania oraz kolejność, w jakiej występują
Został wdrożony.
● Promowanie efektywności zarządzania aktywami poprzez lepsze wykorzystanie przestrzeni:
Agenci mogą pomóc zoptymalizować przechowywanie zapasów w magazynach, wykonując obraz 3D
Centralizacja szacowania objętości i zrozumienia danych z różnych kamer
strumienie
● Popraw bezpieczeństwo poprzez automatyczne generowanie raportów o incydentach i
Podsumowanie: Agenci mogą przetwarzać duże ilości filmów i podsumowywać je w odpowiednich raportach informacyjnych z wypadków. Mogą również pomóc zapewnić
Zgodność środków ochrony indywidualnej w fabrykach, doskonalenie pracowników
Bezpieczeństwo w warunkach przemysłowych.
● Zapobieganie wypadkom i problemom produkcyjnym: agenci AI mogą zidentyfikować
Aby szybko złagodzić ryzyko operacyjne i ryzyko związane z bezpieczeństwem, nietypowe działania, czy to w
w magazynie, fabryce lub na lotnisku, na skrzyżowaniu lub w innym miejscu miejskim.
● Wyciąganie wniosków z przeszłości: agenci mogą przeszukiwać filmy z operacji
Archiwizuj i wykorzystuj istotne informacje z przeszłości oraz wykorzystuj je do rozwiązywania problemów lub tworzenia nowych procesów.
Analizator wideo dla sportu, rozrywki i nie tylko
Kolejną branżą, w której agenci AI zajmujący się analizą wideo mogą odcisnąć swoje piętno, jest sport – światowy rynek o wartości 500 miliardów dolarów, który według przewidywań wzrośnie o setki miliardów dolarów w ciągu najbliższych kilku lat.
Trenerzy, drużyny i ligi – zarówno profesjonaliści, jak i amatorzy – polegają na analityce wideo, aby oceniać i poprawiać wyniki zawodników, stawiać na pierwszym miejscu bezpieczeństwo i zwiększać zaangażowanie fanów za pośrednictwem platform analitycznych zawodników i wizualizacji danych. Dzięki wizualnie dostrzegalnym agentom AI sportowcy mają teraz bezprecedensowy dostęp do głębokich spostrzeżeń i możliwości doskonalenia.
Podczas swojego przemówienia otwierającego targi CES Huang z Nvidii zademonstrował agenta analizy wideo AI, który oceniał umiejętności szybkiego rzucania piłki amatorskiego gracza w baseball w porównaniu z profesjonalistą. Korzystanie z przechwyconego wideo
Z uroczystego pierwszego narzutu rzuconego przez Huanga dla San Francisco Giants
Zespół baseballowy i agent AI zajmujący się analizą wideo byli w stanie zasugerować obszary
Poprawa.
Warta 3 biliony dolarów branża mediów i rozrywki również odniesie korzyści z agentów AI zajmujących się analizą wideo. Dzięki inicjatywie Nvidia Media2 agenci ci pomogą w tworzeniu inteligentniejszych, bardziej zoptymalizowanych i wywierających większy wpływ treści, które można dostosować do indywidualnych preferencji odbiorców.
Przyjęcie i dostępność na całym świecie
Partnerzy na całym świecie, w tym Accenture, Infosys, Linker Vision, Pegatron, Tata Consultancy Services (TCS), Telit Cinterion i VAST, integrują projekt, aby zbudować agentów AI do analizy wideo z własnymi przepływami pracy dla programistów.
Source link