Home Aktualności Google Veo, poważna zmiana w dziedzinie wideo generowanego przez sztuczną inteligencję, debiutuje...

Google Veo, poważna zmiana w dziedzinie wideo generowanego przez sztuczną inteligencję, debiutuje na Google I/O 2024

15 May 2024

Google poluje na OpenAI Sora z Veo, modelem sztucznej inteligencji, który może tworzyć klipy wideo w rozdzielczości 1080p trwające około minuty, po otrzymaniu monitu tekstowego.

Odsłonięcie we wtorek o godz Konferencja programistów Google I/O 2024Veo może rejestrować różne style wizualne i filmowe, w tym zdjęcia krajobrazów i zdjęć poklatkowych, a także wprowadzać edycje i poprawki do już wygenerowanego materiału.

„Badamy takie funkcje, jak tworzenie scenorysów i generowanie dłuższych scen, aby zobaczyć, co potrafi Veo” – powiedział reporterom Demis Hassabis, szef laboratorium badawczo-rozwojowego AI DeepMind w Google, podczas wirtualnego okrągłego stołu. „Zrobiliśmy niesamowity postęp w dziedzinie wideo”.

Kredyty obrazkowe: Google

Veo opiera się na wstępnych pracach komercyjnych Google w zakresie generowania wideo, podgląd w kwietniu, w którym wykorzystano rodzinę modeli generujących obraz Imagen 2 do tworzenia zapętlonych klipów wideo.

Jednak w przeciwieństwie do narzędzia opartego na Imagen 2, które mogło tworzyć jedynie kilkusekundowe filmy o niskiej rozdzielczości, Veo wydaje się konkurować z wiodącymi obecnie modelami generowania wideo — nie tylko Sorą, ale także modelami start-upów takich jak Pika, Pas startowy I Bezczelne laboratoria.

Podczas odprawy Douglas Eck, który kieruje badaniami w DeepMind w zakresie mediów generatywnych, pokazał mi kilka wybranych przykładów tego, co może zrobić Veo. Szczególnie jedno — widok z lotu ptaka na tętniącą życiem plażę — pokazało przewagę Veo nad konkurencyjnymi modelami wideo, powiedział.

„Okazało się, że szczegółowość wszystkich pływaków na plaży jest trudna zarówno w przypadku modeli do generowania obrazu, jak i wideo, ponieważ jest tak wiele ruchomych postaci” – powiedział. „Jeśli przyjrzysz się uważnie, surfowanie wygląda całkiem nieźle. Argumentuję, że znaczenie słowa „gwarny” oddaje się w kontekście wszystkich ludzi – tętniącej życiem plaży pełnej plażowiczów.

Veo był szkolony na podstawie wielu materiałów filmowych. Tak to ogólnie działa z generatywnymi modelami sztucznej inteligencji: na podstawie przykładów pewnej formy danych modele wychwytują wzorce zawarte w danych, które umożliwiają im generowanie nowych danych — w przypadku Veo filmów.

Skąd pochodzi materiał do szkolenia Veo? Eck nie powiedziałby dokładnie, ale przyznał, że niektóre mogły pochodzić z serwisu YouTube należącego do Google.

„Modele Google mogą być szkolone w zakresie niektórych treści YouTube, ale zawsze zgodnie z naszą umową z twórcami YouTube” – powiedział.

Część „umowa” może technicznie Mów prawdę. Ale prawdą jest również, że biorąc pod uwagę efekty sieciowe YouTube, twórcy nie mają większego wyboru, jak tylko postępować zgodnie z zasadami Google, jeśli chcą dotrzeć do jak najszerszego grona odbiorców.

Ujawnił to kwietniowy raport „The New York Times”. Google rozszerzyło warunki korzystania z usług w zeszłym roku, częściowo po to, aby umożliwić firmie wykorzystanie większej ilości danych do szkolenia modeli sztucznej inteligencji. W starych Warunkach świadczenia nie było jasne, czy Google może wykorzystywać dane YouTube do tworzenia produktów wykraczających poza platformę wideo. Inaczej jest w przypadku nowych warunków, które znacznie luzują stery.

Google nie jest jedynym gigantem technologicznym wykorzystującym ogromne ilości danych użytkowników do szkolenia wewnętrznych modeli. (Widzieć: Meta.) Jednak tym, co z pewnością rozczaruje niektórych twórców, jest upieranie się Ecka, że Google ustanawia w tym przypadku „złoty standard” pod względem etycznym.

„Rozwiązanie tego wyzwania (dane szkoleniowe) zostanie znalezione, gdy wszystkie zainteresowane strony wspólnie ustalą, jakie są kolejne kroki” – powiedział. „Dopóki nie podejmiemy tych kroków z zainteresowanymi stronami – mówimy o przemyśle filmowym, muzycznym, samych artystach – nie będziemy działać szybko”.

Jednak Google udostępnił już Veo wybranym twórcom, w tym Donaldowi Gloverowi (znanemu również jako Childish Gambino) i jego agencji kreatywnej Gilga. (Podobnie jak OpenAI z SorąGoogle pozycjonuje Veo jako narzędzie dla kreacji.)

źródło

Google Veo, poważna zmiana w dziedzinie wideo generowanego przez sztuczną inteligencję, debiutuje na Google I/O 2024

Najnowszy artykuł

Założyciel SpaceX Elon Musk przewiduje, że w niedalekiej przyszłości na Marsie...

Zobacz górski styl życia 14 września Idyllwild home tour – San...

Nowa szczepionka przeciwko wirusowi RSV dla osób starszych może przynieść indywidualne...

Śledztwo szczegółowo opisuje brak egzekwowania ustawy CA Prop 22 około cztery...

Sprytne i rozsądne sposoby oszczędzania pieniędzy na zakupach spożywczych : NPR

Wszystkiego najlepszego z okazji urodzin Wiz Khalifa: odkrywamy jego 10 najlepszych...

Kategoria