Dołącz do naszych codziennych i cotygodniowych biuletynów, aby otrzymywać najnowsze aktualizacje i ekskluzywne treści na temat wiodącego w branży zakresu sztucznej inteligencji. dowiedz się więcej
AI MidJourney wykracza poza tworzenie i edycję obrazów.
David Holz, założyciel popularnego startupu generującego obrazy AI Podobno ma ponad 21 milionów użytkowników na swoim serwerze Discord Sam, wskoczyłem na transmisję audio na żywo”przestrzeńKilka chwil temu przetestowałem go w sieci społecznościowej X i sprawdziłem, czy można udostępniać ekran.
Do Holza dołączył szef X Elon Musk, który ujawnił, że jest to tubylec
Holz ujawnił, że przygotowuje się do zaprezentowania nowego narzędzia do budowania świata opartego na współpracy w trybie wieloosobowym od MidJourney jeszcze dziś i że usługa zostanie wkrótce uruchomiona, aby ludzie mogli ją przetestować.
Ujawniono patchwork
Na koncie MidJourney na X pojawiło się również: „Teraz rozpoczynamy cotygodniowe godziny pracy MidJourney od podsumowania tygodnia, a następnie przekażemy to Maxowi, aby pochwalił się swoim najnowszym eksperymentalnym narzędziem do budowania świata o nazwie „Patchwork””
Holz był gospodarzem kolejna spacja x Korzystając z Restream i Discord, zaprosił swojego kolegę i pracownika Maxa Kramińskiego, lidera Storytelling Lab w MidJourney, do demonstracji Patchworku. Wyjaśnił, że będzie to samodzielna aplikacja, która będzie wymagała zalogowania się na koncie MidJourney.
To narzędzie wygląda jak puste, białe, nieskończone płótno internetowe z „zestawem narzędzi” po lewej stronie ekranu przeglądarki, zawierającym różne narzędzia oznaczone etykietami „postać”, „wydarzenie”, „frakcja”, „lokalizacja, ” i więcej. Pokazuje przycisk. „Prop” i „Losowe” oraz inne narzędzia, takie jak „Notatka”, „Obraz”, „Portal”, „Zapisz” i „Udostępnij”. „Zapisz” pobiera plik JSON z łączami do wszystkich obrazów MidJourney utworzonych w Canvas.
Aby przełączać się między światami, użytkownik tworzy „portal”, który jest małym czarnym okrągłym przyciskiem.
Aby wygenerować nowy świat, użytkownik wprowadza tekst na pasku edytora u góry ekranu tworzenia i wybiera jeden lub więcej z zestawu 10 różnych stylów obrazu.
Następnie tworzy nową tablicę zawierającą nowe zasoby i elementy nieruchomych obrazów, zwane polami tekstowymi lub „wycinkami”, które zawierają również pola wprowadzania, które umożliwiają użytkownikowi monitowanie o nowe obrazy lub ustawienia, co pozwala na wygenerowanie nawet zupełnie nowych sztucznej inteligencji pasuje do początkowego opisu świata. Opis postaci.
W transmisji na żywo z wersji demonstracyjnej imię postaci zostało automatycznie uzupełnione imieniem Marcus „Dizzy” Gillespie, nawiązując do nazwiska prawdziwego słynnego muzyka jazzowego. Przeciągnięcie opisu do nowego pola kreatora obrazów postaci powoduje utworzenie czterech nowych obrazów postaci wygenerowanych przez sztuczną inteligencję.
Dodając nowe skrzynki postaci, użytkownik może stworzyć dla nich imiona i cechy charakterystyczne, a także motywacje, które mogą inspirować konflikt na podstawie historii.
Użytkownik może następnie połączyć znaki liniami pokazującymi połączenia między nimi. Mogą także pisać sekwencje akcji i opisy scen, z których każdy opowiada jakąś historię. Każdy znak może być również użyty na wielu obrazach, a obrazy te są łączone w jedną opcję.
Użytkownik może także „udostępnić” tablicę innym osobom posiadającym login MidJourney, a także rozpocząć nad nią współpracę, najwyraźniej w czasie rzeczywistym, przesuwając wiele kursorów na tym samym udostępnionym obszarze roboczym. Kramiński powiedział, że obecnie tablice widzą tylko zalogowani użytkownicy, ale w przyszłości będą mogli je oglądać także osoby niebędące użytkownikami. Zauważył, że grupy zajmujące się odgrywaniem ról na tablecie wykorzystywały go już do tworzenia wykresów swoich kampanii.
Zauważył również, że wersja MidJourney 7 (v7) będzie zawierać ustawienie umożliwiające spójność wielu znaków na różnych i nowych obrazach.
Kraminsky ujawnił ponadto, że aplikację obsługują co najmniej 3 różne duże modele językowe, w tym unikalny model open source dla MidJourney.
Ostatecznie wydaje się, że jest to nowe, złożone, potężne, nieco przytłaczające, ale przekonujące narzędzie do tworzenia scenorysów. Z łatwością widzę, że korzystają z niego pisarze i reżyserzy filmowi, projektanci gier, twórcy komiksów, a nawet reżyserzy i pisarze teatralni na żywo.
Kraminsky stwierdził, że w dłuższej perspektywie istnieje „bardzo wyraźna ścieżka naprzód w zakresie zwiększania szczegółowości i interakcji w świecie”, w tym w pełni wciągających scen rzeczywistości wirtualnej 3D, ale prawdopodobnie zajmie to kilka lat.
Wiadomość ta pojawia się w momencie, gdy inni badacze sztucznej inteligencji, Startupy takie jak World Labs Fei-Fei LiI Duże firmy technologiczne, takie jak Google Chcesz opracować sztuczną inteligencję, która będzie w stanie tworzyć wciągające światy 3D, po których można nawigować online, z prostych symboli lub obrazów.
Więcej aktualizacji MidJourney już wkrótce
Ponadto Holz powiedział, że w nadchodzących dniach MidJourney uruchomi kilka trybów personalizacji modelu.
Obecnie MidJourney pozwala oceniać obrazy, aby spersonalizować rodzaj wizualizacji, które chcesz oglądać w swoich pokoleniach, i dostosować model do osobistych preferencji. Uruchomienie umożliwi teraz posiadanie wielu spersonalizowanych wersji, pomiędzy którymi można się przełączać.
Ponadto Holz powiedział, że MidJourney umożliwi użytkownikom przesyłanie wielu obrazów i odwoływanie się do nich na „tablicy”, która będzie przewodnikiem dla pokoleń.
Dodatkowo po Bożym Narodzeniu (25 grudnia) na początku przyszłego roku MidJourney wprowadzi modele wideo z ulepszonym natychmiastowym zrozumieniem i generatorem obrazu AI MidJourney V7.
Holz ujawnił ponadto, że MidJourney pracuje nad 3-4 nowymi projektami sprzętowymi i powiedział, że startup „próbuje rozszerzyć swoją działalność i stać się pełnoprawnym laboratorium badawczym… Ogłoszenie wszystkich sześciu rzeczy zajmie nam sześć miesięcy”. To może zająć.”
Source link