OpenAI przedstawia najnowszy model AI, GPT-4o


Nowy Jork
CNN

ChatGPT wkrótce stanie się o wiele bardziej przydatny.

OpenAI w poniedziałek ogłoszony jego najnowszy model wielkojęzykowy sztucznej inteligencji, który według niego sprawi, że ChatGPT będzie mądrzejszy i łatwiejszy w użyciu.

Nowy model, nazwany GPT-4o, jest aktualizacją modelu firmy poprzedni model GPT-4który wystartował nieco ponad rok temu. Model będzie dostępny dla klientów nieodpłatnych, co oznacza, że ​​każdy będzie miał dostęp do najbardziej zaawansowanej technologii OpenAI poprzez ChatGPT.

Bazując na poniedziałkowej demonstracji firmy, GPT-4o skutecznie zmieni ChatGPT w cyfrowego osobistego asystenta, który może prowadzić rozmowy mówione w czasie rzeczywistym. Będzie także w stanie wchodzić w interakcję za pomocą tekstu i „wizji”, co oznacza, że ​​będzie mógł przeglądać zrzuty ekranu, zdjęcia, dokumenty lub wykresy przesłane przez użytkowników i prowadzić o nich rozmowy.

Dyrektor ds. technologii OpenAI, Mira Murati, powiedziała, że ​​zaktualizowana wersja ChatGPT będzie teraz wyposażona w pamięć, co oznacza, że ​​będzie mogła uczyć się na podstawie poprzednich rozmów z użytkownikami i wykonywać tłumaczenia w czasie rzeczywistym.

„To pierwszy raz, kiedy naprawdę robimy ogromny krok naprzód, jeśli chodzi o łatwość obsługi” – powiedział Murati podczas demonstracji na żywo w siedzibie firmy w San Francisco. „Ta interakcja staje się znacznie bardziej naturalna i znacznie, znacznie łatwiejsza”.

Nowa wersja pojawia się, gdy OpenAI stara się wyprzedzić rosnącą konkurencję w wyścigu zbrojeń AI. Rywale, w tym Google i Meta, pracują nad budowaniem coraz potężniejszych, dużych modeli językowych, które obsługują chatboty i mogą być wykorzystywane do wprowadzania technologii sztucznej inteligencji do różnych innych produktów.

Wydarzenie OpenAI odbyło się dzień przed coroczną konferencją programistów I/O Google, podczas której ma zostać ogłoszona aktualizacja modelu Gemini AI. Podobnie jak nowy GPT-4o, Gemini firmy Google jest również multimodalny, co oznacza, że ​​może interpretować i generować tekst, obrazy i dźwięk. Aktualizacja OpenAI wyprzedza także oczekiwane ogłoszenia AI przez Apple na światowej konferencji programistów w przyszłym miesiącu, które mogą obejmować nowe sposoby włączania sztucznej inteligencji do kolejnych wydań iPhone’a lub iOS.

Tymczasem najnowsza wersja GPT może być dobrodziejstwem dla Microsoftu, który zainwestował miliardy dolarów w OpenAI, aby osadzić swoją technologię AI we własnych produktach Microsoftu.

Kierownictwo OpenAI zademonstrowało rozmowę mówioną z ChatGPT, aby uzyskać instrukcje w czasie rzeczywistym dotyczące rozwiązania problemu matematycznego, opowiedzieć historię na dobranoc i uzyskać porady dotyczące kodowania. ChatGPT był w stanie mówić naturalnym, ludzkim głosem, a także głosem robota, a nawet zaśpiewał część jednej odpowiedzi. Narzędzie umożliwiało także obejrzenie obrazu wykresu i omówienie go.

Pokazali także model wykrywający emocje użytkowników; w jednym przypadku słuchał oddechu dyrektora i zachęcał go do uspokojenia.

„Nie jesteś odkurzaczem!” żeński głos ChatGPT (który brzmi niezwykle podobnie do cyfrowego towarzysza z głosem Scarlett Johansson z filmu „Her” z 2013 roku) żartobliwie powiedział pracownikowi.

ChatGPT mógł także prowadzić rozmowy w wielu językach, tłumacząc i odpowiadając automatycznie. Według OpenAI narzędzie obsługuje obecnie ponad 50 języków.

„Nowy tryb głosu (i wideo) to najlepszy interfejs komputerowy, jakiego kiedykolwiek używałem” – powiedział dyrektor generalny OpenAI Sam Altman w wywiadzie dla post na blogu po ogłoszeniu. „Wygląda jak sztuczna inteligencja z filmów; i nadal trochę mnie zaskakuje, że to prawda. Uzyskanie czasu reakcji i ekspresji na poziomie ludzkim okazuje się dużą zmianą”.

Murati powiedział, że OpenAI uruchomi aplikację komputerową ChatGPT z możliwościami GPT-4o, zapewniając użytkownikom kolejną platformę do interakcji z technologią firmy. GPT-4o będzie także dostępne dla programistów chcących zbudować własne, niestandardowe chatboty ze sklepu GPT OpenAI, a funkcja ta będzie teraz dostępna także dla użytkowników, którzy nie płacą.

Zaktualizowana technologia i funkcje zostaną wprowadzone w ChatGPT w nadchodzących miesiącach. Użytkownicy bezpłatnego ChatGPT będą mieli ograniczoną liczbę interakcji z nowym modelem GPT-4o, zanim narzędzie automatycznie powróci do polegania na starym modelu GPT-3.5; płatni użytkownicy będą mieli dostęp do większej liczby wiadomości dzięki najnowszemu modelowi.

OpenAI twierdzi, że ponad 100 milionów ludzi korzysta już z ChatGPT. Jednak zaktualizowana funkcja ChatGPT — oraz możliwość interakcji z nią na komputerze stacjonarnym i dzięki ulepszonym rozmowom głosowym — może dać jeszcze większej liczbie osób powód do korzystania z tej technologii. Posunięcia te pojawiają się w momencie, gdy integracja sztucznej inteligencji z szerzej używanymi produktami konsumenckimi Google i Meta, takimi jak Instagram i Asystent Google, może sprawić, że technologia tych firm będzie szerzej i łatwiej dostępna.

Ta historia została zaktualizowana o dodatkowe wydarzenia i kontekst.

źródło