Nowy Jork
CNN
—
ChatGPT wkrótce stanie się o wiele bardziej przydatny.
OpenAI w poniedziałek ogłoszony jego najnowszy model wielkojęzykowy sztucznej inteligencji, który według niego sprawi, że ChatGPT będzie mądrzejszy i łatwiejszy w użyciu.
Nowy model, nazwany GPT-4o, jest aktualizacją modelu firmy poprzedni model GPT-4który wystartował nieco ponad rok temu. Model będzie dostępny dla klientów nieodpłatnych, co oznacza, że każdy będzie miał dostęp do najbardziej zaawansowanej technologii OpenAI poprzez ChatGPT.
Bazując na poniedziałkowej demonstracji firmy, GPT-4o skutecznie zmieni ChatGPT w cyfrowego osobistego asystenta, który może prowadzić rozmowy mówione w czasie rzeczywistym. Będzie także w stanie wchodzić w interakcję za pomocą tekstu i „wizji”, co oznacza, że będzie mógł przeglądać zrzuty ekranu, zdjęcia, dokumenty lub wykresy przesłane przez użytkowników i prowadzić o nich rozmowy.
Dyrektor ds. technologii OpenAI, Mira Murati, powiedziała, że zaktualizowana wersja ChatGPT będzie teraz wyposażona w pamięć, co oznacza, że będzie mogła uczyć się na podstawie poprzednich rozmów z użytkownikami i wykonywać tłumaczenia w czasie rzeczywistym.
„To pierwszy raz, kiedy naprawdę robimy ogromny krok naprzód, jeśli chodzi o łatwość obsługi” – powiedział Murati podczas demonstracji na żywo w siedzibie firmy w San Francisco. „Ta interakcja staje się znacznie bardziej naturalna i znacznie, znacznie łatwiejsza”.
Nowa wersja pojawia się, gdy OpenAI stara się wyprzedzić rosnącą konkurencję w wyścigu zbrojeń AI. Rywale, w tym Google i Meta, pracują nad budowaniem coraz potężniejszych, dużych modeli językowych, które obsługują chatboty i mogą być wykorzystywane do wprowadzania technologii sztucznej inteligencji do różnych innych produktów.
Wydarzenie OpenAI odbyło się dzień przed coroczną konferencją programistów I/O Google, podczas której ma zostać ogłoszona aktualizacja modelu Gemini AI. Podobnie jak nowy GPT-4o, Gemini firmy Google jest również multimodalny, co oznacza, że może interpretować i generować tekst, obrazy i dźwięk. Aktualizacja OpenAI wyprzedza także oczekiwane ogłoszenia AI przez Apple na światowej konferencji programistów w przyszłym miesiącu, które mogą obejmować nowe sposoby włączania sztucznej inteligencji do kolejnych wydań iPhone’a lub iOS.
Tymczasem najnowsza wersja GPT może być dobrodziejstwem dla Microsoftu, który zainwestował miliardy dolarów w OpenAI, aby osadzić swoją technologię AI we własnych produktach Microsoftu.
Kierownictwo OpenAI zademonstrowało rozmowę mówioną z ChatGPT, aby uzyskać instrukcje w czasie rzeczywistym dotyczące rozwiązania problemu matematycznego, opowiedzieć historię na dobranoc i uzyskać porady dotyczące kodowania. ChatGPT był w stanie mówić naturalnym, ludzkim głosem, a także głosem robota, a nawet zaśpiewał część jednej odpowiedzi. Narzędzie umożliwiało także obejrzenie obrazu wykresu i omówienie go.
Pokazali także model wykrywający emocje użytkowników; w jednym przypadku słuchał oddechu dyrektora i zachęcał go do uspokojenia.
„Nie jesteś odkurzaczem!” żeński głos ChatGPT (który brzmi niezwykle podobnie do cyfrowego towarzysza z głosem Scarlett Johansson z filmu „Her” z 2013 roku) żartobliwie powiedział pracownikowi.
ChatGPT mógł także prowadzić rozmowy w wielu językach, tłumacząc i odpowiadając automatycznie. Według OpenAI narzędzie obsługuje obecnie ponad 50 języków.
„Nowy tryb głosu (i wideo) to najlepszy interfejs komputerowy, jakiego kiedykolwiek używałem” – powiedział dyrektor generalny OpenAI Sam Altman w wywiadzie dla post na blogu po ogłoszeniu. „Wygląda jak sztuczna inteligencja z filmów; i nadal trochę mnie zaskakuje, że to prawda. Uzyskanie czasu reakcji i ekspresji na poziomie ludzkim okazuje się dużą zmianą”.
Murati powiedział, że OpenAI uruchomi aplikację komputerową ChatGPT z możliwościami GPT-4o, zapewniając użytkownikom kolejną platformę do interakcji z technologią firmy. GPT-4o będzie także dostępne dla programistów chcących zbudować własne, niestandardowe chatboty ze sklepu GPT OpenAI, a funkcja ta będzie teraz dostępna także dla użytkowników, którzy nie płacą.
Zaktualizowana technologia i funkcje zostaną wprowadzone w ChatGPT w nadchodzących miesiącach. Użytkownicy bezpłatnego ChatGPT będą mieli ograniczoną liczbę interakcji z nowym modelem GPT-4o, zanim narzędzie automatycznie powróci do polegania na starym modelu GPT-3.5; płatni użytkownicy będą mieli dostęp do większej liczby wiadomości dzięki najnowszemu modelowi.
OpenAI twierdzi, że ponad 100 milionów ludzi korzysta już z ChatGPT. Jednak zaktualizowana funkcja ChatGPT — oraz możliwość interakcji z nią na komputerze stacjonarnym i dzięki ulepszonym rozmowom głosowym — może dać jeszcze większej liczbie osób powód do korzystania z tej technologii. Posunięcia te pojawiają się w momencie, gdy integracja sztucznej inteligencji z szerzej używanymi produktami konsumenckimi Google i Meta, takimi jak Instagram i Asystent Google, może sprawić, że technologia tych firm będzie szerzej i łatwiej dostępna.
Ta historia została zaktualizowana o dodatkowe wydarzenia i kontekst.