Multimodalny asystent cyfrowy OpenAI może wkrótce zostać uruchomiony

Edgar Cervantes / Autorytet Androida

TL;DR

  • W poniedziałek OpenAI organizuje wydarzenie, na którym może zostać ogłoszona informacja o nowym multimodalnym asystencie cyfrowym.
  • Multimodalność umożliwiłaby asystentowi używanie obrazów do podpowiedzi, takich jak identyfikacja i tłumaczenie znaku w świecie rzeczywistym.
  • Stanowiłoby to bezpośrednie zagrożenie dla cyfrowych asystentów Google’a, czyli Asystenta Google i nowszego Gemini.

W ciągu ostatnich kilku tygodni krążyły plotki sugerujące, że OpenAI — firma odpowiedzialna za CzatGPT — mogłaby wkrótce uruchomić wyszukiwarkę opartą na sztucznej inteligencji, co stanowiłoby bezpośrednie zagrożenie dla podstawowej działalności Google. Biorąc pod uwagę popularność ChatGPT w tak krótkim czasie, stanowiłoby to pierwsze realne zagrożenie dla wyszukiwarki Google od dziesięcioleci.

Jednak wydaje się mniej prawdopodobne, że OpenAI będzie mieć w drodze wyszukiwarkę (via Informacja). Zamiast tego nowe plotki sugerują, że podczas zaplanowanego na poniedziałek wydarzenia OpenAI firma może ogłosić multimodalnego asystenta cyfrowego. Chociaż nie jest to tradycyjna wyszukiwarka, nadal umożliwiałaby wyszukiwanie rzeczy przy użyciu mocy sztucznej inteligencji, więc nadal stanowiłaby poważne zagrożenie dla Google.

Multimodalność oznacza, że ​​sztuczna inteligencja może obsługiwać wiele formularzy wejściowych, a nie tylko tekst. W przypadku tego rzekomo cyfrowego asystenta byłby on w stanie połączyć się z kamerą, przetwarzać informacje ze świata rzeczywistego, a następnie przekazać Ci więcej informacji na temat tego, co widzi. Możesz na przykład skierować kamerę na znak w innym języku i poprosić ChatGPT o zidentyfikowanie i przetłumaczenie znaku, a sztuczna inteligencja przemówi do Ciebie w odpowiedzi.

Jeśli to brzmi znajomo, to dlatego, że jest to już coś, co robią Google Lens, Google Assistant, a ostatnio Google Gemini. W rzeczywistości ChatGPT również może to już zrobić, ale nie za pośrednictwem jednego interfejsu. Innymi słowy, poniedziałkowa premiera może oznaczać ogłoszenie przez firmę ulepszonego modelu GPT, który zapewnia szybsze i dokładniejsze odpowiedzi, zarówno za pomocą obrazu, jak i odpowiedzi dźwiękowych umieszczonych w aplikacji. Innymi słowy bezpośredni konkurent Gemini (a później Asystenta Google i Siri firmy Apple).

Żeby było jasne, prawie na pewno nie będzie to GPT-5, długo oczekiwana kontynuacja GPT-4 i GPT-4 Turbo. Firma poinformowała, że ​​GPT-5 nie pojawi się na tym wydarzeniu. Informacja sugeruje, że wyląduje dopiero pod koniec 2024 roku.

Masz wskazówkę? Mów do nas! Wyślij e-mail do naszego personelu na adres news@androidauthority.com. Możesz zachować anonimowość lub uzyskać uznanie za informacje, to Twój wybór.

Możesz lubić

źródło