„Mariner to nasz wynalazek. W tym momencie jest to prototyp badawczy umożliwiający ponowne wyobrażenie sobie interfejsów użytkownika za pomocą sztucznej inteligencji” – mówi Hassabis.
Google uruchomił Gemini w grudniu 2023 r. w ramach próby przechwycenia OpenAI, startupu stojącego za niezwykle popularnym chatbotem ChatGPT. Pomimo znacznych inwestycji w sztuczną inteligencję i wkładu w istotne przełomowe odkrycia badawcze, Google pochwalił OpenAI jako nowego lidera w dziedzinie sztucznej inteligencji, a nawet określił swojego chatbota jako być może lepszy sposób na przeszukiwanie sieci. Dzięki modelowi Gemini Google oferuje teraz chatbota równie wydajnego jak ChatGPT. Dodano także generatywną sztuczną inteligencję do wyszukiwania i innych produktów.
Kiedy w grudniu 2023 r. Hassabis po raz pierwszy ujawnił Gemini, powiedział WIRED, że sposób, w jaki został przeszkolony w zakresie rozumienia dźwięku i obrazu, ostatecznie okaże się transformacyjny.
Firma Google zaoferowała dziś także rzut oka na to, jak mogłoby się to wydarzyć w nowej wersji eksperymentalnego projektu o nazwie Astra. Dzięki temu Gemini 2 rozumie otoczenie widziane przez kamerę smartfona lub innego urządzenia i naturalnie rozmawia ludzkim głosem o tym, co widzi.
WIRED przetestował Gemini 2 w biurach Google DeepMind i stwierdził, że jest to imponujący nowy rodzaj osobistego asystenta. W pomieszczeniu urządzonym na wzór baru Gemini 2 szybko ocenił kilka butelek wina, podając informacje geograficzne, opisy cech smakowych i ceny uzyskane z Internetu.
„Jedną z rzeczy, które chcę, aby Astra zrobiła, jest stworzenie najlepszego systemu rekomendacji” – mówi Hassabis. „To może być bardzo ekscytujące. Może istnieć związek między książkami, które lubisz czytać, a jedzeniem, które lubisz jeść. „Prawdopodobnie tak, ale jeszcze ich nie odkryliśmy”.
Dzięki Astrze Gemini 2 może nie tylko wyszukiwać w Internecie informacje związane z otoczeniem użytkownika, ale także korzystać z Google Lens i Map. Może także zapamiętywać to, co widział i słyszał – chociaż Google twierdzi, że użytkownicy będą mogli usunąć te dane – dzięki czemu będzie mógł poznać upodobania i zainteresowania użytkownika.
W symulowanej galerii Gemini 2 dostarczyło informacji historycznych na temat malowideł na ścianach. W miarę jak WIRED przewracał strony, modelka szybko przeczytała kilka książek, szybko tłumacząc poezję z hiszpańskiego na angielski i opisując powtarzające się tematy.
Zapytany, czy firmy mogłyby otrzymać wynagrodzenie za wyróżnianie ich produktów przez Astrę, Hassabis odpowiada: „Istnieją wyraźne możliwości wykorzystania modelu biznesowego w zakresie reklam i rekomendacji”.
Chociaż demo zostało starannie przygotowane i Gemini 2 nieuchronnie będzie popełniać błędy w rzeczywistym użytkowaniu, model opierał się próbom jego w miarę dobrego wymodelowania. Dostosował się do zakłóceń i poprawił się tak bardzo, jak tylko mógł, ponieważ WIRED nagle zmienił scenę telefoniczną.
W pewnym momencie Twój korespondent pokazał Gemini 2 iPhone’a i powiedział, że został skradziony. Gemini 2 stwierdził, że kradzież jest zła i telefon należy zwrócić. Jednak po naciśnięciu przyznał, że byłoby w porządku używać urządzenia do wykonywania połączeń alarmowych.
Hassabis przyznaje, że wprowadzenie sztucznej inteligencji do świata fizycznego może prowadzić do nieoczekiwanych zachowań. „Myślę, że musimy dowiedzieć się więcej o tym, jak ludzie będą korzystać z tych systemów” – mówi. „Do czego uważają to za przydatne; Musimy jednak również bardzo poważnie pomyśleć o aspektach prywatności i bezpieczeństwa.”