Google I/O 2024: wszystko ogłoszone

Właśnie zakończyły się prace we/wy Google — wypełnione ogłoszeniami dotyczącymi sztucznej inteligencji. Zgodnie z oczekiwaniami wydarzenie skupiało się głównie na modelach AI Gemini firmy Google oraz sposobach ich integracji z aplikacjami takimi jak Workspace i Chrome.

Jeśli nie dotarłeś dołącz do wydarzenia na żywomożesz śledzić najnowsze informacje od Google w podsumowaniu poniżej.

Obiektyw Google umożliwia teraz wyszukiwanie poprzez nagranie wideo

Obiektyw Google umożliwia już wyszukiwanie czegoś na podstawie obrazów, ale teraz Google idzie o krok dalej, oferując możliwość wyszukiwania za pomocą wideo. Oznacza to, że możesz nagrać film przedstawiający coś, czego chcesz szukać, zadać pytanie w trakcie filmu, a sztuczna inteligencja Google spróbuje pobrać odpowiednie odpowiedzi z Internetu.

Gemini odpowie na pytania dotyczące Twojej biblioteki zdjęć

Tego lata Google wprowadza nową funkcję, która może być dobrodziejstwem dla niemal każdego, kto ma lata – a nawet ponad dekadę – zdjęć do przeglądania. „Zapytaj zdjęcia” pozwala Gemini przeglądać bibliotekę Zdjęć Google w odpowiedzi na Twoje pytania, a funkcja ta wykracza poza zwykłe przeglądanie zdjęć psów i kotów. Dyrektor generalny Sundar Pichai zademonstrował to, pytając Gemini, jaki jest jego numer rejestracyjny. Odpowiedzią był sam numer, a następnie jego zdjęcie, aby mógł się upewnić, że jest prawidłowy.

Flagowy model Google Gemini staje się szybszy i ma większe możliwości

Google wprowadził do swojej oferty nowy model AI: Gemini 1.5 Flash. Nowy model multimodalny jest tak samo wydajny jak Gemini 1.5 Pro, ale jest zoptymalizowany pod kątem „wąskich zadań o wysokiej częstotliwości i małych opóźnieniach”. Dzięki temu lepiej radzi sobie z szybkimi reakcjami. Google wprowadził także pewne zmiany w Gemini 1.5, które według niego poprawią jego zdolność do tłumaczenia, rozumowania i kodowania. Google twierdzi również, że tak podwojono okno kontekstowe Gemini 1.5 Pro (ile informacji może pomieścić) od 1 miliona do 2 milionów tokenów.

Gemini dołącza do użytkowników w Workspace

Gemini podsumowuje nagranie z Google Meet.
Zrzut ekranu: YouTube

Google wprowadza swój najnowszy model języka głównego nurtu, Gemini 1.5 Pro, na pasek boczny Dokumentów, Arkuszy, Prezentacji, Dysku i Gmaila. Kiedy w przyszłym miesiącu zostanie udostępniona płatnym subskrybentom, stanie się bardziej uniwersalnym asystentem w Workspace, który może pobierać informacje z dowolnej zawartości Twojego Dysku, niezależnie od tego, gdzie się znajdujesz. Będzie także w stanie wykonywać różne czynności za Ciebie, na przykład pisać e-maile zawierające informacje z aktualnie przeglądanego dokumentu lub przypominać Ci później o konieczności odpowiedzi na przeglądaną wiadomość e-mail. Niektórzy pierwsi testerzy mają już dostęp do tych funkcji, ale Google twierdzi, że w przyszłym miesiącu udostępnią je wszystkim płatnym subskrybentom Gemini.

Projekt Astra należy do Google Gwiezdny Trek Przyszła sztuczna inteligencja

Project Astra Google to multimodalny asystent AI, który ma nadzieję stać się wirtualnym asystentem do wszystkiego, który może oglądać i rozumieć to, co widzi przez kamerę urządzenia, zapamiętywać, gdzie są Twoje rzeczy i robić wszystko za Ciebie. Obsługuje wiele najbardziej imponujących dem z I/O w tym roku, a celem firmy jest bycie uczciwym agentem sztucznej inteligencji, który nie może tylko z Tobą rozmawiać, ale także faktycznie robi wszystko w Twoim imieniu.

Veo umożliwia twórcom generowanie wideo w stylu Sora

Próbka wyników Veo.
Obraz: Google

Odpowiedzią Google na Sora OpenAI jest nowy generatywny model sztucznej inteligencji, który może generować wideo w rozdzielczości 1080p na podstawie tekstu, obrazu i podpowiedzi wideo. Filmy można tworzyć w różnych stylach, takich jak zdjęcia lotnicze lub filmy poklatkowe, i można je modyfikować za pomocą większej liczby podpowiedzi. Firma oferuje już rozwiązanie Veo niektórym twórcom do wykorzystania w filmach na YouTube, ale proponuje je także Hollywoodowi w celu wykorzystania go w filmach.

Klejnoty umożliwiają tworzenie niestandardowych chatbotów w Gemini

Google wprowadza niestandardowego kreatora chatbota o nazwie Gems. Podobnie jak GPT OpenAI, Gems pozwala użytkownikom wydawać Gemini instrukcje, aby dostosować sposób, w jaki będzie reagował i w czym się specjalizuje. Jeśli chcesz, aby był to pozytywny i natarczywy trener biegania z codziennymi motywacjami i planami biegowymi – czyli moim najgorszym koszmarem – to jesteś wkrótce będziesz mógł to zrobić (jeśli jesteś abonentem Gemini Advanced).

Bliźnięta stają się lepszym partnerem do rozmów

Nowa funkcja Gemini Live ma na celu sprawienie, aby rozmowy głosowe z Gemini były bardziej naturalne. Głos chatbota zostanie dodany dodatkowej osobowości, a użytkownicy będą mogli przerwać mu w połowie zdania lub poprosić go, aby patrzył przez kamerę w smartfonie i przekazywał informacje o tym, co widzi w czasie rzeczywistym. Bliźnięta też uzyskanie nowych integracji które pozwalają mu aktualizować lub pobierać informacje z Kalendarza Google, Zadań i Keep, korzystając w tym celu z funkcji multimodalnych (takich jak dodawanie szczegółów z ulotki do osobistego kalendarza).

Circle to Search może teraz pomóc w rozwiązywaniu problemów matematycznych

Jeśli korzystasz z telefonu lub tabletu z Androidem, możesz teraz zakreślić problem matematyczny na ekranie i uzyskać pomoc w jego rozwiązaniu. Sztuczna inteligencja Google nie rozwiąże za Ciebie problemu – więc nie pomoże uczniom ściągać w pracy domowej – ale podzieli go na kroki, które powinny ułatwić jego wykonanie.

Wyszukiwarka Google przechodzi modernizację AI

W tym tygodniu Google wprowadzi „Przegląd sztucznej inteligencji” – wcześniej znany jako „Doświadczenie generatywne w wyszukiwaniu” – wszystkim mieszkańcom Stanów Zjednoczonych. Teraz „specjalistyczny” model Gemini zaprojektuje i zapełni strony wyników podsumowaniami odpowiedzi z Internetu (podobnie do tego, co widzisz w narzędziach wyszukiwania AI, takich jak Perplexity lub Arc Search).

Android wykrywa oszustwa oparte na sztucznej inteligencji

Google twierdzi, że korzystając z inteligentnych rozwiązań Gemini Nano AI na urządzeniach, telefony z Androidem będą w stanie pomóc Ci uniknąć oszustw, wyszukując czerwone flagi, takie jak typowe wzorce rozmów oszustów, a następnie wyświetlając ostrzeżenia w czasie rzeczywistym, takie jak to powyżej. Firma obiecuje udostępnić więcej szczegółów na temat tej funkcji jeszcze w tym roku.

Urządzenia z Androidem wkrótce otrzymają inteligentniejszą sztuczną inteligencję

Google twierdzi, że wkrótce Gemini będzie mogło zadawać użytkownikom pytania dotyczące filmów wyświetlanych na ekranie i odpowiadać na nie w oparciu o automatyczne napisy. W przypadku płatnych użytkowników Gemini Advanced może także przyjmować pliki PDF i oferować informacje. Te i inne aktualizacje multimodalne dla Gemini na Androida pojawią się w ciągu najbliższych kilku miesięcy.

Google Chrome otrzymuje asystenta AI

Google ogłosił, że doda Gemini Nano, lekką wersję swojego modelu Gemini, do przeglądarki Chrome na komputerze. Wbudowany asystent wykorzysta sztuczną inteligencję urządzenia, aby pomóc Ci wygenerować tekst do postów w mediach społecznościowych, recenzji produktów i nie tylko bezpośrednio w przeglądarce Google Chrome.

Google ulepsza swój znak wodny SynthID AI

Google twierdzi, że rozszerza możliwości SynthID — twierdzi, że będzie osadzać znak wodny w treściach tworzonych za pomocą nowego generatora wideo Veo i że teraz może także wykrywać filmy generowane przez sztuczną inteligencję.

Aktualizacja, 14 maja: Dodano opcję „Zapytaj o zdjęcia”.

źródło