Dołącz do naszych codziennych i cotygodniowych biuletynów, aby otrzymywać najnowsze aktualizacje i ekskluzywne treści na temat wiodącego w branży zakresu sztucznej inteligencji. dowiedz się więcej


Google po cichu wydała poważną aktualizację swojego popularnego modelu sztucznej inteligencji Gemini, która teraz wyjaśnia proces rozumowania, ustanawia nowe rekordy wydajności w zadaniach matematycznych i naukowych oraz oferuje bezpłatną alternatywę dla usług premium OpenAI.

Nowy Model myślenia Flash Gemini 2.0wydany we wtorek Studio sztucznej inteligencji Google Pod eksperymentalnym oznaczeniem „EXP-01-21Zdobył 73,3% w „” Amerykański egzamin z matematyki zapraszany (AIME) i 74,2% Diament GPQA Punkt odniesienia w nauce. Wyniki te pokazują wyraźną poprawę w porównaniu z wcześniejszymi modelami sztucznej inteligencji i pokazują rosnącą siłę Google w zakresie zaawansowanego rozumowania.

„Od ponad dekady jesteśmy pionierami tego typu systemów planowania, zaczynając od programów takich jak AlphaGo, i ekscytujące jest obserwowanie potężnego połączenia tych pomysłów z najbardziej wydajnym modelem Foundation” – napisał. Demisa HassabisaDyrektor generalny Google DeepMind w poście na X.com (dawniej Twitter).

Gemini 2.0 Flash Thinking bije rekord dzięki przetwarzaniu miliona tokenów

Najbardziej uderzającą cechą modelu jest jego zdolność do przetworzenia do miliona tokenów tekstu – pięć razy więcej niż Model o1 pro OpenAI – Przy zachowaniu szybkiego czasu reakcji. To rozszerzone okno kontekstowe umożliwia modelom jednoczesne analizowanie wielu artykułów naukowych lub kompleksowych zbiorów danych, co może zmienić sposób, w jaki badacze i analitycy pracują z dużymi ilościami informacji.

„W ramach pierwszego eksperymentu wziąłem różne teksty religijne i filozoficzne i poprosiłem Gemini 2.0 Flash Thinking o splecie ich w jedną całość, wydobycie nowatorskich i unikalnych spostrzeżeń”. i marszBadacz sztucznej inteligencji, który testował model, powiedział w: Opublikuj na X.com„Łącznie przetworzył 970 000 tokenów. Wynik jest dość niesamowity.

To wydanie pojawia się w krytycznym momencie rozwoju branży AI. OpenAI niedawno to ogłosiło model o3Który osiągnął wynik 87,7% w benchmarku GPQA Diamond. Jednak decyzja Google o udostępnieniu swojego modelu za darmo podczas testów beta (z limitami użytkowania) może przyciągnąć programistów i przedsiębiorstwa poszukujące alternatywy. Miesięczna subskrypcja OpenAI o wartości 200 USD,

Wyniki testów porównawczych pokazują, że najnowszy model myślenia Google Gemini 2.0 Flash znacznie przewyższa poprzednie wersje w zadaniach matematycznych, ścisłych i logicznych. (Źródło: Google DeepMind)

Google oferuje bezpłatne Gemini 2.0 Flash Thinking z wbudowanym wykonaniem kodu

Jeff DeanGłówny naukowiec Google DeepMind podkreślił poprawę niezawodności modelu: „Kontynuujemy iteracje z większą niezawodnością i mniejszą liczbą sprzeczności między pomysłami modelu a ostatecznymi odpowiedziami”. on napisał,

Model obejmuje również natywne możliwości wykonywania kodu, umożliwiając programistom uruchamianie i testowanie kodu bezpośrednio w systemie. Ta funkcja, wraz z ulepszonymi środkami ochrony antymonopolowej, czyni Gemini 2.0 Flash Thinking poważnym konkurentem zarówno w zastosowaniach badawczych, jak i komercyjnych.

Analitycy branżowi twierdzą, że skupienie się Google na wyjaśnianiu procesu rozumowania może pomóc rozwiać rosnące obawy dotyczące przejrzystości i wiarygodności sztucznej inteligencji. W odróżnieniu od tradycyjnych modeli „czarnych skrzynek”, Gemini 2.0 Flash Thinking pokazuje swoją pracę, ułatwiając użytkownikom zrozumienie i weryfikację ustaleń.

Przejrzystość sztucznej inteligencji staje się nowym polem bitwy, gdy Google rzuca wyzwanie OpenAI

Modelka już zdobyła pierwsze miejsce Tablica liderów Chatbot ArenaWiodący punkt odniesienia w zakresie wydajności sztucznej inteligencji, wiodący w kategoriach obejmujących twarde podpowiedzi, kodowanie i kreatywne pisanie.

Pozostają jednak pytania dotyczące wydajności i ograniczeń modelu w świecie rzeczywistym. Chociaż wyniki testów porównawczych dostarczają cennych wskaźników, nie zawsze przekładają się one bezpośrednio na praktyczne zastosowania. Wyzwaniem Google będzie przekonanie klientów korporacyjnych, że jego bezpłatna oferta może równać się lub przewyższać możliwości opcji premium.

W miarę nasilania się wyścigu zbrojeń AI najnowsza wersja Google sugeruje zmianę strategii: połączenie zaawansowanych możliwości z dostępnością. Czas pokaże, czy takie podejście pomoże wypełnić lukę w stosunku do OpenAI, ale z pewnością daje decydentom technologicznym ważny powód do ponownego przemyślenia swoich partnerstw w zakresie sztucznej inteligencji.

Na razie jedno jest jasne: nadeszła era sztucznej inteligencji, która może pokazać swoje działanie i jest dostępna dla każdego, kto posiada konto Google.


Source link