Dołącz do naszych codziennych i cotygodniowych biuletynów, aby otrzymywać najnowsze aktualizacje i ekskluzywne treści na temat wiodącego w branży zakresu sztucznej inteligencji. dowiedz się więcej
Pod każdym względem rok 2024 był najlepszym rokiem w historii sztucznej inteligencji – przynajmniej jeśli chodzi o komercjalizację tej technologii.
Boom na duże modele językowe (LLM), napędzany uruchomieniem ChatGPT pod koniec 2022 r., nie wykazuje oznak spowolnienia, a kilka nowych modeli LLM jest wprowadzanych nie tylko przez OpenAI i gigantów technologicznych, takich jak Microsoft, Meta i Google, ale także wiele innych startupów . zostały zrobione. i indywidualni programiści.
Doniesienia o spowolnieniu badań nad sztuczną inteligencją, jeśli nie bezpodstawne, z pewnością okazały się na razie przesadzone.
Ponadto zaczęły pojawiać się nowe technologie wykraczające poza architekturę Transformer, która leży u podstaw większości dużych LLM, takie jak model Liquid Foundation firmy Liquid AI.
I wreszcie, firmy zaczęły w pełni przyjmować „agentowe” podejście do sztucznej inteligencji – opracowując wyspecjalizowane boty, aplikacje i przepływy pracy oparte na sztucznej inteligencji, które mogą pracować niezależnie nad konkretnymi problemami, zamiast chatbotów LLM, które mogą działać pod mniejszym przywództwem człowieka. ,
Zawężenie tegorocznych wiadomości do Top 14, a tym bardziej do Top 10 czy Top 4, było trudnym przedsięwzięciem. Ale poszedłem dalej i próbowałem trochę oszukać, łącząc kilka historii w większe tematy. Moim zdaniem oto największe efekty tego roku:
1. OpenAI wykracza daleko poza ChatGPT
Firma, być może najbardziej odpowiedzialna za zapoczątkowanie ery Generacji AI, nie poniosła w tym roku żadnych porażek, pomimo konkurencji ze strony zarówno nowych, jak i starych technologii, nawet ze strony własnego inwestora i partnera, firmy Microsoft.
model o1: OpenAI wypuściło swoją pierwszą nową rodzinę dużych modeli ogólnego przeznaczenia poza serią GPT, serię O1 „Logic”, która przeznacza więcej czasu na przetwarzanie złożonych sygnałów, co skutkuje większą dokładnością. Jest szczególnie skuteczny w zadaniach naukowych, kodowaniu i logice.
model o3: Nastąpiło to po modelu O1 z września i hitowym ogłoszeniu eOne pod koniec roku bardziej zaawansowane model o3. Choć nie będzie dostępny publicznie ani nawet dla osób trzecich aż do początków 2025 roku, pokazuje, że OpenAI nie spoczywa na laurach.
wyszukiwanie chatgpt: Ta funkcja, początkowo wprowadzona jako samodzielny produkt dostępny tylko na zaproszenie, o nazwie SearchGPT, a następnie skrócona do ChatGPT, umożliwia wyszukiwanie informacji internetowych w czasie rzeczywistym i wyrafinowaną prezentację wyników wyszukiwania w ramach ChatGPT, co zwiększa jej użyteczność w zakresie aktualności . Zadawanie pytań i bezpośrednia rywalizacja z Google, Bingiem i nowicjuszem Perplexity.
płótno: Wprowadzony w październiku, Canvas rozszerza interfejs ChatGPIT poza konwersacje do panelu przypominającego stację roboczą, który może dynamicznie aktualizować zawartość na żądanie użytkownika, na przykład edytując dokument lub projekt kodowania. Oczywiście trudno było nie postrzegać tego jako odpowiedzi lub przynajmniej jako porównywalnej cechy artefaktów antropicznych ogłoszonych kilka miesięcy wcześniej.
Sora: Po drażnieniu nas swoim ściśle strzeżonym modelem generatora wideo przez prawie rok, OpenAI w końcu udostępniło Sorę publicznie na początku grudnia, szybko wywołując szeroką gamę reakcji, ponieważ ujawniło unikalny i próbował wyróżnić się na tle wysoce konkurencyjnego wideo AI przestrzeń z Unique. Przemyślany interfejs i funkcja tworzenia scenorysów.
2. Sztuczna inteligencja typu open source startuje
Lama 3 i 3.1: Meta wprowadziła Llamę 3 w kwietniu, ustanawiając nowy standard wydajności w sztucznej inteligencji typu open source, a następnie szybko poszła za nim, wypuszczając w lipcu Llamę 3.1 z 405 miliardami parametrów. Wersje Llama 3.1 zostały wykorzystane do zasilania Meta AI, asystenta firmy zintegrowanego z platformami takimi jak WhatsApp, Messenger, Instagram i Facebook, który ma stać się najpopularniejszym asystentem AI.
Lama 3.3: Wydana w grudniu 2024 r. wersja Llama 3.3 zapewnia wydajność porównywalną z większymi modelami, ale za ułamek kosztów obliczeniowych, dzięki czemu jest bardziej dostępna dla aplikacji korporacyjnych.
Tymczasem chińskie modele, takie jak rodzina Quen-2.5 Alibaba oraz nowe wersje DeepSeek v2.5 i R1-Lite, pojawiły się na szczytach niektórych rankingów testów porównawczych, a sama Nvidia dostarczyła karty graficzne i architekturę oprogramowania na potrzeby premiery. Otwarty kod źródłowy, potężny model Nemotron-70B.
Nous Research, mała organizacja z San Francisco, której celem jest oferowanie bardziej spersonalizowanych i mniej restrykcyjnych modeli sztucznej inteligencji w formie open source, również zaproponowała kilka nowych, fajnych pomysłów.
Nie zapominajmy też o francuskiej firmie Mistral, która szybko rozszerzyła swoją własną ofertę rozwiązań typu open source i zastrzeżoną sztuczną inteligencję.
3. Seria Gemini firmy Google staje się poważnym pretendentem do najlepszej dostępnej
W historii powrotu tego roku modele sztucznej inteligencji Google Gemini, niegdyś wyśmiewane za niezręczne generowanie obrazów i krytykowane za nadmierne „przebudzenie”, powróciły z nowymi, potężniejszymi wersjami, które obecnie zajmują czołowe miejsca w rankingach wydajności stron trzecich. I stają się coraz bardziej atrakcyjne dla deweloperów i przedsiębiorstw.
Firma Google wprowadziła Gemini 2.0 Flash, czyli multimodalny model sztucznej inteligencji, który obsługuje analizę strumieniowego wideo oraz może widzieć i kierować tym, co robisz na ekranie, a następnie Gemini 2.0 Flash Thinking, który konkuruje z modelami wnioskowania O1 i O3 OpenAI.
4. Agent AI wpływa na przedsiębiorstwo
W miarę upływu roku „agentowa” sztuczna inteligencja przekształciła się z modnego hasła w prawdziwą serię ogłoszeń i inicjatyw dotyczących najważniejszych produktów podejmowanych przez czołowych dostawców oprogramowania dla przedsiębiorstw. Weźmy na przykład:
AgentForce 2.0 firmy Salesforce:Salesforce kilka dni temu zaprezentowało AgentForce 2.0, zaawansowany program agenta oparty na sztucznej inteligencji, który ma ulepszyć ofertę CRM i sprzedażową, a także funkcje logiki, integracji i dostosowywania w Slacku, znacznie poprawiając narzędzia zwiększające produktywność przedsiębiorstwa.
Dżul SAP: Firma SAP przekształciła chatbota Juul w agenta AI opartego na dużych modelach językowych (LLM) typu open source, zwiększając innowacyjność i wydajność w przedsiębiorstwach.
Projekt Google Astra: w ramach inicjatywy Gemini 2.0 firma Google uruchomiła Project Astra, asystenta AI zaprojektowanego w celu zapewniania odpowiedzi kontekstowych w czasie rzeczywistym poprzez wykorzystanie pakietu usług Google, którego celem jest poprawa produktywności użytkowników i usprawnienie procesu decyzyjnego.
Moja wielka prognoza na rok 2025: treści generowane przez sztuczną inteligencję będą królować
W oparciu o te postępy przewiduje się, że w 2025 r. nastąpi rozprzestrzenianie się treści generowanych przez sztuczną inteligencję w domenach biznesowych i konsumenckich, zwłaszcza od OpenAI po Meta, Google, Microsoft, Apple, a nawet xAI Elona Muska. Każdy ma teraz generatory obrazów AI. Ofiara.
To rozszerzenie usprawni tworzenie treści, poprawi personalizację i zwiększy wydajność w różnych obszarach.
Ponadto przewidujemy wczesne wdrożenie na dużą skalę dużych modeli językowych (LLM) i generatywnej robotyki opartej na sztucznej inteligencji, zarówno w warunkach komercyjnych, jak i konsumenckich, co zrewolucjonizuje automatyzację i interakcje człowiek-robot.
To wszystko w ostatnim biuletynie #AIBeat z 2024 roku. Dziękujemy za czytanie, pisanie, subskrybowanie, udostępnianie, komentowanie i bycie tutaj z nami. Nie mogę się doczekać, aby podzielić się z wami czymś więcej i usłyszeć więcej od Was wszystkich w 2025 roku.
Od nas wszystkich w VentureBeat życzymy Tobie i Twoim bliskim Wesołych Świąt i Nowego Roku.
Source link