Agenci AI obiecują połączyć kropki między rzeczywistością a science-fiction

Jeśli dostroiłeś się do We/wy Google, Wiosenna aktualizacja OpenAILub Kompilacja Microsoftu w tym miesiącu prawdopodobnie słyszałeś, że termin „agenci AI” pojawiał się dość często w ostatnim miesiącu. Szybko stają się kolejną wielką rzeczą w technologii, ale czym właściwie są? I dlaczego nagle wszyscy o nich mówią?

Dyrektor generalny Google, Sundar Pichai, opisał system sztucznej inteligencji, który mógłby to zrobić zwrócić parę butów w Twoim imieniu na scenie podczas Google I/O. W Microsoft firma ogłosiła systemy Copilot AI, które mogłyby samodzielnie działać jak wirtualni pracownicy. Tymczasem OpenAI zaprezentowało system sztucznej inteligencji GPT-4 Omni, który widzi, słyszy i mówi. Wcześniej dyrektor generalny OpenAI Sam Altman powiedział to MIT Technology pomocni agenci kryją w sobie największy potencjał tej technologii. Tego typu systemy stanowią nowe standardy, które wszystkie firmy zajmujące się sztuczną inteligencją starają się osiągnąć, ale łatwiej to powiedzieć, niż zrobić.

Mówiąc najprościej, agenci AI to tylko modele AI, które robią coś niezależnie. To tak jak z Jarvisem Człowiek z żelazaSmoły z Interstaler, lub HAL 9000 od Odyseja kosmiczna. Idą o krok dalej niż tylko tworzenie odpowiedzi takiej jak chatboty, które znamy – jest działanie. Na początek Google, Microsoft i OpenAI próbują opracować agentów, którzy będą w stanie poradzić sobie z działaniami cyfrowymi. Oznacza to, że uczą agentów AI pracy z różnymi interfejsami API na Twoim komputerze. W idealnym przypadku mogą naciskać przyciski, podejmować decyzje, autonomicznie monitorować kanały i wysyłać żądania.

„Zgadzam się, że przyszłość to agenci” – powiedział założyciel i dyrektor generalny Echo AI Alexander Kvamme. Jego firma tworzy agentów AI, którzy analizują rozmowy firmy z klientami i dostarczają wskazówek, jak poprawić tę jakość. „Branża mówi o tym od lat, ale jeszcze się to nie zmaterializowało. To po prostu bardzo trudny problem.

Kvamme twierdzi, że prawdziwie agentowy system musi niezależnie podejmować dziesiątki lub setki decyzji, co jest trudne do zautomatyzowania. Aby na przykład zwrócić parę butów, jak wyjaśnił Pichai z Google, agent sztucznej inteligencji może być zmuszony do zeskanowania Twojego e-maila w celu wyszukania potwierdzenia, pobrania numeru zamówienia i adresu, wypełnienia formularza zwrotu i podjęcia różnych działań w Twoim imieniu. W tym procesie jest wiele decyzji, o których nawet nie myślisz, ale podejmujesz je podświadomie.

Jak widzieliśmy, duże modele językowe (LLM) nie są doskonałe nawet w kontrolowanych środowiskach. Nową ulubioną rzeczą Altmana jest wywoływanie ChatGPT „niezwykle głupi” i nie do końca się myli. Kiedy prosisz menedżerów LLM o niezależną pracę w otwartym Internecie, są oni podatni na błędy. Ale nad tym pracują niezliczone start-upy, w tym Echo AI, a także większe firmy, takie jak Google, OpenAI i Microsoft.

Jeśli możesz tworzyć agentów cyfrowo, nie ma większych przeszkód w tworzeniu agentów, którzy współpracują również ze światem fizycznym. Wystarczy zaprogramować to zadanie robotowi. Wtedy naprawdę wkraczasz w klimat science fiction, ponieważ agenci sztucznej inteligencji oferują potencjał przydzielania robotom zadań takich jak „przyjęcie zamówienia z tego stołu” lub „montaż wszystkich gontów na tym dachu”. Daleko nam do tego, ale pierwszym krokiem jest nauczenie agentów AI wykonywania prostych zadań cyfrowych.

W świecie agentów AI często mówi się o problemie: upewnienie się, że nie projektujesz agenta do wykonania zadania zbyt Dobrze. Jeśli utworzyłeś agenta zajmującego się zwrotem butów, musisz upewnić się, że nie zwróci on wszystkich butów lub być może wszystkich rzeczy, na które masz rachunki w skrzynce odbiorczej Gmaila. Choć brzmi to głupio, istnieje niewielka, ale głośna grupa badaczy sztucznej inteligencji, którzy martwią się, że nadmiernie zdeterminowani agenci sztucznej inteligencji mogą zwiastować zagładę ludzkiej cywilizacji. Przypuszczam, że gdy tworzysz materiał science fiction, jest to uzasadniona obawa.

Po drugiej stronie spektrum są optymiści, tacy jak Echo AI, którzy wierzą, że ta technologia wzmocni pozycję. Ta rozbieżność w społeczności AI jest dość wyraźna, ale optymiści widzą wyzwalający efekt agentów AI porównywalny z komputerem osobistym.

„Jestem głęboko przekonany, że duża część pracy, którą (agenci) rozwiążą, to praca, której ludzie woleliby nie wykonywać” – powiedział Kvemme. „Istnieje większa wartość wykorzystania czasu w ich życiu. Ale znowu muszą się dostosować. ”

Innym przypadkiem użycia agentów AI są samochody autonomiczne. Tesla i Waymo są obecnie liderami w tej technologii, w której samochody wykorzystują technologię sztucznej inteligencji do poruszania się po ulicach miast i autostradach. Choć jest to nisza, technologie autonomiczne to dość rozwinięty obszar agentów AI, w którym sztuczną inteligencję można już zaobserwować w realnym świecie.

Co zatem doprowadzi nas do przyszłości, w której sztuczna inteligencja może zwrócić Twoje buty? Po pierwsze, podstawowe modele sztucznej inteligencji prawdopodobnie będą musiały stać się lepsze i dokładniejsze. Oznacza to, że aktualizacje ChatGPT, Gemini i Copilot prawdopodobnie poprzedzą w pełni funkcjonujące systemy agentów. Chatboty AI wciąż muszą pokonać swoje ogromne możliwości problem halucynacjina rozwiązanie których wielu badaczy nie widzi odpowiedzi. Konieczne są jednak także aktualizacje samych systemów agentów. Obecnie sklep GPT OpenAI jest najbardziej przemyślanym przedsięwzięciem w zakresie rozwoju sieci agentów, ale nawet to nie jest jeszcze zbyt zaawansowane.

Chociaż zaawansowanych agentów AI zdecydowanie jeszcze nie ma, taki jest obecnie cel wielu dużych i małych firm zajmujących się sztuczną inteligencją. To może sprawić, że sztuczna inteligencja będzie znacznie bardziej użyteczna w naszym codziennym życiu. Choć brzmi to jak science fiction, wydaje się miliardy dolarów, aby agenci urzeczywistnili się za naszego życia. Jest to jednak duża obietnica dla firm zajmujących się sztuczną inteligencją, które miały trudności ze skłonieniem chatbotów do niezawodnego odpowiadania na podstawowe pytania.

źródło