Dołącz do naszych codziennych i cotygodniowych biuletynów, aby otrzymywać najnowsze aktualizacje i ekskluzywne treści na temat wiodącego w branży zakresu sztucznej inteligencji. dowiedz się więcej
Nowa biała księga Google zatytułowana „agenci„, przewiduje przyszłość, w której sztuczna inteligencja będzie odgrywać bardziej aktywną i niezależną rolę w biznesie. Ten 42-stronicowy dokument został opublikowany bez żadnych fanfar we wrześniu aby przyciągnąć uwagę Na X.com (dawniej Twitter) i LinkedIn.
Wprowadza koncepcję agentów AI – systemów oprogramowania zaprojektowanych tak, aby wykraczać poza dzisiejsze modele AI poprzez rozumowanie, planowanie i podejmowanie działań w celu osiągnięcia określonych celów. W przeciwieństwie do tradycyjnych systemów AI, które generują odpowiedzi wyłącznie na podstawie istniejących danych szkoleniowych, agenci AI mogą wchodzić w interakcję z systemami zewnętrznymi, podejmować decyzje i samodzielnie wykonywać złożone zadania.
„Agenci są autonomiczni i mogą działać niezależnie od interwencji człowieka” – stwierdza biała księga, opisując ich jako systemy łączące logikę, rozumowanie i dostęp do danych w czasie rzeczywistym. Pomysł stojący za tymi agentami jest ambitny: mogą pomóc firmom w automatyzacji zadań, rozwiązywaniu problemów i podejmowaniu decyzji, które kiedyś były obsługiwane wyłącznie przez ludzi.
Autor artykułu, Julia Wisinger, Patricka MarlowaI Władimir VuskovicPrzedstaw szczegółowy opis działania agentów AI i tego, czego potrzebują, aby działać. Jednak jego szersze implikacje są równie ważne. Agenci AI to nie tylko ulepszenia istniejącej technologii; Reprezentują zmiany w sposobie, w jaki organizacje działają, konkurują i wprowadzają innowacje. Firmy, które wdrożą te systemy, mogą odnotować dramatyczny wzrost wydajności i produktywności, podczas gdy te, które się wahają, mogą mieć trudności z dotrzymaniem kroku.
Oto pięć najważniejszych wniosków z białej księgi Google i ich znaczenie dla przyszłości sztucznej inteligencji w biznesie.
1. Agenci AI to coś więcej niż tylko inteligentne modele
Google twierdzi, że agenci AI stanowią zasadnicze odejście od tradycyjnych modeli językowych. Chociaż modele wolą GPT-4o lub Google’a Bliźnięta Pomimo doskonałości w generowaniu odpowiedzi jednoobrotowych, ich ograniczenia wynikają z danych szkoleniowych. Natomiast agenci AI są projektowani do interakcji z systemami zewnętrznymi, uczenia się na podstawie danych w czasie rzeczywistym i wykonywania wieloetapowych zadań.
„Wiedza (w tradycyjnych modelach) ogranicza się do tego, co jest dostępne w danych szkoleniowych” – czytamy w artykule. „Agenci poszerzają tę wiedzę poprzez połączenia z systemami zewnętrznymi za pośrednictwem urządzeń.”
Ta różnica nie jest tylko teoretyczna. Wyobraź sobie tradycyjny model językowy, którego zadaniem jest rekomendowanie planu podróży. Może przedstawiać sugestie oparte na zdrowym rozsądku, ale nie ma możliwości rezerwowania lotów, sprawdzania dostępności hoteli ani dostosowywania swoich rekomendacji na podstawie opinii użytkowników. Jednak agent AI może zrobić to wszystko, łącząc informacje w czasie rzeczywistym z autonomicznym podejmowaniem decyzji.
Ta zmiana stawia agentów jako nowego typu cyfrowego pracownika, zdolnego do obsługi złożonych przepływów pracy. Dla firm może to oznaczać automatyzację zadań, które wcześniej wymagały wielu ról ludzkich. Integrując logikę i wykonanie, agenci mogą stać się niezbędni w różnych branżach, od logistyki po obsługę klienta.
2. Architektura kognitywna wspomaga proces podejmowania decyzji
Sercem możliwości agenta AI jest jego architektura kognitywna, którą Google opisuje jako strukturę rozumowania, planowania i podejmowania decyzji. Ta architektura nazywa się warstwa orkiestracyjnaUmożliwia agentom przetwarzanie informacji w cyklach, włączając nowe dane w celu udoskonalenia ich działań i decyzji.
Google porównuje ten proces do szefa kuchni przygotowującego jedzenie w ruchliwej kuchni. Szef kuchni zbiera składniki, bierze pod uwagę preferencje klienta i w razie potrzeby dostosowuje przepis w oparciu o opinie lub dostępność składników. Podobnie agent AI zbiera dane, uzasadnia swoje kolejne kroki i dostosowuje swoje działania, aby osiągnąć konkretny cel.
Warstwa orkiestracji opiera się na zaawansowanych technikach rozumowania, które pomagają w podejmowaniu decyzji. ramy jak Reakcja (rozumowanie i działanie), Łańcuch myślowy (COT)I Drzewo pomysłów (TOT) Zapewnij uporządkowane sposoby podziału złożonych zadań. Na przykład ReAct umożliwia agentowi rozumowanie i łączenie działań w czasie rzeczywistym, podczas gdy ToT pozwala mu badać wiele możliwych rozwiązań jednocześnie.
Technologie te dają agentom możliwość podejmowania decyzji, które są nie tylko reaktywne, ale także proaktywne. Według artykułu sprawia to, że są one bardzo elastyczne, umożliwiając zarządzanie niepewnością i złożonością w sposób niedostępny dla tradycyjnych modeli. Dla przedsiębiorstw oznacza to, że agenci mogą wykonywać takie zadania, jak rozwiązywanie problemów w łańcuchu dostaw lub analizowanie danych finansowych, zachowując poziom autonomii, który ogranicza potrzebę stałego nadzoru ze strony człowieka.
Tradycyjne modele sztucznej inteligencji są często opisywane jako posiadające „statyczne biblioteki wiedzy”, ograniczone do tego, w zakresie czego zostały przeszkolone. Z drugiej strony agenci AI mogą uzyskiwać dostęp do informacji w czasie rzeczywistym i wchodzić w interakcję z systemami zewnętrznymi za pomocą narzędzi. Dzięki tej możliwości są one praktyczne w zastosowaniach w świecie rzeczywistym.
„Narzędzia wypełniają lukę pomiędzy wewnętrznymi możliwościami agenta a światem zewnętrznym” – wyjaśnia artykuł. Narzędzia te obejmują interfejsy API, rozszerzenia i magazyny danych, które umożliwiają agentom uzyskiwanie informacji, wykonywanie zadań i pobieranie wiedzy ewoluującej w czasie.
Na przykład agent ds. planowania podróży służbowych może używać rozszerzeń API do sprawdzania rozkładów lotów, magazynu danych do pobierania zasad podróży oraz narzędzia mapującego do znajdowania pobliskich hoteli. Ta zdolność do dynamicznej interakcji z systemami zewnętrznymi przekształca agentów ze statycznych respondentów w aktywnych uczestników procesów biznesowych.
Google podkreśla także elastyczność tych narzędzi. Funkcje pozwalają na przykład programistom przenieść określone zadania na systemy po stronie klienta, dając firmom większą kontrolę nad sposobem, w jaki agenci uzyskują dostęp do wrażliwych danych lub wykonują określone operacje. Ta elastyczność może być niezbędna w branżach takich jak finanse i opieka zdrowotna, gdzie zgodność i bezpieczeństwo mają kluczowe znaczenie.
4. Generowanie usprawnione w zakresie wyszukiwania sprawia, że agenci są mądrzejsi
Jednym z najbardziej obiecujących postępów w projektowaniu agentów AI jest integracja Generacja wspomagana regeneracją (RAG)Technika ta umożliwia agentom wysyłanie zapytań do zewnętrznych źródeł danych – takich jak wektorowe bazy danych lub dokumenty strukturalne – gdy ich dane szkoleniowe są rzadkie.
„Magazyny danych rozwiązują to ograniczenie (modeli statycznych), zapewniając dostęp do bardziej dynamicznych i aktualnych informacji” – wyjaśnia artykuł, wyjaśniając, w jaki sposób agenci mogą pobierać odpowiednie dane w czasie rzeczywistym, aby opierać swoje odpowiedzi na informacjach opartych na faktach.
Agenci bazujący na RAG są szczególnie cenni w obszarach, w których informacje szybko się zmieniają. Na przykład w sektorze finansowym agent może otrzymywać dane rynkowe w czasie rzeczywistym przed wydaniem rekomendacji inwestycyjnych. W opiece zdrowotnej może wyszukać najnowsze badania w celu przedstawienia zaleceń klinicznych.
Podejście to rozwiązuje również utrzymujący się problem sztucznej inteligencji: halucynacje lub tworzenie fałszywych lub sfabrykowanych informacji. Opierając swoje odpowiedzi na danych ze świata rzeczywistego, agenci mogą poprawić dokładność i niezawodność, dzięki czemu lepiej nadają się do zastosowań wysokiego ryzyka.
Chociaż biała księga zawiera wiele szczegółów technicznych, zawiera także praktyczne wskazówki dla firm chcących wdrożyć agentów AI. Google wyróżnia dwie główne platformy: LangchenaStruktura open source do tworzenia agentów i Wierzchołkowa sztuczna inteligencjaZarządzana platforma do wdrażania agentów na dużą skalę.
Langchain upraszcza proces tworzenia agentów, umożliwiając programistom łączenie logicznych kroków i wywołań narzędzi. Tymczasem Vertex AI oferuje funkcje takie jak testowanie, debugowanie i ocena wydajności, ułatwiając wdrażanie agentów klasy produkcyjnej.
„Vertex pozwala programistom AI skoncentrować się na budowaniu i udoskonalaniu swoich agentów, podczas gdy złożonością infrastruktury, wdrażaniem i konserwacją zarządza sama platforma” – czytamy w artykule.
Narzędzia te obniżają barierę wejścia dla firm, które chcą eksperymentować z agentami AI, ale brakuje im rozległej wiedzy technicznej. Rodzą one jednak również pytania o długoterminowe konsekwencje powszechnego przyjęcia agentów. W miarę zwiększania się wydajności tych systemów firmy będą musiały rozważyć, w jaki sposób zrównoważyć wzrost wydajności z potencjalnymi zagrożeniami, takimi jak nadmierne poleganie na automatyzacji lub obawy etyczne dotyczące przejrzystości procesu decyzyjnego.
Co to znaczy
Google’a Biała księga na temat agentów AI To szeroka i ambitna wizja kierunku, w jakim zmierza sztuczna inteligencja. Dla przedsiębiorstw przekaz jest jasny: agenci AI to nie tylko koncepcja teoretyczna – to praktyczne narzędzie, które może zmienić sposób działania przedsiębiorstw.
Zmiana ta nie nastąpi jednak z dnia na dzień. Wdrażanie agentów AI wymaga starannego planowania, eksperymentowania i chęci ponownego przemyślenia tradycyjnych przepływów pracy. Jak stwierdzono w artykule, „nie ma dwóch identycznych agentów ze względu na generatywny charakter podstawowych modeli leżących u podstaw ich architektury”.
Na razie agenci AI stanowią zarówno szansę, jak i wyzwanie. Firmy, które inwestują w zrozumienie i wdrożenie tej technologii, mogą zyskać znaczne korzyści. Ci, którzy czekają, mogą znaleźć czas na nadrabianie zaległości w świecie, w którym coraz częściej działają inteligentne, autonomiczne systemy.
Source link