Dołącz do naszych codziennych i cotygodniowych biuletynów, aby otrzymywać najnowsze aktualizacje i ekskluzywne treści na temat wiodącego w branży zakresu sztucznej inteligencji. dowiedz się więcej


Microsoftu drugi pilot Stawać się mądrzejszym z dnia na dzień. Firma pod przewodnictwem Satyi Nadelli właśnie ogłosiła, że ​​jej asystent AI ma teraz możliwości „wizji”, które umożliwiają mu przeglądanie Internetu wraz z użytkownikami.

Chociaż tę funkcję po raz pierwszy ogłoszono w październiku tego roku, firma testuje ją obecnie z wybraną grupą klientów Pro. Według Microsoftu użytkownicy ci będą mogli uruchomić Copilot Vision na stronach internetowych otwieranych w przeglądarce Edge i wchodzić z nią w interakcję w zakresie treści widocznych na ekranie.

Ta funkcja jest wciąż na wczesnym etapie rozwoju i jest dość ograniczona, ale po jej pełnym rozwinięciu może okazać się przełomem dla klientów korporacyjnych Microsoftu – zapewniając im bardziej płynną interakcję z produktami firmy analiza i podejmowanie decyzji. Jego ekosystem (OneDrive, Excel, SharePoint itp.)

Na dłuższą metę interesujące będzie również sprawdzenie, jak Copilot Vision radzi sobie z bardziej otwartymi i wydajnymi ofertami agentów, takimi jak Anthropic i Emergence AI, które umożliwiają programistom integrowanie agentów w celu obserwacji, wyciągania wniosków i podejmowania działań w różnych aplikacjach Pozwala zrobić. dostawcy.

Czego można się spodziewać po Copilot Vision?

Gdy użytkownik otwiera witrynę internetową, może mieć zamierzony cel lub nie. Kiedy jednak tak się dzieje, podobnie jak w przypadku zbierania materiałów do pracy akademickiej, proces wykonywania żądanego zadania polega na przejrzeniu witryny internetowej, przeczytaniu całej jej zawartości, a następnie podjęciu decyzji (np. czy zawartość witryny powinna zostać użyte jako odniesienie do artykułu, czy nie). To samo dotyczy innych codziennych zadań w sieci, takich jak zakupy.

Dzięki nowemu doświadczeniu CoPilot Vision firma Microsoft zamierza uprościć cały ten proces. Zasadniczo użytkownik ma teraz asystenta, który znajduje się na dole przeglądarki i można go wywołać, gdy zajdzie taka potrzeba, aby przeczytać zawartość witryny, sprawdzić cały tekst i obrazy oraz pomóc w podjęciu decyzji.

Może natychmiast skanować, analizować i dostarczać wszystkich niezbędnych informacji, mając na uwadze pożądany cel użytkownika – jak druga para oczu.

Ta funkcja ma dalekosiężne korzyści – może przyspieszyć przepływ pracy w krótkim okresie – ale ma też poważne implikacje, biorąc pod uwagę, że agent czyta i ocenia to, co przeglądasz. Microsoft zapewnił jednak, że po zamknięciu sesji Vision cały kontekst i informacje udostępnione przez użytkowników zostaną usunięte. Zauważono również, że dane ze stron internetowych nie są przechwytywane/przechowywane w celu uczenia podstawowych modeli.

„Krótko mówiąc, priorytetowo traktujemy prawa autorskie, twórców oraz prywatność i bezpieczeństwo naszych użytkowników – i stawiamy je wszystkie na pierwszym miejscu” – napisał zespół Copilot w poście na blogu ogłaszającym wersję zapoznawczą tej funkcji.

Rozwój w oparciu o opinie

Obecnie zestaw wyboru Klient drugiego pilota W USA osoby, które zapisały się do programu wczesnego dostępu CoPilot Labs, będą mogły korzystać z funkcji Vision w swojej przeglądarce Edge. Opcja ta będzie dostępna dobrowolnie, co oznacza, że ​​nie będą musieli się martwić, że sztuczna inteligencja będzie cały czas czytać ich ekran.

Ponadto na tym etapie będzie działać tylko z wybranymi witrynami internetowymi. Microsoft twierdzi, że zbierze opinie pierwszych użytkowników i stopniowo będzie poprawiał możliwości, rozszerzając jednocześnie wsparcie na większą liczbę użytkowników Pro i inne strony internetowe.

W dłuższej perspektywie firma może rozszerzyć te możliwości także na inne produkty w swoim ekosystemie, takie jak OneDrive i Excel, ułatwiając użytkownikom korporacyjnym pracę i podejmowanie decyzji. Jednak nie ma jeszcze oficjalnego potwierdzenia. Nie trzeba dodawać, że wskazane tutaj ostrożne podejście może zająć trochę czasu, zanim stanie się rzeczywistością.

Decyzja Microsoftu o udostępnieniu wersji zapoznawczej Copilot Vision następuje w momencie, gdy konkurenci podnoszą poprzeczkę w dziedzinie agentycznej sztucznej inteligencji. Salesforce uruchomiło już Agentforce w swojej ofercie Customer 360, aby automatyzować przepływy pracy w takich domenach, jak sprzedaż, marketing i obsługa.

W międzyczasie firma Anthropic uruchomiła opcję „Computer Use”, która umożliwia programistom integrację chmury w celu interakcji ze środowiskami komputerów stacjonarnych i wykonywania zadań, które wcześniej były wykonywane wyłącznie przez ludzi, takich jak otwieranie aplikacji, interakcja z interfejsami i wypełnianie formularzy.


Source link