Dołącz do naszych codziennych i cotygodniowych biuletynów, aby otrzymywać najnowsze aktualizacje i ekskluzywne treści na temat wiodącego w branży zakresu sztucznej inteligencji. dowiedz się więcej
Zastrzeżenie: EndlessAI opublikowało wcześniej artykuł na platformie VentureBeat, w którym ogłosił premierę Lloyd na początku października.
czteroletni startup AI nieskończone Nie jest to jeszcze powszechnie znana nazwa.
Ale jej założyciele i liderzy uważają, że mają prawdziwy hit w rękach: freemium. aplikacja na iOS, LloydKtóry wykorzystuje zastrzeżoną technologię przesyłania strumieniowego i kodowania wideo, aby przesyłać obraz wideo na żywo do podstawowych modeli sztucznej inteligencji, w tym GPT OpenAI, aby pomóc w różnych zadaniach, od naprawy rowerów po opowiadanie historii na dobranoc -4o, co zyskało ponad 50 000 użytkowników. trzy miesiące po tajnym uruchomieniu,
Według danych dostarczonych VentureBeat przez EndlessAI, 41% tych użytkowników codziennie korzysta z aplikacji.
Chociaż nie jest to chatgpt – który stał się Najszybszy produkt w historii, który w styczniu 2023 roku przekroczył 100 milionów użytkownikówZaledwie dwa miesiące po premierze — to jednak bardzo zachęcające dla dyrektora generalnego EndlessAI Roi Ginata i prezesa wykonawczego Thomasa Pompidou, którzy w niedawnej rozmowie wideo powiedzieli VentureBeat, że przewidują udostępnienie swojej platformy stronom trzecim już w 2025 r. Otwarte dla programistów i posiadające planowany start. aplikacja na Androida przeznaczona dla konsumentów w styczniu.
Co więcej, EndlessAI rozpoczęło już ulepszanie Lloyda za pomocą „mocy” lub, jak opisuje je Pompidou, „zasadniczo dopracowanych, dużych modeli językowych (LLM), które są dostosowane do konkretnych przypadków użycia”. materiał.”
Na przykład w aplikacji dostępny jest teraz pierwszy „szef kuchni” Lloyd Power Live, który zapewnia w czasie rzeczywistym trenera w pełni opartego na sztucznej inteligencji, który obserwuje Cię podczas gotowania (jeśli skierujesz aparat w smartfonie na płytę kuchenną lub wskażesz miejsce gotowania) obszarze) i zawiera wskazówki krok po kroku.
Kolejną usługą, którą Lloyd Power planuje wkrótce wprowadzić na rynek, jest Tour Guide, który pozwala użytkownikom trzymać telefon i przeglądać w czasie rzeczywistym kontekstowe informacje o swoim otoczeniu. Nagrywając wideo lokalizacji, identyfikuje interesujące miejsca, podaje istotne szczegóły, a nawet może polecić pobliskie atrakcje lub zajęcia.
Udostępnianie analiz wideo w czasie rzeczywistym na dużą skalę
Podczas gdy obecne firmy LLM mają trudności z wydajnym przetwarzaniem filmów na żywo ze względu na wysokie koszty obliczeniowe. Technologia EndlessAI pokonuje to ograniczenie, redukując koszty analizy wideo o ponad 99%.
Pompidou nakreślił szerszą misję aplikacji: „Naszą misją jest wprowadzenie sztucznej inteligencji do prawdziwego świata. Rzeczywisty świat jest wizualny i żywy, a dzisiejsze duże modele językowe, podobnie jak ich architektura, stoją przed wyzwaniami związanymi z dokładną analizą wideo, na dużą skalę i opłacalną. „Dzięki nam jest to możliwe.”
Umożliwia analizę wideo w czasie rzeczywistym, umożliwiając użytkownikom interakcję ze środowiskiem na nowe sposoby, od diagnozowania problemów mechanicznych po tworzenie spersonalizowanych historii na dobranoc.
Główna wyjątkowość firmy Lloyd polega na możliwości przetwarzania danych wideo za pośrednictwem LLM za ułamek kosztów typowo związanych z tego typu zadaniami. Tradycyjne architektury LLM nie są zoptymalizowane pod kątem wideo, przez co analiza wideo w czasie rzeczywistym jest niezwykle kosztowna i powolna.
„Analiza wideo za pomocą ChatGPT będzie kosztować ponad 300 dolarów za godzinę” – powiedział Pompidou. „Dzięki Lloyd zapewniamy ten sam poziom dokładności za jedyne 10 centów za godzinę”.
Tę efektywność kosztową osiąga się bez utraty dokładności, co odróżnia firmę Lloyd od konkurentów, którzy polegają na niższej liczbie klatek na sekundę lub niższych rozdzielczościach, aby obniżyć koszty, często kosztem niezawodności.
„Nasza warstwa komunikacyjna jest solidna w sposób, w jaki inne rozwiązania nie są. Umożliwia programistom integrowanie usług sztucznej inteligencji działających w czasie rzeczywistym, takich jak zamiana mowy na tekst, zamiana tekstu na mowę i analiza wideo, z niezrównaną niezawodnością i wydajnością.
Pompidou, przewidując przyszłość, rzucił okiem na potencjał aplikacji: „Wyobraźcie sobie doskonale dostrojony LLM przeszkolony w zakresie każdej instrukcji obsługi Ikei, prowadzący klientów krok po kroku za pomocą filmów i rzeczywistego rozpoznawania błędów na czas. To tylko jeden przykład tego, jak nasza technologia może zmienić doświadczenia użytkowników”.
Kolejny duży obszar, który EndlessAI planuje wprowadzić za pośrednictwem Lloyda i jego wbudowanej technologii kodowania wideo: zapewnianie analiz organów ścigania, w szczególności nagrań z kamer policyjnych.
„Jeśli ktoś ma zawał serca, system zidentyfikuje tę osobę i przekaże funkcjonariuszowi instrukcje, co natychmiast zrobić” – powiedział Pompidou.
Prywatność i bezpieczeństwo
Mimo że sam Lloyd widzi tylko to, na co skierujesz aparat smartfona, EndlessAI priorytetowo traktuje prywatność użytkownika.
„Dane pozostają prywatne dla kont (użytkowników) i wykorzystujemy je do celów wsparcia tylko wtedy, gdy użytkownicy wyraźnie o to poproszą” – powiedział Ginat.
Takie podejście zapewnia silne środki bezpieczeństwa, umożliwiając jednocześnie płynne interakcje.
W rezultacie EndlessAI nie jest do końca pewien, jakie jest najpopularniejsze zastosowanie Lloyda wśród jego użytkowników. Anegdotycznie twierdzi, że jej ankiety i formularze opinii wykazały zainteresowanie przygotowywaniem posiłków, naprawami w domu, coachingiem w zakresie mody i stylu życia i nie tylko.
Podczas gdy funkcje Lloyda przeznaczone dla konsumentów zyskują na popularności, EndlessAI tworzy także narzędzia, które umożliwią programistom i przedsiębiorstwom korzystanie z tej technologii.
„Nasz długoterminowy plan działania obejmuje pakiet SDK dla programistów, który zostanie uruchomiony na początku przyszłego roku” – powiedział Pompidou. „Dzięki temu będą mogli tworzyć unikalne wizualne rozwiązania AI z niezwykłą prostotą”.
Pakiet SDK umożliwi programistom integrację funkcji wizyjnych AI z ich własnymi aplikacjami.
„Pierwszą ofertą dla programistów będzie solidna platforma do komunikacji API w czasie rzeczywistym, łącząca się z OpenAI i innymi backendami” – powiedział Ginat VentureBeat. „Programiści mogą wybierać komponenty, których chcą używać, na przykład usługi audio lub zamianę mowy na tekst”.
Zastosowania tych narzędzi obejmują różne branże, od tworzenia aplikacji do czatowania wspomaganych sztuczną inteligencją po integrację analityki wideo z liniami produkcyjnymi i systemami nadzoru bezpieczeństwa.
EndlessAI ma na celu oferowanie skalowalnych rozwiązań, które dostosowują się do różnych wymagań wydajnościowych i kosztowych.
„Nasze narzędzia programistyczne umożliwią dostosowywanie na bieżąco – wybór pomiędzy usługami zaplecza a lekkimi rozwiązaniami na urządzeniu w oparciu o przypadek użycia i wymagania kosztowe” – powiedział Ginat.
Łącząc solidne interfejsy API z intuicyjnym pakietem SDK, EndlessAI przewiduje nową falę aplikacji opartych na sztucznej inteligencji, które wykraczają poza tradycyjne przetwarzanie tekstu lub obrazu. „Zapewnimy programistom możliwość integracji różnych usług, w tym bocznego przetwarzania wideo, wzbogacając ich sesje o dodatkowe możliwości” – powiedział Ginat.
Transformacja sztucznej inteligencji dla konsumentów i przedsiębiorstw
Zdolność Lloyda do wykorzystania istniejących smartfonów bez konieczności stosowania dodatkowego sprzętu sprawia, że są one wyjątkowo dostępne.
Obniżając bariery wejścia, EndlessAI na nowo definiuje możliwości AI w życiu codziennym i wyspecjalizowanych branżach.
Dzięki szybkiemu przyjęciu przez użytkowników, wszechstronnym aplikacjom i solidnemu planowi działania, Lloyd ma stać się decydującą innowacją w dziedzinie sztucznej inteligencji.
„Nasza długoterminowa strategia polega na dalszym uzupełnianiu LLM” – powiedział Pompidou. „Nawet jeśli modele mogą natywnie przetwarzać wideo, naszym celem jest utrzymanie warstwy wydajności, która sprawia, że te aplikacje są opłacalne i opłacalne”.
Source link