Dołącz do naszych codziennych i cotygodniowych biuletynów, aby otrzymywać najnowsze aktualizacje i ekskluzywne treści na temat wiodącego w branży zakresu sztucznej inteligencji. dowiedz się więcej
DiffbotMała firma z Doliny Krzemowej, znana z utrzymywania jednego z największych indeksów na świecie sieć Wiedzaogłosiła dziś wydanie nowego modelu sztucznej inteligencji, który może rozwiązać jedno z największych wyzwań w tej dziedzinie: dokładność faktów.
nowy modelUsprawniona wersja Meta’s LLama 3.3, pierwsza implementacja typu open source systemu znanego jako generowanie wspomagane wyszukiwaniem wykresów, lub wykres,
W przeciwieństwie do tradycyjnych modeli sztucznej inteligencji, które w całości opierają się na dużych ilościach wstępnie załadowanych danych szkoleniowych, Firma Diffbot LLM Otrzymuje informacje w czasie rzeczywistym od firmy Wiedza wykresStale aktualizowana baza danych zawierająca ponad bilion powiązanych ze sobą faktów.
„Mamy tezę: ostatecznie logika ogólnego przeznaczenia zostanie rozłożona na około 1 miliard parametrów” – powiedział Mike Tung, założyciel i dyrektor generalny Diffbot, w wywiadzie dla VentureBeat. „Tak naprawdę nie chcesz wiedzy w modelu. Chcesz, aby model dobrze posługiwał się narzędziami, aby móc kwestionować wiedzę na zewnątrz”.
jak to działa
defbota wykres wiedzy Od 2016 roku w publicznej sieci przeszukiwana jest ogromna, zautomatyzowana baza danych. Kategoryzuje strony internetowe według podmiotów, takich jak osoby, firmy, produkty i artykuły, wyodrębniając uporządkowane informacje przy użyciu kombinacji widzenia komputerowego i przetwarzania języka naturalnego.
Co cztery do pięciu dni Graf wiedzy jest odświeżany milionami nowych faktów, dzięki czemu pozostaje aktualny. defbota zawsze Próbka Korzysta z tego zasobu, wysyłając zapytania do wykresu w czasie rzeczywistym w celu uzyskania informacji, zamiast polegać na statycznej wiedzy zakodowanej w danych szkoleniowych.
Na przykład zapytany o niedawne wydarzenie informacyjne model może przeszukać Internet w poszukiwaniu najnowszych aktualizacji, wyodrębnić istotne fakty i zacytować oryginalne źródła. Proces ten ma na celu uczynienie systemu bardziej dokładnym i przejrzystym niż tradycyjny LLM.
„Wyobraźcie sobie, że pytacie sztuczną inteligencję o pogodę” – powiedział Tung. „Zamiast generować odpowiedzi na podstawie starych danych szkoleniowych, nasz model wysyła zapytania do serwisu pogodowego na żywo i zapewnia odpowiedź w oparciu o informacje w czasie rzeczywistym”.
Jak Graf Wiedzy Diffbota pokonuje tradycyjną sztuczną inteligencję w znajdowaniu faktów
W testach porównawczych podejście Diffbota wydaje się opłacalne. Firma podaje, że jej model osiąga dokładność na poziomie 81%. FreshQABenchmark stworzony przez Google w celu testowania wiedzy opartej na faktach w czasie rzeczywistym, który przewyższa zarówno ChatGPT, jak i Gemini. Uzyskał także 70,36% ocen mmlu-ZawodowiecTrudniejsza wersja standardowego testu wiedzy akademickiej.
Być może najważniejsze jest to, że Diffbot udostępnia swój model całkowicie na zasadach open source, umożliwiając firmom uruchamianie go na własnym sprzęcie i dostosowywanie go do swoich potrzeb. Rozwiązuje to rosnące obawy dotyczące prywatności danych i uzależnienia od dostawców u głównych dostawców sztucznej inteligencji.
„Możesz uruchomić go lokalnie na swoim komputerze” – powiedział Tung. „Nie ma możliwości uruchomienia Google Gemini bez wysyłania danych do Google i wysyłania ich poza swoją siedzibę”.
Sztuczna inteligencja typu open source może zmienić sposób, w jaki przedsiębiorstwa radzą sobie z wrażliwymi danymi
Ta wersja pojawia się w krytycznym momencie rozwoju sztucznej inteligencji. W ostatnich miesiącach nasiliła się krytyka „trendu” dużych modeli językowych.wprowadzać w błądlub generować niedokładne informacje, nawet jeśli firmy stale zwiększają rozmiary modeli. Podejście Diffbota sugeruje alternatywną ścieżkę, skupiającą się na osadzeniu systemów sztucznej inteligencji na weryfikowalnych faktach, zamiast na próbach kodowania całej ludzkiej wiedzy w sieciach neuronowych.
„Nie wszyscy interesują się coraz większymi modelami” – powiedział Tung. „Możesz mieć model, który ma większy potencjał niż duży model przy nieintuicyjnym podejściu, takim jak nasz”.
Eksperci branżowi twierdzą, że podejście Diffbota oparte na wykresach wiedzy może być szczególnie cenne w zastosowaniach korporacyjnych, gdzie dokładność i możliwość kontroli są krytyczne. Firma świadczy już usługi transmisji danych dla dużych firm cisco, kaczka-go I snapchata,
Model jest natychmiast dostępny w wersji open source GitHub Można to przetestować w publicznej wersji demonstracyjnej diffy.czatDiffbot twierdzi, że w przypadku organizacji chcących wdrożyć go wewnętrznie mniejsza wersja o 8 miliardach parametrów może działać na jednym karta graficzna nvidia a100podczas gdy pełna wersja zawierająca 70 miliardów parametrów wymaga dwóch h100 procesora graficznego,
Patrząc w przyszłość, Tung wierzy, że przyszłość sztucznej inteligencji nie leży w większych modelach, ale w lepszych sposobach organizowania ludzkiej wiedzy i dostępu do niej: „Fakty stają się nieaktualne. Wiele z tych faktów zostanie przeniesionych do oczywistych miejsc, gdzie faktycznie można modyfikować wiedzę i gdzie można mieć źródło danych.
Ponieważ branża sztucznej inteligencji zmaga się z wyzwaniami związanymi z dokładnością i przejrzystością faktów, wydanie Diffbota stanowi atrakcyjną alternatywę dla dominującego paradygmatu „większe znaczy lepsze”. Czas pokaże, czy uda mu się zmienić kierunek rozwoju sytuacji, ale z pewnością pokazał, że w przypadku sztucznej inteligencji rozmiar to nie wszystko.
Source link