Dołącz do naszych codziennych i cotygodniowych biuletynów, aby otrzymywać najnowsze aktualizacje i ekskluzywne treści na temat wiodącego w branży zakresu sztucznej inteligencji. dowiedz się więcej
Dwa lata po publicznym udostępnieniu ChatGPIT rozmowa na temat sztucznej inteligencji jest nieunikniona, ponieważ firmy z każdej branży chcą wykorzystywać duże modele językowe (LLM) do przekształcania swoich procesów biznesowych. Jednak pomimo tego, że LLM są potężne i obiecujące, wielu liderów biznesu i IT zaczęło na nich nadmiernie polegać i nie dostrzegać ich ograniczeń. Dlatego też przewiduję przyszłość, w której określone modele językowe, czyli SLM, będą odgrywać większą, uzupełniającą rolę w informatyce przedsiębiorstw.
SLM są powszechnie znane jako „modele małych języków”, ponieważ wymagają mniej danych i czasu szkolenia oraz są „udoskonalonymi wersjami LLM”. Wolę jednak termin „konkretny”, ponieważ lepiej oddaje on zdolność tych specjalnie zaprojektowanych rozwiązań do wykonywania wysoce wyspecjalizowanych zadań z większą dokładnością, spójnością i przejrzystością niż LLM. Uzupełniając LLM o SLM, organizacje mogą tworzyć rozwiązania wykorzystujące mocne strony każdego modelu.
Zaufanie i problem „czarnej skrzynki” LLM
LLM są niezwykle potężne, ale są również znane z tego, że czasami „gubią fabułę” lub wytwarzają wyniki odbiegające od kursu ze względu na proste szkolenie i ogromne zbiory danych. Tendencję tę komplikuje fakt, że ChatGPT i inne LLM OpenAI to w zasadzie „czarne skrzynki”, które nie wyjaśniają, w jaki sposób uzyskują odpowiedź.
Problem z czarną skrzynką będzie w przyszłości poważnym problemem, szczególnie dla firm i zastosowań o znaczeniu krytycznym dla biznesu, gdzie dokładność, spójność i zgodność są najważniejsze. Pomyśl o opiece zdrowotnej, usługach finansowych i prawie jako o najlepszych przykładach zawodów, w których błędne odpowiedzi mogą mieć ogromne konsekwencje finansowe, a nawet życie lub śmierć. Organy regulacyjne już to zauważają i prawdopodobnie zaczną żądać możliwych do wytłumaczenia rozwiązań w zakresie sztucznej inteligencji, szczególnie w branżach, które opierają się na prywatności i dokładności danych.
Chociaż firmy często wdrażają podejście oparte na zaangażowaniu człowieka, aby złagodzić te problemy, nadmierne poleganie na LLM może prowadzić do fałszywego poczucia bezpieczeństwa. Z biegiem czasu może pojawić się samozadowolenie, a błędy pozostaną niewykryte.
SLM = większa interpretowalność
Na szczęście SLM lepiej radzą sobie z wieloma ograniczeniami LLM. Zamiast być projektowane do zadań ogólnego przeznaczenia, SLM są opracowywane w wąskim zakresie i szkolone na danych specyficznych dla domeny. Ta specyfika pozwala im sprostać subtelnym wymaganiom językowym w obszarach, w których dokładność jest najważniejsza. Zamiast polegać na ogromnych, heterogenicznych zbiorach danych, SLM są szkoleni w oparciu o ukierunkowane informacje, co zapewnia im inteligencję kontekstową umożliwiającą dostarczanie bardziej spójnych, przewidywalnych i trafnych odpowiedzi.
Zapewnia to wiele korzyści. Po pierwsze, są one łatwiejsze do interpretacji, co ułatwia zrozumienie źródła i logiki stojącej za ich wynikami. Jest to ważne w branżach regulowanych, w których decyzje muszą mieć pewne źródło.
Po drugie, ich mniejszy rozmiar oznacza, że często mogą działać szybciej niż LLM, co może być ważnym czynnikiem w zastosowaniach czasu rzeczywistego. Po trzecie, SLM zapewniają firmom większą kontrolę nad prywatnością i bezpieczeństwem danych, zwłaszcza jeśli są wdrażane wewnętrznie lub budowane specjalnie dla przedsiębiorstwa.
Co więcej, chociaż SLM mogą początkowo wymagać specjalistycznego szkolenia, zmniejszają ryzyko związane z korzystaniem z SLM stron trzecich kontrolowanych przez zewnętrznych dostawców. Ta kontrola jest nieoceniona w zastosowaniach wymagających rygorystycznego zarządzania danymi i zgodności.
Skoncentruj się na rozwijaniu wiedzy specjalistycznej (i uważaj na dostawców, którzy obiecują za dużo)
Chcę wyjaśnić, że LLM i SLM nie wykluczają się wzajemnie. W praktyce SLM mogą ulepszyć LLM, tworząc rozwiązania hybrydowe, w których LLM zapewniają szerszy kontekst, a SLM zapewniają dokładne wykonanie. Jest jeszcze wcześnie, jeśli chodzi o LLM, dlatego zawsze doradzam liderom technologii, aby nadal badali wiele możliwości i korzyści LLM.
Co więcej, chociaż metody LLM można dobrze skalować do różnych typów problemów, modele SLM mogą nie sprawdzić się w niektórych przypadkach użycia. Dlatego ważne jest, aby wcześniej dokładnie zrozumieć, jakimi sprawami należy się zająć.
Ważne jest również, aby liderzy biznesu i IT poświęcali więcej czasu i uwagi na budowanie konkretnych umiejętności potrzebnych do szkolenia, dostrajania i testowania SLM. Na szczęście istnieje wiele bezpłatnych informacji i szkoleń dostępnych w zwykłych źródłach, takich jak Coursera, YouTube i Huggingface.co. Liderzy muszą zapewnić swoim programistom wystarczająco dużo czasu na naukę i eksperymentowanie z SLM w miarę nasilenia się bitwy o wiedzę specjalistyczną w zakresie sztucznej inteligencji.
Radzę także liderom, aby dokładnie sprawdzali partnerów. Niedawno rozmawiałem z firmą, która poprosiła mnie o opinię na temat twierdzeń pewnego dostawcy technologii. Moim zdaniem albo przesadzili w swoich twierdzeniach, albo brakowało im dogłębnego zrozumienia możliwości tej technologii.
Firma mądrze cofnęła się o krok i wdrożyła kontrolowaną weryfikację koncepcji, aby przetestować twierdzenia dostawcy. Tak jak podejrzewałem, rozwiązanie nie było jeszcze gotowe do użytku, a firmie udało się wystartować przy stosunkowo niewielkim nakładzie czasu i pieniędzy.
Niezależnie od tego, czy firma zaczyna od sprawdzenia koncepcji, czy od wdrożenia na żywo, radzę zaczynać od małych rzeczy, często testować i opierać się na wczesnych sukcesach. Osobiście doświadczyłem tego podczas pracy z niewielkim zestawem instrukcji i informacji, ale kiedy podałem modelowi więcej informacji, okazało się, że wyniki były odbiegające od oczekiwanych. Dlatego ostrożnym podejściem jest powolne i stałe podejście.
Krótko mówiąc, choć LLM będą w dalszym ciągu zapewniać coraz bardziej wartościowe możliwości, ich ograniczenia stają się widoczne w miarę zwiększania się zależności przedsiębiorstw od sztucznej inteligencji. Uzupełnienie o SLM zapewnia postęp, szczególnie w obszarach wysokiego ryzyka, które wymagają dokładności i możliwości interpretacji. Inwestując w SLM, firmy mogą zabezpieczyć swoje strategie sztucznej inteligencji na przyszłość, upewniając się, że ich narzędzia nie tylko napędzają innowacje, ale także spełniają wymagania zaufania, niezawodności i kontroli.
AJ Sundar jest współzałożycielem, CIO i CPO firmy Responsive.
decydentów danych
Witamy w społeczności VentureBeat!
DataDecisionMakers to miejsce, w którym eksperci, w tym osoby techniczne pracujące nad danymi, mogą dzielić się spostrzeżeniami i innowacjami związanymi z danymi.
Jeśli chcesz przeczytać o nowatorskich pomysłach i najnowszych informacjach, najlepszych praktykach oraz przyszłości danych i technologii danych, dołącz do nas na DataDecisionMakers.
Możesz także rozważyć napisanie własnego artykułu!
Przeczytaj więcej od DataDecisionmakers
Source link