Dołącz do naszych codziennych i cotygodniowych biuletynów, aby otrzymywać najnowsze aktualizacje i ekskluzywne treści na temat wiodącego w branży zakresu sztucznej inteligencji. dowiedz się więcej
Generatywna sztuczna inteligencja stała się kluczową częścią infrastruktury w wielu branżach, a opieka zdrowotna nie jest tu wyjątkiem. Mimo to, jak lubią organizacje GSK Przesuwając granice tego, co może osiągnąć generyczna sztuczna inteligencja, stoją przed poważnymi wyzwaniami – zwłaszcza jeśli chodzi o niezawodność. Halucynacje lub sytuacje, w których modele sztucznej inteligencji generują niedokładne lub sfabrykowane informacje, są częstym problemem w zastosowaniach wysokiego ryzyka, takich jak odkrywanie leków i opieka zdrowotna. Dla GSK sprostanie tym wyzwaniom wymaga wykorzystania skalowania obliczeń w czasie testów w celu ulepszenia systemów sztucznej inteligencji nowej generacji. Oto jak to robią.
Problem omamów w generatywnej opiece zdrowotnej
Zastosowania w służbie zdrowia wymagają wyjątkowo wysokiego poziomu dokładności i niezawodności. Błędy są nie tylko niewygodne; Mogą mieć konsekwencje zmieniające życie. To sprawia, że halucynacje w dużych modelach językowych (LLM) stanowią istotny problem dla firm takich jak GSK, gdzie ogólną sztuczną inteligencję stosuje się do takich zadań, jak przegląd literatury naukowej, analiza genomu i odkrywanie leków.
Aby ograniczyć halucynacje, GSK stosuje zaawansowane strategie obliczania czasu domysłu, w tym mechanizmy autorefleksji, próbkowanie na podstawie wielu modeli i iteracyjną ocenę wyników. Według Kim Branson, wiceprezesa ds. sztucznej inteligencji i uczenia maszynowego (ML) w GSK, techniki te pomagają zapewnić, że agenci są „solidni i niezawodni”, umożliwiając jednocześnie naukowcom szybsze generowanie przydatnych spostrzeżeń.
Wykorzystanie skalowania obliczeń czasu testu
Skalowanie obliczeń w czasie testowania odnosi się do możliwości zwiększenia zasobów obliczeniowych w fazie wnioskowania systemu AI. Umożliwia to bardziej złożone operacje, takie jak iteracyjne udoskonalanie wyników lub agregacja wielu modeli, które są ważne dla ograniczenia halucynacji i poprawy wydajności modelu.
Branson podkreślił transformacyjną rolę skalowania w wysiłkach GSK w zakresie sztucznej inteligencji, zauważając, że „w GSK wszystkim zależy na zwiększaniu cykli iteracji – na tym, jak myślimy szybciej”. Stosując strategie takie jak autorefleksja i modelowanie kombinatoryczne, GSK może wykorzystać te dodatkowe cykle obliczeniowe, aby uzyskać dokładne i wiarygodne wyniki.
Branson poruszył także szerszy trend w branży, mówiąc: „Widzicie tę wojnę o to, ile usług mogę wykonać, koszt za token i czas potrzebny na token. Umożliwia to ludziom stosowanie różnych strategii algorytmicznych, które wcześniej nie były technicznie wykonalne, a także przyspiesza wdrażanie i adopcję agentów.
Strategie zmniejszania halucynacji
GSK uznała halucynacje za poważne wyzwanie w zakresie ogólnej sztucznej inteligencji w opiece zdrowotnej. Firma przyjmuje dwie główne strategie, które wymagają dodatkowych zasobów obliczeniowych podczas szacowania. Stosowanie bardziej intensywnych etapów przetwarzania gwarantuje, że każda odpowiedź zostanie sprawdzona pod kątem dokładności i spójności przed rozpowszechnieniem w warunkach klinicznych lub badawczych, gdzie niezawodność jest najważniejsza.
Autorefleksja i iteracyjny przegląd wyników
Kluczową techniką jest autorefleksja, podczas której LLM krytykują lub edytują swoje odpowiedzi w celu poprawy jakości. Model „myśli krok po kroku”, analizując swoje początkowe wyniki, wskazując słabe strony i modyfikując odpowiedzi w razie potrzeby. Narzędzie do wyszukiwania literatury firmy GSK jest tego przykładem: gromadzi dane z wewnętrznych repozytoriów i pamięci LLM, a następnie ponownie ocenia swoje ustalenia poprzez samokrytykę, aby odkryć niespójności.
Ten iteracyjny proces skutkuje jaśniejszymi, bardziej szczegółowymi odpowiedziami końcowymi. Branson podkreślił wartość samokrytyki, mówiąc: „Jeśli możesz zrobić tylko jedną rzecz, zrób to”. Udoskonalenie własnej logiki przed uzyskaniem wyników pozwala systemowi generować spostrzeżenia zgodne z rygorystycznymi standardami opieki zdrowotnej.
próbkowanie wielomodelowe
Druga strategia GSK opiera się na wielu LLM lub różnych konfiguracjach pojedynczego modelu w celu wzajemnej weryfikacji wyników. W praktyce systemy mogą uruchamiać to samo zapytanie przy różnych ustawieniach temperatury, aby wygenerować różne odpowiedzi, wykorzystywać dopracowane wersje tego samego modelu specjalizującego się w określonych domenach lub zupełnie inne modele wytrenowane na różnych zbiorach danych.
Porównanie i zestawienie tych wyników pomaga potwierdzić najbardziej spójne lub zbieżne wnioski. „Można uzyskać efekt różnych metod ortogonalnych, aby dojść do tego samego wniosku” – powiedział Branson. Chociaż to podejście wymaga większej mocy obliczeniowej, zmniejsza halucynacje i zwiększa pewność co do ostatecznej odpowiedzi, co jest istotną korzyścią w środowiskach opieki zdrowotnej wysokiego ryzyka.
chyba wojna
Strategie GSK opierają się na infrastrukturze, która może obsłużyć dość duże obciążenia obliczeniowe. W tym, co Branson nazywa „wojnami antycypacyjnymi”, firmy zajmujące się infrastrukturą sztucznej inteligencji – takie jak Cerebras, Grok i Sambanova – konkurują ze sobą, aby dostarczać przełomowe rozwiązania sprzętowe, które zwiększają przepustowość tokena, redukują opóźnienia i zmniejszają koszt tokena.
Wyspecjalizowane chipy i architektury umożliwiają złożone procedury wnioskowania, w tym próbkowanie wielu modeli na dużą skalę i iteracyjną autorefleksję. Na przykład technologia Cerebras przetwarza tysiące tokenów na sekundę, dzięki czemu zaawansowane technologie mogą działać w rzeczywistych scenariuszach. „Widzisz na własne oczy rezultaty tych innowacji, pokazujące, w jaki sposób możemy skutecznie wdrażać modele generatywne w opiece zdrowotnej” – powiedział Branson.
Gdy sprzęt dotrzymuje kroku wymaganiom oprogramowania, pojawiają się rozwiązania zapewniające dokładność i wydajność.
Wyzwania pozostają
Nawet przy tych postępach skalowanie zasobów obliczeniowych stwarza przeszkody. Wydłużony czas szacowania może spowolnić przebieg pracy, zwłaszcza jeśli lekarze lub badacze potrzebują szybko wyników. Wysokie wykorzystanie komputera zwiększa również koszty, co wymaga ostrożnego zarządzania zasobami. Niemniej jednak GSK uważa te kompromisy za niezbędne w celu zapewnienia większej niezawodności i bogatszej funkcjonalności.
„W miarę udostępniania większej liczby narzędzi w ekosystemie agentów system stanie się bardziej przydatny dla ludzi, co doprowadzi do zwiększonego wykorzystania mocy obliczeniowej” – powiedział Branson. Równowaga między wydajnością, kosztami i możliwościami systemu pozwala GSK utrzymać pragmatyczną, a jednocześnie wizjonerską strategię.
Co stanie się dalej?
GSK planuje udoskonalić swoje rozwiązania dla opieki zdrowotnej oparte na sztucznej inteligencji, traktując skalowanie obliczeń w czasie testów jako najwyższy priorytet. Połączenie autorefleksji, pobierania próbek na podstawie wielu modeli i solidnej infrastruktury pomaga zapewnić, że modele generyczne spełniają rygorystyczne wymagania środowiska klinicznego.
Podejście to służy również jako plan działania dla innych organizacji dotyczący pogodzenia dokładności, wydajności i skalowalności. Utrzymanie wiodącej pozycji w zakresie innowacji obliczeniowych i zaawansowanych technik szacowania nie tylko rozwiązuje bieżące wyzwania, ale także kładzie podwaliny pod przełomowe rozwiązania w odkrywaniu leków, opiece nad pacjentem i nie tylko.
Source link