Najnowszy model chińskiego start-upu AI DeepSeek przewyższa o1 OpenAI w zadaniach „rozumowania”

Chiński startup zajmujący się sztuczną inteligencją DeepSeek ma odsłonićlwyd nowy model „rozumowania”, o którym mówi się, że wypada bardzo korzystnie w porównaniu z dużym modelem językowym o1 OpenAI, który został zaprojektowany, aby odpowiadać na pytania matematyczne i przyrodnicze z większą dokładnością niż tradycyjne LLM.

Startup będący odgałęzieniem ilościowego funduszu hedgingowego High-Flyer Capital Management Ltd., ujawnione w X dzisiaj wprowadza wersję zapoznawczą swojego pierwszego modelu rozumującego, DeepSeek-R1.

Modele rozumowania różnią się od standardowych LLM ze względu na ich zdolność do „weryfikacji faktów” swoich odpowiedzi. Aby to zrobić, zazwyczaj spędzają znacznie więcej czasu na zastanawianiu się, jak powinni zareagować na monit, co pozwala im ominąć problemy takie jak „halucynacje”, które są powszechne w chatbotach takich jak ChatGPT.

Kiedy OpenAI wypuścił model o1 we wrześniu stwierdził, że znacznie lepiej radzi sobie z zapytaniami i pytaniami wymagającymi umiejętności rozumowania. Dzieje się tak, ponieważ opiera się na technice uczenia maszynowego znanej jako „łańcuch myślenia” lub CoT, która pozwala dzielić złożone zadania na mniejsze etapy i wykonywać je pojedynczo, co poprawia jego dokładność.

DeepSeek działa w podobny sposób, planując z wyprzedzeniem złożone problemy i rozwiązując je jeden po drugim, aby mieć pewność, że będzie w stanie zareagować prawidłowo. Proces ten może jednak zająć trochę czasu i podobnie jak o1, ​​może potrzebować „myśleć” do 10 sekund, zanim będzie mógł wygenerować odpowiedź na pytanie.

Proces myślowy modelu jest również całkowicie przejrzysty, dzięki czemu użytkownicy mogą śledzić poszczególne etapy wymagane do uzyskania odpowiedzi.

Startup twierdzi, że DeepSeek-R1 przewyższa możliwości o1 w dwóch kluczowych testach porównawczych: AIME i MATH. Pierwsza wykorzystuje inne modele sztucznej inteligencji do oceny wydajności LLM, podczas gdy druga to szereg złożonych problemów tekstowych. Co więcej, modelka pokazała, że ​​potrafi poprawnie odpowiedzieć VentureBeat podaje, że wiele „podchwytliwych” pytań naprowadziło na błąd istniejące modele, takie jak GPT-4o i Anthropic PBC Claude.

Jednak DeepSeek-R1 ma wiele problemów, co twierdzą niektórzy komentatorzy na X wydaje się walczyć z problemy logiczne jak kółko i krzyżyk. To powiedziawszy, o1 również borykał się z tego samego rodzaju problemami.

Użytkownicy zgłosili również, że DeepSeek nie odpowiada na zapytania, które chiński rząd prawdopodobnie uważa za zbyt poufne. Pytany o takie wydarzenia jak masakra na placu Tiananmen, stosunki chińskiego prezydenta Xi Jingpinga z Donaldem Trumpem czy potencjał inwazji Chin na Tajwan, konsekwentnie odpowiadał, że „nie jest pewien, jak podejść do tego typu kwestii”.

Odrzucenie przez DeepSeek zapytań wrażliwych politycznie wynika prawdopodobnie z potrzeby zapewnienia przez chińskich programistów, że ich modele „ucieleśniają podstawowe wartości socjalistyczne”.

To powiedziawszy, niektórzy użytkownicy ujawnili również, że dość łatwo jest jailbreak DeepSeek i podpowiedzieć mu w taki sposób, że ignoruje jego bariery. Na przykład jeden użytkownik znalazł sposób, aby uzyskać dostęp do pliku szczegółowy przepis oraz instrukcje dotyczące wytwarzania metamfetaminy, która jest oczywiście wysoce nielegalna w większości krajów.

DeepSeek to dość nietypowy start-up zajmujący się sztuczną inteligencją ze względu na jego wsparcie przez ilościowy fundusz hedgingowy, którego celem jest wykorzystanie LLM do ulepszenia swoich strategii handlowych. Nie jest to nowość na scenie AI wcześniej wydany LLM o nazwie DeepSeek-V2 do generowania i analizy tekstu i obrazów ogólnego przeznaczenia. Została założona przez absolwenta informatyki Lianga Wenfenga, a jej zamierzonym celem jest osiągnięcie „superinteligentnej” sztucznej inteligencji.

Dostęp do DeepSeek-R1 można uzyskać poprzez Czat DeepSeek aplikacji na stronie internetowej firmy. Chociaż korzystanie z niego jest bezpłatne, użytkownicy nie płacący mogą wysyłać tylko 50 wiadomości dziennie. Firma planuje także udostępnienie DeepSeek-R1 poprzez interfejs programowania aplikacji.

Zdjęcie: SiliconANGLE/Freepik AI

Twój głos wsparcia jest dla nas ważny i pomaga nam zachować DARMOWOŚĆ treści.

Jedno kliknięcie poniżej wspiera naszą misję zapewniania bezpłatnych, szczegółowych i odpowiednich treści.

Dołącz do naszej społeczności na YouTube

Dołącz do społeczności obejmującej ponad 15 000 ekspertów #CubeAlumni, w tym dyrektora generalnego Amazon.com Andy’ego Jassy’ego, założyciela i dyrektora generalnego Dell Technologies Michaela Della, dyrektora generalnego firmy Intel Pata Gelsingera oraz wielu innych luminarzy i ekspertów.

„TheCUBE jest ważnym partnerem branży. Naprawdę jesteście częścią naszych wydarzeń i naprawdę doceniamy wasze przybycie. Wiem, że ludzie również doceniają treści, które tworzycie” – Andy Jassy

DZIĘKUJĘ

źródło

LEAVE A REPLY

Please enter your comment!
Please enter your name here