Dołącz do naszych codziennych i cotygodniowych biuletynów, aby otrzymywać najnowsze aktualizacje i ekskluzywne treści na temat wiodącego w branży zakresu sztucznej inteligencji. dowiedz się więcej


Nawet gdy jego duży partner inwestycyjny OpenAI w dalszym ciągu ogłasza potężniejsze modele logiczne, takie jak najnowsza seria O3, Microsoft nie pozostaje bezczynny. Zamiast tego pracuje nad rozwojem mocniejszych, mniejszych modeli wypuszczanych pod własną marką.

Jak ogłosiło dzisiaj na X, kilku obecnych i byłych badaczy firmy Microsoft oraz naukowców zajmujących się sztuczną inteligencją, Microsoft wypuszcza swój model Phi-4 Jako projekt całkowicie open source z mnóstwem treści do pobrania przytulanie twarzySpołeczność dzieląca się kodem AI.

„Jesteśmy całkowicie zaskoczeni reakcją na premierę Fi-4” Sheetal Shah, główny inżynier ds. badań w Microsoft AI, napisał na X„Wiele osób prosiło nas, żebyśmy schudli. (Niektórzy nawet przesłali nielegalne ciężarki phi-4 do HuggingFace… Cóż, nie czekaj dłużej. Dzisiaj wypuszczamy oficjalny model phi-4 na HuggingFace! Z licencją MIT!!

mowa o wadze wartości liczbowe Określa, w jaki sposób model języka AI, mały lub duży, rozumie i generuje język i dane. Wagi modelu są ustalane w procesie uczenia, zwykle w drodze głębokiego uczenia się bez nadzoru, podczas którego model określa, jakie wyniki powinny zostać dostarczone, na podstawie otrzymanych danych wejściowych. Wagi modelu mogą być dostosowywane przez badaczy i twórców modeli poprzez dodanie do modelu własnych ustawień, zwanych odchyleniami, podczas szkolenia. Modelu na ogół nie uważa się za w pełni otwarty, dopóki jego wagi nie zostaną upublicznione, ponieważ pozwala to innym badaczom na przejęcie modelu i całkowite jego dostosowanie lub wykorzystanie go jako własnego

Chociaż Microsoft faktycznie ujawnił Phi-4 w zeszłym miesiącu, jego zastosowanie początkowo ograniczało się do nowej platformy programistycznej Azure AI Foundry firmy Microsoft.

Teraz Phi-4 jest dostępny poza tą zastrzeżoną usługą dla każdego, kto ma konto Hugging Face i jest wyposażony w liberalną licencję MIT, która pozwala na jego wykorzystanie nawet do zastosowań komercyjnych.

Ta wersja zapewnia badaczom i programistom pełny dostęp do 14 miliardów parametrów modelu, umożliwiając eksperymentowanie i wdrażanie bez ograniczeń zasobów często kojarzonych z dużymi systemami sztucznej inteligencji.

Przejdź w stronę wydajności w AI

Phi-4 został po raz pierwszy uruchomiony na platformie Azure AI Foundry firmy Microsoft w grudniu 2024 r., gdzie programiści mogli uzyskać do niego dostęp w ramach umowy licencyjnej na badania.

Model szybko zyskał uwagę, ponieważ przewyższa wiele większych odpowiedników w obszarach takich jak rozumowanie matematyczne i wielozadaniowe rozumienie języków, wymagając jednocześnie znacznie mniej zasobów obliczeniowych.

Uproszczona architektura modelu oraz skupienie się na logice i rozumowaniu mają zaspokoić rosnące zapotrzebowanie na wysoką wydajność sztucznej inteligencji, która pozostaje wydajna w środowiskach o ograniczonych obliczeniach i pamięci. Dzięki temu wydaniu typu open source na liberalnej licencji MIT Microsoft sprawia, że ​​Phi-4 staje się bardziej dostępny dla szerszej publiczności badaczy i programistów, nawet komercyjnych, którzy są zaangażowani w projektowanie i wdrażanie modeli w branży sztucznej inteligencji zmienić sposób.

Co sprawia, że ​​Phi-4 jest wyjątkowy?

Phi-4 wyróżnia się w testach porównawczych, które testują zaawansowane rozumowanie i możliwości specyficzne dla domeny. Główne atrakcje to:

• Uzyskał ponad 80% punktów w trudnych testach porównawczych, takich jak MATH i MGSM, przewyższając większe modele, takie jak Google Gemini Pro i GPT-4o-Mini.

• Lepsza wydajność w zadaniach związanych z rozumowaniem matematycznym, ważna umiejętność w takich dziedzinach, jak finanse, inżynieria i badania naukowe.

• Imponujące wyniki w HumanEval w zakresie generowania kodu funkcjonalnego, co czyni go dobrym wyborem do programowania wspomaganego sztuczną inteligencją.

Co więcej, architekturę i proces szkolenia Phi-4 zaprojektowano z myślą o dokładności i wydajności. Jego 14-miliardowy, gęsty model Transformera przeznaczony wyłącznie do dekodera został wytrenowany na 9,8 biliona tokenach wyselekcjonowanego i syntetycznego zbioru danych, w tym:

• Publicznie dostępne dokumenty rygorystycznie filtrowane pod kątem jakości.

• Syntetyczne dane przypominające podręcznik, skupiające się na matematyce, kodowaniu i zdrowym rozsądku.

• Wysokiej jakości książki edukacyjne i zestawy danych z odpowiedziami na pytania.

Dane szkoleniowe obejmowały również treści wielojęzyczne (8%), chociaż model jest zoptymalizowany głównie pod kątem aplikacji anglojęzycznych.

Jej twórcy w firmie Microsoft twierdzą, że procesy bezpieczeństwa i wyrównywania, w tym nadzorowane dostrajanie i bezpośrednia optymalizacja preferencji, zapewniają wysoką wydajność, a jednocześnie rozwiewają obawy dotyczące uczciwości i niezawodności.

Korzyści z otwartego oprogramowania

Udostępniając Phi-4 w pełnej okazałości i otulającą twarz na licencji MIT, Microsoft udostępnia go firmom do wykorzystania w ich działalności komercyjnej.

Programiści mogą teraz włączać model do swoich projektów lub dostrajać go do konkretnych zastosowań bez konieczności posiadania rozległych zasobów obliczeniowych lub zgody firmy Microsoft.

Posunięcie to jest również zgodne z rosnącym trendem w zakresie open source w zakresie podstawowych modeli sztucznej inteligencji w celu promowania innowacji i przejrzystości. W przeciwieństwie do zastrzeżonych modeli, które często są ograniczone do określonych platform lub interfejsów API, charakter Phi-4 typu open source zapewnia szeroką dostępność i możliwości adaptacji.

Równowaga bezpieczeństwa i wydajności

Wypuszczając Phi-4, Microsoft podkreśla znaczenie odpowiedzialnego rozwoju sztucznej inteligencji. Model przeszedł szeroko zakrojoną ocenę bezpieczeństwa, w tym testy kontradyktoryjne, aby zminimalizować ryzyko, takie jak stronniczość, tworzenie szkodliwych treści i dezinformacja.

Jednak programistom zaleca się wdrożenie dodatkowych zabezpieczeń dla aplikacji wysokiego ryzyka podczas wdrażania modeli we wrażliwych scenariuszach i oparcie wyników na zweryfikowanych, istotnych informacjach.

Implikacje dla krajobrazu AI

Phi-4 rzuca wyzwanie popularnemu trendowi skalowania modeli AI do większych rozmiarów. Pokazuje to, że małe, dobrze zaprojektowane modele mogą osiągnąć porównywalne lub lepsze wyniki w kluczowych obszarach.

Ta wydajność nie tylko zmniejsza koszty, ale także zużycie energii, dzięki czemu zaawansowane możliwości sztucznej inteligencji są bardziej dostępne dla średnich organizacji i przedsiębiorstw o ​​ograniczonych budżetach obliczeniowych.

Gdy programiści zaczną eksperymentować z modelem, wkrótce przekonamy się, czy może on służyć jako realna alternatywa dla konkurencyjnych modeli komercyjnych i open source z OpenAI, Anthropic, Google, Meta, DeepSeek i wielu innych.


Source link