• Meta wykorzystuje publiczne zdjęcia i tekst z Instagrama i Facebooka do szkolenia generatora zamiany tekstu na obraz AI.
  • Dyrektor Meta, Chris Cox, powiedział podczas szczytu technologicznego Bloomberga, że ​​firma „nie szkoli się w zakresie prywatnych rzeczy”.
  • Komentarze dyrektora ds. produktu pojawiają się w czasie, gdy firmy Big Tech ścigają się w zdobywaniu danych do trenowania modeli sztucznej inteligencji.

Są to firmy Big Tech szyfrowanie danych szkoleniowych AI I Meta wydaje się mieć jedną dużą przewagę nad rywalami: wykorzystanie Instagrama I Facebook zdjęcia.

Dyrektor ds. produktu w Meta, Chris Cox, powiedział w czwartek podczas szczytu technologicznego Bloomberga, że ​​wykorzystuje publicznie dostępne zdjęcia i tekst z platform do szkolenia swojego modelu generatora tekstu na obraz o nazwie Emu.

„Nie szkolimy się na tematach prywatnych, nie szkolimy na tematach, którymi ludzie dzielą się ze swoimi przyjaciółmi, szkolimy się na tematach publicznych” – powiedział.

Model zamiany tekstu na obraz Meta może generować „obrazy o naprawdę niesamowitej jakości”, ponieważ na Instagramie znajduje się wiele zdjęć „sztuki, mody, kultury, a także samych zdjęć ludzi i nas” – dodał Cox.

Użytkownicy mogą tworzyć obrazy w Meta AI, wpisując znak zachęty zaczynający się od słowa „wyobraź sobie”, a według strony internetowej Meta AI wygeneruje cztery obrazy.

Aby modele AI były skuteczne, należy je karmić i szkolić w oparciu o dane. To była kwestia sporna, ponieważ prawie tak było nie ma sposobu, aby zapobiec treści chronionych prawem autorskim przed zeskrobaniem z Internetu i wykorzystaniem ich do stworzenia LLM.

Jednakże amerykański Urząd ds. praw autorskich próbuje uporać się z tym problemem od początku ubiegłego roku i faktycznie to robi rozważa aktualizację swoich przepisów aby się tym zająć.

Jednym ze sposobów, w jaki firmy próbują uzyskać dane, jest łączenie sił z innymi firmami. Na przykład OpenAI nawiązał współpracę z kilkoma mediami w celu licencjonowania ich treści i opracowywania modeli.

Meta rozważała nawet przejęcie wydawcy Simon & Schuster w celu uzyskania większej ilości danych do trenowania swoich modeli, Poinformował o tym „The New York Times”. w zeszłym miesiącu.

Oprócz surowych zbiorów danych firmy wykorzystują do szkolenia swoich modeli „pętle informacji zwrotnej” — dane gromadzone na podstawie przeszłych interakcji i wyników, które są analizowane w celu poprawy przyszłej wydajności. Zawiera algorytmy, które informują modele AI o wystąpieniu błędu, aby mogła się na nim uczyć.

Dyrektor generalny Meta Mark Zuckerberg w zeszłym miesiącu powiedział o tym The Verge pętle informacji zwrotnej będą „bardziej wartościowe” niż jakikolwiek „z góry korpus”.

Meta nie odpowiedziała natychmiast na prośbę Business Insidera o komentarz złożoną poza normalnymi godzinami pracy.

źródło