- Meta wykorzystuje publiczne zdjęcia i tekst z Instagrama i Facebooka do szkolenia generatora zamiany tekstu na obraz AI.
- Dyrektor Meta, Chris Cox, powiedział podczas szczytu technologicznego Bloomberga, że firma „nie szkoli się w zakresie prywatnych rzeczy”.
- Komentarze dyrektora ds. produktu pojawiają się w czasie, gdy firmy Big Tech ścigają się w zdobywaniu danych do trenowania modeli sztucznej inteligencji.
Są to firmy Big Tech szyfrowanie danych szkoleniowych AI I Meta wydaje się mieć jedną dużą przewagę nad rywalami: wykorzystanie Instagrama I Facebook zdjęcia.
Dyrektor ds. produktu w Meta, Chris Cox, powiedział w czwartek podczas szczytu technologicznego Bloomberga, że wykorzystuje publicznie dostępne zdjęcia i tekst z platform do szkolenia swojego modelu generatora tekstu na obraz o nazwie Emu.
„Nie szkolimy się na tematach prywatnych, nie szkolimy na tematach, którymi ludzie dzielą się ze swoimi przyjaciółmi, szkolimy się na tematach publicznych” – powiedział.
Model zamiany tekstu na obraz Meta może generować „obrazy o naprawdę niesamowitej jakości”, ponieważ na Instagramie znajduje się wiele zdjęć „sztuki, mody, kultury, a także samych zdjęć ludzi i nas” – dodał Cox.
Użytkownicy mogą tworzyć obrazy w Meta AI, wpisując znak zachęty zaczynający się od słowa „wyobraź sobie”, a według strony internetowej Meta AI wygeneruje cztery obrazy.
Aby modele AI były skuteczne, należy je karmić i szkolić w oparciu o dane. To była kwestia sporna, ponieważ prawie tak było nie ma sposobu, aby zapobiec treści chronionych prawem autorskim przed zeskrobaniem z Internetu i wykorzystaniem ich do stworzenia LLM.
Jednakże amerykański Urząd ds. praw autorskich próbuje uporać się z tym problemem od początku ubiegłego roku i faktycznie to robi rozważa aktualizację swoich przepisów aby się tym zająć.
Jednym ze sposobów, w jaki firmy próbują uzyskać dane, jest łączenie sił z innymi firmami. Na przykład OpenAI nawiązał współpracę z kilkoma mediami w celu licencjonowania ich treści i opracowywania modeli.
Meta rozważała nawet przejęcie wydawcy Simon & Schuster w celu uzyskania większej ilości danych do trenowania swoich modeli, Poinformował o tym „The New York Times”. w zeszłym miesiącu.
Oprócz surowych zbiorów danych firmy wykorzystują do szkolenia swoich modeli „pętle informacji zwrotnej” — dane gromadzone na podstawie przeszłych interakcji i wyników, które są analizowane w celu poprawy przyszłej wydajności. Zawiera algorytmy, które informują modele AI o wystąpieniu błędu, aby mogła się na nim uczyć.
Dyrektor generalny Meta Mark Zuckerberg w zeszłym miesiącu powiedział o tym The Verge pętle informacji zwrotnej będą „bardziej wartościowe” niż jakikolwiek „z góry korpus”.
Meta nie odpowiedziała natychmiast na prośbę Business Insidera o komentarz złożoną poza normalnymi godzinami pracy.