Jednym z najnowszych narzędzi w tej dziedzinie jest Sora – wyczekiwany generator wideo stworzony przez OpenAI. Choć jego potencjał wydaje się ogromny, tożsamość treści, na których narzędzie było trenowane, budzi kontrowersje. Wielu ekspertów wskazuje na to, że Sora mogła uczyć się na podstawie materiałów związanych z grami komputerowymi. Jakie mogą być tego konsekwencje? Przyjrzyjmy się bliżej tej sprawie.
Przypuszczenia dotyczące danych treningowych
Od momentu premiery generatora Sora w grudniu 2024 roku użytkownicy zaczęli zauważać, że generowane przez nią wideo mają uderzające podobieństwo do popularnych gier komputerowych. Przykłady obejmują tytuły takie jak Super Mario Bros, Call of Duty czy Teenage Mutant Ninja Turtles. W niektórych przypadkach klipy generowane przez Sorę przypominały nawet znanych streamerów, takich jak Pokimane czy Auronplay, wraz z charakterystycznymi elementami, np. tatuażami. Możemy się im przyglądać w zagranicznych mediach, ponieważ w Polsce Sora jest jeszcze niedostępna.
Te obserwacje wzbudziły pytania o to, jakie dane były wykorzystane do szkolenia tego modelu. Oficjalnie OpenAI informuje, że Sora została przeszkolona na podstawie „mieszanki publicznie dostępnych danych, danych licencjonowanych i danych stworzonych wewnętrznie”. Jednak brak konkretnych szczegółów powoduje spekulacje, że w procesie mogły być użyte materiały z platform takich jak Twitch czy YouTube, w tym zapisy z rozgrywek gier komputerowych.
Pozostała część artykułu pod materiałem wideo:
Wyzwania prawne
Jednym z kluczowych problemów związanych z trenowaniem modeli AI na takich danych są kwestie praw autorskich. Filmy z rozgrywek gier zawierają co najmniej dwie warstwy chronione prawem: same treści gry należące do jej twórców oraz unikalne nagrania stworzone przez graczy. Dodatkowo, w przypadku gier takich jak Fortnite, gdzie gracze mogą tworzyć własne mapy, pojawia się trzecia warstwa praw związana z treściami generowanymi przez użytkowników.
Eksperci prawni, jak Joshua Weigensberg z kancelarii Pryor Cashman, ostrzegają, że szkolenie AI na tego rodzaju materiałach może być uznane za naruszenie praw autorskich, o ile nie uzyskano stosownych licencji. „Firmy wykorzystujące nieautoryzowane nagrania z gier podejmują ogromne ryzyko prawne” – zauważa Weigensberg. Problem staje się jeszcze bardziej złożony w kontekście treści generowanych na podstawie tych danych.
Openai's Sora generating 3d perspective from a 2D image in @TheTreeverse
— Robbie Ferguson 🅧 | Immutable (@0xferg) December 16, 2024
The convergence of gaming + AI is going to be absolutely insane.
And gorgeous. pic.twitter.com/QFKnf8sJ5u
Ryzyko dla branży AI
Generatory takie jak Sora są modelami probabilistycznymi. Uczą się wzorców z danych treningowych i na tej podstawie tworzyć nowe treści. Jednak w przypadku danych wideo może dochodzić do sytuacji, w których modele generują treści niemal identyczne z oryginalnymi materiałami, co budzi pytania o potencjalne naruszenia praw autorskich i znaków towarowych.
Co więcej, niektóre generowane treści mogą zawierać elementy związane z wizerunkiem i prawami do podobizn znanych osób, co otwiera kolejne pole do sporów prawnych. Przykład wspomniany na łamach TechCrunch daje sporo do myślenia. Jeden z wygenerowanych streamerów był łudząco podobny do Raúla Álvareza Genesa (streamer z platformy Twitch). Wydaje się, że Sora mogła zostać przeszkolona na materiałach zawierających te chronione treści twórców internetowych.
Jakie będą dalsze kroki?
OpenAI, podobnie jak inne firmy zajmujące się generatywną sztuczną inteligencją, zdaje się preferować podejście „najpierw działanie, potem negocjacje”. Czy takie podejście się opłaci? Dotychczasowe procesy sądowe związane z generatywną AI, jak te przeciwko Microsoftowi czy Stability AI, pokazują, że kwestia praw autorskich w kontekście trenowania modeli pozostaje nierozstrzygnięta. Sądy mogą uznać, że tworzona przez AI treść ma charakter transformacyjny, co mogłoby uzasadniać jej użycie jako fair use.
Wpływ na gaming
Jeśli jednak sądy uznają, że trenowanie modeli na nieautoryzowanych danych stanowi naruszenie praw autorskich, branża AI kolejny raz będzie musiała zmienić swoje podejście do danych treningowych. Dla przemysłu gamingowego oznaczałoby to zwiększone możliwości ochrony swoich treści, ale także konieczność negocjowania licencji z firmami AI. To szczególnie interesujące w kontekście rozwijania asystentów AI Gemini, którzy mają wspierać gamerów.
Sytuacja generatora wideo Sora pokazuje, jak złożone mogą być relacje między sztuczną inteligencją a twórczością ludzką. Rynek stoi przed wyzwaniem wypracowania nowych standardów, które pozwolą na rozwój technologii, a jednocześnie zapewnią ochronę praw twórców.
Przeczytaj także: