Stwórz wideo na bazie tekstu z Sora od OpenAI

Sora to nowy model AI wprowadzony przez lidera w dziedzinie sztucznej inteligencji, OpenAI, który umożliwia tworzenie „realistycznych” i „kreatywnych” 60-sekundowych filmów z krótkich poleceń tekstowych. Model ten jest zdolny do generowania wideo trwających do 60 sekund na podstawie instrukcji tekstowych, oferując sceny z wieloma postaciami, określonymi rodzajami ruchu oraz szczegółowymi detalami tła. Co ważne, Sora rozumie nie tylko to, czego użytkownik zażądał w poleceniu, ale także jak te elementy istnieją w fizycznym świecie.

Kolejny krok w świat sztucznej inteligencji z OpenAI

OpenAI zamierza szkolić modele AI tak, aby mogły one pomagać ludziom w rozwiązywaniu problemów wymagających interakcji z rzeczywistym światem. Jest to najnowsze działanie firmy, która stoi za chatbotem ChatGPT, kontynuujące napędzanie ruchu generatywnej AI. Chociaż modele wielomodalne nie są nowością i modele tekst-na-wideo już istnieją, to co wyróżnia Sorę, to długość projektów i dokładność, jaką OpenAI przypisuje temu modelowi.

Projekt Sora jest w toku i ma wyraźne „słabości”, zwłaszcza jeśli chodzi o szczegóły przestrzenne polecenia – takie jak pomieszanie lewej i prawej strony – oraz relację przyczyna-skutek. Na przykład, algorytm tworząc wideo, na którym ktoś gryzie ciastko, stworzy kolejne klatki, gdzie zaraz po tym nie ma śladu ugryzienia.

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024

Na razie OpenAI koncentruje się na bezpieczeństwie. Firma planuje współpracować z zespołem ekspertów w celu przetestowania najnowszego modelu i przyjrzenia się różnym obszarom, w tym dezinformacji, treściom pełnym nienawiści i stronniczości. Potentat AI w wypowiedziach medialnych twierdzi również, że buduje narzędzia, które pomogą wykrywać wprowadzające w błąd informacje.

Sora zostanie najpierw udostępniona profesorom zajmującym się cyberbezpieczeństwem, tzw. „red teamers”, którzy mogą ocenić produkt pod kątem szkód lub ryzyka. Dostęp zostanie również przyznany wielu artystom wizualnym, projektantom i filmowcom, aby zebrać informacje zwrotne na temat tego, jak profesjonaliści kreatywni mogliby go wykorzystać.

Chcesz przetestować narzędzie Sora? Musisz jeszcze chwilę poczekać

Jeśli chcesz zobaczyć Sora w akcji, OpenAI opublikowało kilka demonstracji w swoim ogłoszeniu. CEO OpenAI, a Sam Altman, również udostępnia filmy z promptów zażądanych przez użytkowników na platformie X.

Jak już wspomniano, obecnie Sora jest w fazie testów adwersyjnych (red-teaming phase), co oznacza, że jest testowana pod kątem potencjalnego tworzenia szkodliwych lub nieodpowiednich treści. OpenAI udziela dostępu do Sory wybranej grupie „wizualnych artystów, projektantów i filmowców”, aby uzyskać informacje zwrotne na temat tego, jak najlepiej rozwijać model, aby był jak najbardziej pomocny dla profesjonalistów kreatywnych. Celem OpenAI jest zapewnienie, aby profesjonaliści mogli korzystać z tej technologii, a nie zostać przez nią zastąpieni.

W tym momencie Sora nie jest jeszcze dostępna publicznie, a OpenAI nie podzieliło się żadnym harmonogramem dotyczącym szerokiego wdrożenia. Chyba że jesteś częścią zespołu testującego lub jednym z kreatywnych testerów, musisz poczekać i zadowolić się istniejącymi demonstracjami.

Czytaj dalej:

Stwórz wideo na bazie tekstu z Sora od OpenAI

Kolejny krok w świat sztucznej inteligencji z OpenAI

Chcesz przetestować narzędzie Sora? Musisz jeszcze chwilę poczekać

Dania pracuje nad zakazem rozpowszechniania deepfake’ów w sieci

Nvidia wraca na szczyt najlepiej wycenianych firm – triumf sztucznej inteligencji i precyzyjnej strategii

Intel będzie wspierać wdrażanie AI w polskim przemyśle – rusza program „AI for Industry”

Stwórz wideo na bazie tekstu z Sora od OpenAI

Kolejny krok w świat sztucznej inteligencji z OpenAI

Chcesz przetestować narzędzie Sora? Musisz jeszcze chwilę poczekać

Polecane

Dania pracuje nad zakazem rozpowszechniania deepfake’ów w sieci

Nvidia wraca na szczyt najlepiej wycenianych firm – triumf sztucznej inteligencji i precyzyjnej strategii

Intel będzie wspierać wdrażanie AI w polskim przemyśle – rusza program „AI for Industry”