Sora to nowy model AI wprowadzony przez lidera w dziedzinie sztucznej inteligencji, OpenAI, który umożliwia tworzenie „realistycznych” i „kreatywnych” 60-sekundowych filmów z krótkich poleceń tekstowych. Model ten jest zdolny do generowania wideo trwających do 60 sekund na podstawie instrukcji tekstowych, oferując sceny z wieloma postaciami, określonymi rodzajami ruchu oraz szczegółowymi detalami tła. Co ważne, Sora rozumie nie tylko to, czego użytkownik zażądał w poleceniu, ale także jak te elementy istnieją w fizycznym świecie.
Kolejny krok w świat sztucznej inteligencji z OpenAI
OpenAI zamierza szkolić modele AI tak, aby mogły one pomagać ludziom w rozwiązywaniu problemów wymagających interakcji z rzeczywistym światem. Jest to najnowsze działanie firmy, która stoi za chatbotem ChatGPT, kontynuujące napędzanie ruchu generatywnej AI. Chociaż modele wielomodalne nie są nowością i modele tekst-na-wideo już istnieją, to co wyróżnia Sorę, to długość projektów i dokładność, jaką OpenAI przypisuje temu modelowi.
Projekt Sora jest w toku i ma wyraźne „słabości”, zwłaszcza jeśli chodzi o szczegóły przestrzenne polecenia – takie jak pomieszanie lewej i prawej strony – oraz relację przyczyna-skutek. Na przykład, algorytm tworząc wideo, na którym ktoś gryzie ciastko, stworzy kolejne klatki, gdzie zaraz po tym nie ma śladu ugryzienia.
Na razie OpenAI koncentruje się na bezpieczeństwie. Firma planuje współpracować z zespołem ekspertów w celu przetestowania najnowszego modelu i przyjrzenia się różnym obszarom, w tym dezinformacji, treściom pełnym nienawiści i stronniczości. Potentat AI w wypowiedziach medialnych twierdzi również, że buduje narzędzia, które pomogą wykrywać wprowadzające w błąd informacje.
Sora zostanie najpierw udostępniona profesorom zajmującym się cyberbezpieczeństwem, tzw. „red teamers”, którzy mogą ocenić produkt pod kątem szkód lub ryzyka. Dostęp zostanie również przyznany wielu artystom wizualnym, projektantom i filmowcom, aby zebrać informacje zwrotne na temat tego, jak profesjonaliści kreatywni mogliby go wykorzystać.
Chcesz przetestować narzędzie Sora? Musisz jeszcze chwilę poczekać
Jeśli chcesz zobaczyć Sora w akcji, OpenAI opublikowało kilka demonstracji w swoim ogłoszeniu. CEO OpenAI, a Sam Altman, również udostępnia filmy z promptów zażądanych przez użytkowników na platformie X.
Jak już wspomniano, obecnie Sora jest w fazie testów adwersyjnych (red-teaming phase), co oznacza, że jest testowana pod kątem potencjalnego tworzenia szkodliwych lub nieodpowiednich treści. OpenAI udziela dostępu do Sory wybranej grupie „wizualnych artystów, projektantów i filmowców”, aby uzyskać informacje zwrotne na temat tego, jak najlepiej rozwijać model, aby był jak najbardziej pomocny dla profesjonalistów kreatywnych. Celem OpenAI jest zapewnienie, aby profesjonaliści mogli korzystać z tej technologii, a nie zostać przez nią zastąpieni.
W tym momencie Sora nie jest jeszcze dostępna publicznie, a OpenAI nie podzieliło się żadnym harmonogramem dotyczącym szerokiego wdrożenia. Chyba że jesteś częścią zespołu testującego lub jednym z kreatywnych testerów, musisz poczekać i zadowolić się istniejącymi demonstracjami.
Czytaj dalej: