Sora to nowy model AI wprowadzony przez lidera w dziedzinie sztucznej inteligencji, OpenAI, który umożliwia tworzenie „realistycznych” i „kreatywnych” 60-sekundowych filmów z krótkich poleceń tekstowych. Model ten jest zdolny do generowania wideo trwających do 60 sekund na podstawie instrukcji tekstowych, oferując sceny z wieloma postaciami, określonymi rodzajami ruchu oraz szczegółowymi detalami tła. Co ważne, Sora rozumie nie tylko to, czego użytkownik zażądał w poleceniu, ale także jak te elementy istnieją w fizycznym świecie.

    Kolejny krok w świat sztucznej inteligencji z OpenAI

    OpenAI zamierza szkolić modele AI tak, aby mogły one pomagać ludziom w rozwiązywaniu problemów wymagających interakcji z rzeczywistym światem. Jest to najnowsze działanie firmy, która stoi za chatbotem ChatGPT, kontynuujące napędzanie ruchu generatywnej AI. Chociaż modele wielomodalne nie są nowością i modele tekst-na-wideo już istnieją, to co wyróżnia Sorę, to długość projektów i dokładność, jaką OpenAI przypisuje temu modelowi.

    Projekt Sora jest w toku i ma wyraźne „słabości”, zwłaszcza jeśli chodzi o szczegóły przestrzenne polecenia – takie jak pomieszanie lewej i prawej strony – oraz relację przyczyna-skutek. Na przykład, algorytm tworząc wideo, na którym ktoś gryzie ciastko, stworzy kolejne klatki, gdzie zaraz po tym nie ma śladu ugryzienia.

    Na razie OpenAI koncentruje się na bezpieczeństwie. Firma planuje współpracować z zespołem ekspertów w celu przetestowania najnowszego modelu i przyjrzenia się różnym obszarom, w tym dezinformacji, treściom pełnym nienawiści i stronniczości. Potentat AI w wypowiedziach medialnych twierdzi również, że buduje narzędzia, które pomogą wykrywać wprowadzające w błąd informacje.

    REKLAMA
    BrandMe CEO
    REKLAMA
    BrandMe CEO

    Sora zostanie najpierw udostępniona profesorom zajmującym się cyberbezpieczeństwem, tzw. „red teamers”, którzy mogą ocenić produkt pod kątem szkód lub ryzyka. Dostęp zostanie również przyznany wielu artystom wizualnym, projektantom i filmowcom, aby zebrać informacje zwrotne na temat tego, jak profesjonaliści kreatywni mogliby go wykorzystać.

    Materiały Sora OpenAI

    Chcesz przetestować narzędzie Sora? Musisz jeszcze chwilę poczekać

    Jeśli chcesz zobaczyć Sora w akcji, OpenAI opublikowało kilka demonstracji w swoim ogłoszeniu. CEO OpenAI, a Sam Altman, również udostępnia filmy z promptów zażądanych przez użytkowników na platformie X.

    Jak już wspomniano, obecnie Sora jest w fazie testów adwersyjnych (red-teaming phase), co oznacza, że jest testowana pod kątem potencjalnego tworzenia szkodliwych lub nieodpowiednich treści. OpenAI udziela dostępu do Sory wybranej grupie „wizualnych artystów, projektantów i filmowców”, aby uzyskać informacje zwrotne na temat tego, jak najlepiej rozwijać model, aby był jak najbardziej pomocny dla profesjonalistów kreatywnych. Celem OpenAI jest zapewnienie, aby profesjonaliści mogli korzystać z tej technologii, a nie zostać przez nią zastąpieni.

    Materiały Sora OpenAI

    W tym momencie Sora nie jest jeszcze dostępna publicznie, a OpenAI nie podzieliło się żadnym harmonogramem dotyczącym szerokiego wdrożenia. Chyba że jesteś częścią zespołu testującego lub jednym z kreatywnych testerów, musisz poczekać i zadowolić się istniejącymi demonstracjami.

    Czytaj dalej:

    REKLAMA
    BrandMe CEO