Stable Diffusion dodaje generowanie wideo

Generuj wysokiej rozdzielczości wideo z tekstu i obrazów – oto nowa obietnica Stable Video Diffusion. Obecnie, niestety, ograniczona tylko dla badaczy (nie na użytek komercyjny).

Twórca Stable Diffusion, Stability AI, zaprezentował swój pierwszy model generowania wideo oparty na popularnym systemie tekst-na-obraz.

Firma ujawniła Video Diffusion, generatywny model AI wideo, który może tworzyć wideo z podpowiedzi tekstowych.

Wystarczy wpisać np. “rakieta startująca na pustyni” lub “fale rozbijające się o brzeg”, a Video Diffusion stworzy pożądany wynik w postaci filmu.

Model ten może również generować wideo ze zdjęć. Zgodnie z dokumentem Stable Video Diffusion, zespół stojący za nim zaprojektował rozwiązanie w taki sposób, aby zapewnić wysokiej rozdzielczości modelowanie obraz-na-wideo.

Jak uzyskać dostęp do Stable Video Diffusion

Model jest przeznaczony do zadań takich jak wielopunktowa synteza z pojedynczego obrazu – animatorzy mogą go używać do generowania różnych kątów kamery obiektu lub pomocy w tworzeniu środowisk 3D dla doświadczeń VR i AR.

Dalsza część pod materiałem wideo:

Model jest obecnie ograniczony wyłącznie do badań. Wpis na blogu Stability stwierdza, że model “nie jest przeznaczony do zastosowań w rzeczywistym świecie lub komercyjnych na tym etapie”.

Zamiast tego, twórca narzędzia szuka na razie opinii na temat bezpieczeństwa i jakości, aby dopracować model do ostatecznego wydania.

Badacze mogą uzyskać dostęp do kodu dla Video Diffusion za pośrednictwem GitHub. Wagi potrzebne do lokalnego uruchomienia modelu można znaleźć na Hugging Face.

Stable Video Diffusion jest dostępny za pośrednictwem dwóch modeli obraz-na-wideo, zdolnych do generowania 14 i 25 klatek przy regulowanych prędkościach klatek od trzech do 30 klatek na sekundę.

We wczesnych oznakach swoich możliwości, Stability przeprowadziło badania preferencji użytkowników. Firma stwierdziła, że Video Diffusion było preferowane przez odbiorców, w porównaniu do konkurencyjnych modeli od Pika Labs i Runway do generowania wideo.

Badanie wykazało, że użytkownicy preferują Stable Video Diffusion

Można zapisać się na listę oczekujących na dostęp do nadchodzącej aplikacji z interfejsem tekst-na-wideo, który pokazuje praktyczne zastosowania Stable Video Diffusion w edukacji, marketingu i rozrywce. W formularzu kontaktowym wybierz “Stable Video – Waitlist” w rozwijanym menu.

ChatGPT w pracy biurowej – kiedy można go używać, a jakie sytuacje go wykluczają

Gdzie pojechać na majówkę? Określ swoje preferencje i zapytaj chatbota

Cyberlekcje 3.0 pozwolą zrozumieć i przekazywać wiedzę o zagrożeniach technologicznych w sieci

Czym jest silna sztuczna inteligencja?

Jak Polska radzi sobie z adaptacją generatywnej AI? Sprawdzamy w raporcie Generative AI Adoption

CERT Orange Polska podsumowuje 10 lat ochrony użytkowników przed zagrożeniami w sieci. Co zmieniło AI?

Czy AI zadomowiło się w polskich firmach? Sprawdzamy z raportem EFL

Chcemy kreować innowacje, budować suwerenność technologiczną a państwo ma pozostać w centrum rozwoju cyfryzacji – analiza PIE

Zakupy bez kliknięcia. Agentic AI zmieni e-commerce szybciej, niż myślisz

Windsurf chce przejąć kontrolę nad całym procesem inżynierii oprogramowania

Potencjał i aspiracje mamy. Polska może wziąć udział w wyścigu o AI

Szwajcarska firma IT sięga po prywatną chmurę dla AI

Obserwuje świat i wyciąga wnioski – nowy model AI – V-JEPA 2 od Meta

Czym jest vibe coding i co ma wspólnego z AI?

Google zachwyca swoim najnowszym modelem wideo Veo 3

Rola Edge Computing w AI. Nowe kierunki technologicznego rozwoju sztucznej inteligencji

Europa przyspiesza wyścig o suwerenną AI. Gigafabryki, miliardy i ostrzeżenie Nvidii

ChatGPT ma pamiętać wszystko na twój temat. To budzi grozę i ekscytację zarazem

Czy sztuczna inteligencja jest niebezpieczna? To zależy

Przyszłość robotyki w 2025 r. Od humanoidów po AI

Jak zyskać na sztucznej inteligencji czas (i pieniądze)?

Dla pracowników IT wynagrodzenie nie jest najważniejsze

Łukasz Kaiser: ekspert stojący za rozwojem machine learning z prestiżową nagrodą

AI w programach edukacyjnych Centrum Kształcenia Podyplomowego Uczelni Łazarskiego

Europa przyspiesza wyścig o suwerenną AI. Gigafabryki, miliardy i ostrzeżenie Nvidii

Zakupy bez kliknięcia. Agentic AI zmieni e-commerce szybciej, niż myślisz

Obserwuje świat i wyciąga wnioski – nowy model AI – V-JEPA 2 od Meta

ChatGPT w pracy biurowej – kiedy można go używać, a jakie sytuacje go wykluczają

Stable Diffusion dodaje generowanie wideo

Jak uzyskać dostęp do Stable Video Diffusion

Tinder wdraża obowiązkową weryfikację twarzy użytkownika w stanie Kalifornia. To początek nowej strategii

Dania pracuje nad zakazem rozpowszechniania deepfake’ów w sieci

Nvidia wraca na szczyt najlepiej wycenianych firm – triumf sztucznej inteligencji i precyzyjnej strategii

Stable Diffusion dodaje generowanie wideo

Jak uzyskać dostęp do Stable Video Diffusion

Polecane