Stable Diffusion dodaje generowanie wideo

Generuj wysokiej rozdzielczości wideo z tekstu i obrazów – oto nowa obietnica Stable Video Diffusion. Obecnie, niestety, ograniczona tylko dla badaczy (nie na użytek komercyjny).

Twórca Stable Diffusion, Stability AI, zaprezentował swój pierwszy model generowania wideo oparty na popularnym systemie tekst-na-obraz.

Firma ujawniła Video Diffusion, generatywny model AI wideo, który może tworzyć wideo z podpowiedzi tekstowych.

Wystarczy wpisać np. „rakieta startująca na pustyni” lub „fale rozbijające się o brzeg”, a Video Diffusion stworzy pożądany wynik w postaci filmu.

Model ten może również generować wideo ze zdjęć. Zgodnie z dokumentem Stable Video Diffusion, zespół stojący za nim zaprojektował rozwiązanie w taki sposób, aby zapewnić wysokiej rozdzielczości modelowanie obraz-na-wideo.

Jak uzyskać dostęp do Stable Video Diffusion

Model jest przeznaczony do zadań takich jak wielopunktowa synteza z pojedynczego obrazu – animatorzy mogą go używać do generowania różnych kątów kamery obiektu lub pomocy w tworzeniu środowisk 3D dla doświadczeń VR i AR.

Dalsza część pod materiałem wideo:

Model jest obecnie ograniczony wyłącznie do badań. Wpis na blogu Stability stwierdza, że model „nie jest przeznaczony do zastosowań w rzeczywistym świecie lub komercyjnych na tym etapie”.

Zamiast tego, twórca narzędzia szuka na razie opinii na temat bezpieczeństwa i jakości, aby dopracować model do ostatecznego wydania.

Badacze mogą uzyskać dostęp do kodu dla Video Diffusion za pośrednictwem GitHub. Wagi potrzebne do lokalnego uruchomienia modelu można znaleźć na Hugging Face.

Stable Video Diffusion jest dostępny za pośrednictwem dwóch modeli obraz-na-wideo, zdolnych do generowania 14 i 25 klatek przy regulowanych prędkościach klatek od trzech do 30 klatek na sekundę.

We wczesnych oznakach swoich możliwości, Stability przeprowadziło badania preferencji użytkowników. Firma stwierdziła, że Video Diffusion było preferowane przez odbiorców, w porównaniu do konkurencyjnych modeli od Pika Labs i Runway do generowania wideo.

Badanie wykazało, że użytkownicy preferują Stable Video Diffusion

Można zapisać się na listę oczekujących na dostęp do nadchodzącej aplikacji z interfejsem tekst-na-wideo, który pokazuje praktyczne zastosowania Stable Video Diffusion w edukacji, marketingu i rozrywce. W formularzu kontaktowym wybierz „Stable Video – Waitlist” w rozwijanym menu.

Model sylwetki 3D. Rewolucja w analizie ludzkiego ciała

AI slop – zjawisko, które degeneruje dziś treści w sieci

ChatGPT w pracy biurowej – kiedy można go używać, a jakie sytuacje go wykluczają

Gdzie pojechać na majówkę? Określ swoje preferencje i zapytaj chatbota

Europa wychodzi z cienia i przyspiesza w wyścigu o dominację w AI

Centrum XAI uruchomione na Politechnice Warszawskiej

Jak będzie wyglądał świat w 2030 roku

Sztuczna inteligencja „uczy się” o Rzymie. DeepMind otwiera nową epokę w badaniach nad starożytnością

Zakupy bez kliknięcia. Agentic AI zmieni e-commerce szybciej, niż myślisz

Windsurf chce przejąć kontrolę nad całym procesem inżynierii oprogramowania

Potencjał i aspiracje mamy. Polska może wziąć udział w wyścigu o AI

Szwajcarska firma IT sięga po prywatną chmurę dla AI

Europa wychodzi z cienia i przyspiesza w wyścigu o dominację w AI

Generator wypracowań: rewolucja w edukacji czy zagrożenie dla rozwoju intelektualnego?

Okulary Orion. Przełom w technologii rozszerzonej rzeczywistości

Symulator wieku: zobacz siebie za 30 lat

S/4HANA – system ERP nowej generacji

Sieć Hopfielda. Rewolucyjna architektura sztucznej inteligencji inspirowana mózgiem

Donald Trump przedstawił plan dotyczący AI. Wyraził sprzeciw wobec opłat za prawa autorskie

Europa przyspiesza wyścig o suwerenną AI. Gigafabryki, miliardy i ostrzeżenie Nvidii

Jak zyskać na sztucznej inteligencji czas (i pieniądze)?

Dla pracowników IT wynagrodzenie nie jest najważniejsze

Łukasz Kaiser: ekspert stojący za rozwojem machine learning z prestiżową nagrodą

AI w programach edukacyjnych Centrum Kształcenia Podyplomowego Uczelni Łazarskiego

Europa wychodzi z cienia i przyspiesza w wyścigu o dominację w AI

Centrum XAI uruchomione na Politechnice Warszawskiej

S/4HANA – system ERP nowej generacji

Sieć Hopfielda. Rewolucyjna architektura sztucznej inteligencji inspirowana mózgiem

Stable Diffusion dodaje generowanie wideo

Jak uzyskać dostęp do Stable Video Diffusion

Europa wychodzi z cienia i przyspiesza w wyścigu o dominację w AI

Centrum XAI uruchomione na Politechnice Warszawskiej

S/4HANA – system ERP nowej generacji

Stable Diffusion dodaje generowanie wideo

Jak uzyskać dostęp do Stable Video Diffusion

Polecane