Koszty AI DeepSeek znacznie przekraczają rzekome 5,5 mln dol.

Mogą sięgać nawet 1,6 miliarda dolarów, bo chińska technologia powstała przy użyciu 50 000 procesorów graficznych Nvidia.

Chińska firma DeepSeek wprowadziła niedawno chaos w wielomiliardowym przemyśle AI, wydając model R1, który podobno konkuruje z o1 OpenAI, mimo że został przeszkolony na 2048 Nvidia H800 i kosztował 5,576 miliona dolarów. Jednak nowy raport twierdzi, że rzeczywiste koszty poniesione przez firmę wyniosły 1,6 miliarda dolarów, a DeepSeek ma dostęp do ok. 50 000 procesorów graficznych Hopper.

Twierdzenie, że DeepSeek był w stanie przetrenować R1 przy użyciu ułamka zasobów wymaganych przez duże firmy technologiczne inwestujące w AI, spowodowało spadek ceny akcji Nvidii o rekordowe 600 miliardów dolarów w ciągu jednego dnia. Jeśli chiński startup mógł stworzyć tak potężny model bez wydawania miliardów na najpotężniejsze procesory graficzne AI Team Green, co powstrzymałoby innych przed zrobieniem tego samego?

Ale czy DeepSeek naprawdę stworzył swój model Mixture-of-Experts, który wciąż zajmuje czołowe miejsca w rankingu Apple App Store, przy tak niskich kosztach? SemiAnalysis twierdzi, że nie.

Firma zajmująca się analizą rynku pisze, że DeepSeek ma dostęp do około 50 000 procesorów graficznych Hopper, w tym 10 000 H800 i 10 000 H100. Ma również zamówienia na wiele więcej procesorów H20 specyficznych dla Chin. Procesory graficzne są dzielone między High-Flyer, fundusz hedgingowy za DeepSeek, a startup. Są one rozmieszczone w kilku lokalizacjach geograficznych i wykorzystywane do handlu, wnioskowania, szkolenia i badań.

SemiAnalysis pisze, że DeepSeek zainwestował znacznie więcej niż twierdzona kwota 5,5 miliona dolarów, która wywołała zamieszanie na rynku akcji – raport stwierdza, że ten koszt przedtreningowy to bardzo wąska część całości. Całkowita inwestycja firmy w serwery wynosi około 1,6 miliarda dolarów, z około 944 milionami dolarów wydanymi na koszty operacyjne. Inwestycje w procesory graficzne natomiast stanowią ponad 500 milionów dolarów.

Jako przykład referencyjny, Claude 3.5 Sonnet firmy Anthropic kosztował dziesiątki milionów dolarów na szkolenie, ale firma nadal musiała pozyskać miliardy dolarów inwestycji od Google i Amazon.

Zauważono, że DeepSeek pozyskuje cały swój talent wyłącznie z Chin. To kontrastuje z raportami o innych chińskich firmach technologicznych, takich jak Huawei, próbujących pozyskiwać pracowników z zagranicy, przy czym pracownicy tajwańscy z TSMC są bardzo poszukiwanymi celami. DeepSeek rzekomo oferuje wynagrodzenia przekraczające 1,3 miliona dolarów dla obiecujących kandydatów, znacznie więcej niż płacą konkurencyjne chińskie firmy AI.

DeepSeek ma również przewagę, polegającą na tym, że w większości prowadzi własne centra danych, zamiast polegać na zewnętrznych dostawcach chmury. To pozwala na więcej eksperymentów i innowacji w całym stosie produktów AI. SemiAnalysis pisze, że jest to obecnie najlepsze laboratorium “open weights”, przewyższające wysiłki Meta z Llama, Mistral i innych.

Czytaj też:

ChatGPT w pracy biurowej – kiedy można go używać, a jakie sytuacje go wykluczają

Gdzie pojechać na majówkę? Określ swoje preferencje i zapytaj chatbota

Cyberlekcje 3.0 pozwolą zrozumieć i przekazywać wiedzę o zagrożeniach technologicznych w sieci

Czym jest silna sztuczna inteligencja?

Jak Polska radzi sobie z adaptacją generatywnej AI? Sprawdzamy w raporcie Generative AI Adoption

CERT Orange Polska podsumowuje 10 lat ochrony użytkowników przed zagrożeniami w sieci. Co zmieniło AI?

Czy AI zadomowiło się w polskich firmach? Sprawdzamy z raportem EFL

Chcemy kreować innowacje, budować suwerenność technologiczną a państwo ma pozostać w centrum rozwoju cyfryzacji – analiza PIE

Zakupy bez kliknięcia. Agentic AI zmieni e-commerce szybciej, niż myślisz

Windsurf chce przejąć kontrolę nad całym procesem inżynierii oprogramowania

Potencjał i aspiracje mamy. Polska może wziąć udział w wyścigu o AI

Szwajcarska firma IT sięga po prywatną chmurę dla AI

Obserwuje świat i wyciąga wnioski – nowy model AI – V-JEPA 2 od Meta

Czym jest vibe coding i co ma wspólnego z AI?

Google zachwyca swoim najnowszym modelem wideo Veo 3

Rola Edge Computing w AI. Nowe kierunki technologicznego rozwoju sztucznej inteligencji

Europa przyspiesza wyścig o suwerenną AI. Gigafabryki, miliardy i ostrzeżenie Nvidii

ChatGPT ma pamiętać wszystko na twój temat. To budzi grozę i ekscytację zarazem

Czy sztuczna inteligencja jest niebezpieczna? To zależy

Przyszłość robotyki w 2025 r. Od humanoidów po AI

Jak zyskać na sztucznej inteligencji czas (i pieniądze)?

Dla pracowników IT wynagrodzenie nie jest najważniejsze

Łukasz Kaiser: ekspert stojący za rozwojem machine learning z prestiżową nagrodą

AI w programach edukacyjnych Centrum Kształcenia Podyplomowego Uczelni Łazarskiego

Europa przyspiesza wyścig o suwerenną AI. Gigafabryki, miliardy i ostrzeżenie Nvidii

Zakupy bez kliknięcia. Agentic AI zmieni e-commerce szybciej, niż myślisz

Obserwuje świat i wyciąga wnioski – nowy model AI – V-JEPA 2 od Meta

ChatGPT w pracy biurowej – kiedy można go używać, a jakie sytuacje go wykluczają

Koszty AI DeepSeek znacznie przekraczają rzekome 5,5 mln dol.

Dania pracuje nad zakazem rozpowszechniania deepfake’ów w sieci

Nvidia wraca na szczyt najlepiej wycenianych firm – triumf sztucznej inteligencji i precyzyjnej strategii

Intel będzie wspierać wdrażanie AI w polskim przemyśle – rusza program „AI for Industry”

Koszty AI DeepSeek znacznie przekraczają rzekome 5,5 mln dol.

Polecane