To, co wcześniej zajęłoby wcześniej dekady, teraz zrobiono w dwa tygodnie. Na początku lutego br. roku Anthropic wprowadził Claude Opus 4.6 – najmocniejszą wersję swojego flagowego modelu. To upgrade, który w kilku kluczowych obszarach przesuwa granice tego, co duże modele językowe potrafią robić samodzielnie przez dłuższy czas. A mówiąc wprost: udało się coś imponującego i rewolucyjnego.

    Wyobraź sobie, że zamiast zatrudniać 8–12-osobowy zespół analityków, programistów, researcherów i koordynatorów projektów – dajesz jedno polecenie AI i po kilku godzinach (albo dniach) dostajesz gotowy wynik: analizę finansową z 400 raportów, dashboard, narrację dla zarządu, wykryte anomalie, poprawioną prezentację i nawet zrecenzowany kod źródłowy.

    To już nie science-fiction. 5 lutego 2026 Anthropic pokazało Claude Opus 4.6 – model, który w praktyce robi właśnie taki skok.

    Dlaczego to naprawdę ważne (nawet jeśli nie jesteś programistą ani analitykiem)?

    Przez ostatnie 3–4 lata duże modele AI świetnie radziły sobie z pojedynczymi pytaniami, krótkim kodem, ładnymi tekstami. Ale jak tylko zadanie trwało dłużej niż 20–40 minut albo wymagało pracy na setkach stron dokumentów – wszystko się sypało. Model „zapominał”, gubił wątek, halucynował, powtarzał błędy.

    Opus 4.6 łamie ten mur na kilka sposobów jednocześnie:

    • Potrafi trzymać w „głowie” 1 milion tokenów (to ≈ 750 tysięcy słów, czyli gruba książka albo bardzo duży projekt kodowy) – i naprawdę z tego korzysta, a nie tylko udaje.
    • Znacznie lepiej planuje długie zadania – rozbija je na sensowne kroki, sam siebie poprawia, wraca do wcześniejszych założeń.
    • Największa bomba: Agent Teams – czyli możliwość uruchomienia kilku–kilkunastu agentów Claude’a naraz. Jeden sprawdza finanse, drugi pisze kod, trzeci robi research, czwarty recenzuje całość, piąty przygotowuje slajdy – i komunikują się między sobą automatycznie. To już nie jeden superinteligentny asystent. To mały, samodzielny zespół.

    Efekt? Firmy zaczynają testować scenariusze, w których AI przez wiele godzin (a nawet dni) autonomicznie wykonuje pracę, która wcześniej wymagała kilku specjalistów i drogich narzędzi (Salesforce, Tableau, Jira, Confluence, Excel razy 50 itp.).

    To bezpośredni cios w klasyczne oprogramowanie enterprise i w wiele zawodów „białych kołnierzyków”, które polegają na analizie, koordynacji, raportowaniu i iteracyjnym poprawianiu dokumentów.

    CZYTAJ TEŻ: Automatyzacja wydawania decyzji kredytowych wspierana narzędziami sztucznej inteligencji

    CZYTAJ TEŻ: Giganci w pułapce AI – wszystko albo nic. Podwajają wydatki, zadłużenie rośnie w lawinowym tempie, a rynek zaczyna poważnie obawiać się bańki

    Oczywiście nadal potrzebny jest człowiek – żeby zadać dobre pytanie, sprawdzić wynik, wziąć odpowiedzialność. Ale granica przesunęła się dramatycznie: z „AI pomaga mi pisać maila / kod / tabelkę” do „AI robi za mnie 60–80% roboty całego małego działu”.

    W skrócie: luty 2026 to prawdopodobnie początek ery, w której najcenniejszym pytaniem w firmie nie będzie „kogo zatrudnić?”, tylko „jakiego prompta i ile agentów dać Claude’owi Opus 4.6?”.

    Model jest już dostępny na claude.ai (dla subskrybentów Pro/Team/Enterprise), przez API i na największych chmurach. Ceny bez zmian – przynajmniej na razie.

    Najważniejsze nowości:

    • Kontekst 1 miliona tokenów (w wersji beta) Po raz pierwszy w rodzinie Opus pojawił się 1M kontekst (ok. 750 tys. słów, 1500 stron A4 lub bardzo duży kodowy projekt). Co najważniejsze – model naprawdę potrafi z niego korzystać. Na teście typu „igła w stogu siana” (MRCR v2 przy 1M tokenach) osiąga ~76%, podczas gdy wcześniejsze modele spadały do 15–20%. Koniec z „context rot” na długich zadaniach.
    • Znacznie lepsza trwałość i planowanie agentyczne Opus 4.6 dużo lepiej rozbija skomplikowane zadania na podzadania, uruchamia narzędzia i sub-agentów równolegle, utrzymuje wątek przez wiele godzin pracy, potrafi sam siebie recenzować i poprawiać błędy. To widać w benchmarkach: prowadzi na Terminal-Bench 2.0 (agentyczne kodowanie), Humanity’s Last Exam i GDPval-AA (wartościowa praca biurowa: finanse, prawo, analizy).
    • Funkcja Agent Teams (zespoły agentów) To największa nowość i prawdopodobnie najbardziej przełomowa rzecz. Zamiast jednego agenta pracującego sekwencyjnie, możemy teraz uruchomić zespół kilku–kilkunastu instancji Claude’a, które:
      • dzielą projekt między sobą,
      • komunikują się bezpośrednio (wiadomości agent ↔ agent),
      • korzystają ze wspólnej listy zadań,
      • koordynują pracę w czasie rzeczywistym (jeden agent może powiedzieć drugiemu „sprawdź to założenie”, „popraw ten fragment”, „prześlij mi wyniki”).

    Przykłady z testów Anthropic: 16 agentów przez dwa tygodnie napisało od zera kompilator C w Rust (~100 tys. linii kodu), który kompiluje Linux kernel, PostgreSQL, Redis, FFmpeg i przechodzi większość testów GCC. Koszt: ~20 tys. dolarów. Rok wcześniej takie zadanie było poza zasięgiem.

    Dlaczego to atak na klasyczne enterprise software?

    Opus 4.6 + Agent Teams zaczyna już robić rzeczy, które tradycyjnie wymagały całych działów / zespołów + drogich narzędzi typu Salesforce, ServiceNow, Tableau, Power BI, Jira + konsultanci wdrożeniowi. Teraz jeden człowiek może powiedzieć: „zbuduj system analizy finansowej na podstawie tych 400 raportów kwartalnych i tych arkuszy, zrób dashboard, przygotuj narrację zarządu i znajdź anomalie” – i model + zespół agentów zabiera się do roboty.

    To już nie tylko „pomocnik do kodowania”. To krok w stronę autonomicznych organizacji wiedzy, w których AI przejmuje znaczną część białych kołnierzyków – analizy, researchu, koordynacji projektów, code review, due diligence, przygotowywania prezentacji.

    Dostępność:

    • claude.ai (Pro / Max / Team / Enterprise)
    • API (model: claude-opus-4-6)
    • AWS Bedrock, Google Vertex AI, Microsoft Foundry Ceny bez zmian: $5 / $25 za milion tokenów (drożej dopiero powyżej 200k w trybie 1M).

    Luty 2026 właśnie pokazał, że tempo rozwoju modeli nie zwalnia – wręcz przeciwnie. Claude Opus 4.6 to prawdopodobnie najmocniejszy publicznie dostępny model agentyczny na świecie w tej chwili.

    CZYTAJ TEŻ: Chińskie AI rzuca rękawicę Google’owi. DeepSeek kontra DeepMind, czyli chiński Sputnik w AI