Raport

    Google DeepMind to inicjatywa skupiająca się na budowaniu sztucznej inteligencji w sposób odpowiedzialny, aby przynosiła korzyści ludzkości. Misja ta opiera się na przekonaniu, że badania i technologia AI mogą przynieść nadzwyczajne postępy, a ostatecznie sztuczna inteligencja ogólna (AGI) ma potencjał do napędzania jednej z największych transformacji w historii.

    Zespół Google DeepMind składa się z naukowców, inżynierów, etyków i wielu innych, którzy pracują nad bezpiecznym i odpowiedzialnym tworzeniem kolejnej generacji systemów AI. Poprzez rozwiązywanie niektórych z najtrudniejszych wyzwań naukowych i inżynieryjnych naszych czasów, dążą do stworzenia przełomowych technologii, które mogą przyspieszyć rozwój nauki, przekształcić pracę, służyć różnorodnym społecznościom i poprawić życie miliardów ludzi.

    Laboratoria Google DeepMind

    Google DeepMind łączy dwa wiodące na świecie laboratoria AI – Google Brain i DeepMind – w jeden skoncentrowany zespół pod kierownictwem CEO Demisa Hassabisa. Od dekady te dwa zespoły odpowiadają za niektóre z największych przełomów badawczych w dziedzinie AI, które stanowią podstawę kwitnącego przemysłu AI, który obserwujemy dzisiaj. DeepMind, założony w 2010 roku, zastosował interdyscyplinarne podejście do budowania ogólnych systemów AI, łącząc nowe pomysły i postępy w dziedzinie uczenia maszynowego, neurologii, inżynierii, matematyki, symulacji i infrastruktury obliczeniowej.

    Laboratorium odniosło wczesne sukcesy, wprowadzając na rynek głębokie uczenie ze wzmocnieniem i używając systemów gier do testowania swoich systemów. Jednym z wczesnych osiągnięć był program DQN, który nauczył się grać w 49 różnych gier Atari od zera, obserwując surowe piksele na ekranie i dążąc do maksymalizacji wyniku. W 2015 roku DeepMind zaprezentował AlphaGo, pierwszy program komputerowy, który pokonał mistrza świata w Go, co było kamieniem milowym i uznane za osiągnięcie dekadę przed swoim czasem. AlphaGo zainspirowało nową erę systemów AI, a jego następcy, AlphaZero i MuZero, są coraz bardziej ogólne i zdolne do rozwiązywania wielu różnych gier, jak również złożonych problemów rzeczywistego świata.

    Pozostała część artykułu pod materiałem wideo:

    REKLAMA
    Raport

    Inne przełomy to m.in. WaveNet, realistyczny model syntezy mowy, który został użyty jako głos Asystenta Google, oraz AlphaFold, system AI, który dokładnie przewiduje 3D modele struktur białek, co zapoczątkowało nową falę postępu w biologii. Google Brain, założone w 2011 roku, badało, jak nowoczesna AI może przekształcić produkty i usługi Google, wprowadzając takie innowacje jak oprogramowanie open source JAX i TensorFlow, uczenie sekwencyjne do sekwencyjne dla tłumaczenia maszynowego oraz złożone systemy uczenia maszynowego do rankingu wyników wyszukiwania.

    Produkty i technologie opracowane w ramach Google DeepMind

    W ramach Google DeepMind opracowano szereg przełomowych produktów i technologii, które miały znaczący wpływ na rozwój sztucznej inteligencji i jej zastosowań. Oto niektóre z kluczowych osiągnięć.

    AlphaGo: Program komputerowy, który w 2016 roku pokonał zawodowego gracza w Go, Lee Sedola, co było uznawane za przełom w dziedzinie AI. AlphaGo używało technik głębokiego uczenia się oraz uczenia ze wzmocnieniem.

    AlphaZero: Bardziej ogólna wersja AlphaGo, która nauczyła się grać na poziomie ponadludzkim w szachy, shogi (japońskie szachy) oraz Go, ucząc się wyłącznie poprzez grę przeciwko sobie samej, bez wcześniejszej wiedzy na temat tych gier.

    AlphaFold: System AI, który w 2020 roku dokonał znaczącego postępu w rozwiązaniu problemu składania białek, co ma ogromne znaczenie dla biologii i medycyny. AlphaFold wygrał 13. edycję Critical Assessment of Techniques for Protein Structure Prediction (CASP), przewidując najdokładniejszą strukturę dla 25 z 43 białek.

    MuZero: Model, który opanował domeny Go, szachów, shogi oraz gier na Atari 2600 bez danych ludzkich, wiedzy dziedzinowej czy znanych zasad. MuZero zostało zastosowane do rozwiązania rzeczywistych problemów, takich jak kompresja wideo.

    WaveNet: Model syntezy mowy, który w 2016 roku wprowadził znaczące ulepszenia w generowaniu naturalnie brzmiącej mowy. WaveNet stał się podstawą dla Google Assistant i innych aplikacji tekstowych.

    AlphaTensor: Nowa wersja AlphaZero, która odkryła szybszy sposób na mnożenie macierzy, jedno z najbardziej podstawowych zadań w obliczeniach, używając uczenia ze wzmocnieniem.

    Te produkty i technologie stanowią tylko część wkładu Google DeepMind w rozwój sztucznej inteligencji, demonstrując potencjał AI w rozwiązywaniu złożonych problemów naukowych i inżynieryjnych.

    DeepMind współtworzyło Gemini

    Wkład DeepMind w rozwój Gemini jest znaczący i wielowymiarowy. Gemini, najbardziej zaawansowany i ogólny model AI stworzony przez Google, jest owocem współpracy zespołów z całego Google, w tym kolegów z Google Research. Model ten został zbudowany od podstaw, aby być multimodalnym, co oznacza, że może generalizować i bezproblemowo rozumieć, operować na różnych rodzajach informacji, w tym tekście, kodzie, audio, obrazie i wideo, oraz łączyć je.

    Demis Hassabis, CEO i współzałożyciel Google DeepMind, podkreśla, że AI było przedmiotem jego życiowej pracy, a ambicją DeepMind od dawna było zbudowanie nowej generacji modeli AI, inspirowanych sposobem, w jaki ludzie rozumieją i wchodzą w interakcję ze światem. Gemini jest krokiem bliżej do realizacji tej wizji, będąc najbardziej zdolnym i ogólnym modelem, jaki kiedykolwiek zbudowano.

    Gemini wyróżnia się na tle innych modeli dzięki swojej elastyczności – jest w stanie efektywnie działać na wszystkim, od centrów danych po urządzenia mobilne. Jego zdolności stanu najnowszej techniki znacząco poprawią sposób, w jaki deweloperzy i klienci korporacyjni budują i skalują z wykorzystaniem AI.

    Model Gemini 1.0 został zoptymalizowany pod kątem trzech różnych rozmiarów: Ultra, Pro i Nano, z których każdy jest dostosowany do różnych zastosowań, od wykonywania bardzo złożonych zadań po zadania na urządzeniach mobilnych. Gemini Ultra w testach przewyższa obecne najlepsze wyniki w 30 z 32 powszechnie używanych akademickich benchmarków wykorzystywanych w badaniach i rozwoju dużych modeli językowych (LLM), osiągając wynik 90,0% i przewyższając ekspertów ludzkich w rozumieniu języka na wielu zadaniach (MMLU).

    Czytaj dalej: