Alibaba Cloud, jeden z liderów globalnej chmury obliczeniowej, ogłosił podczas swojej corocznej konferencji Apsara 2024 istotny krok w rozwoju sztucznej inteligencji. Firma udostępniła ponad 100 modeli AI w ramach projektu open source, co stanowi jedno z najważniejszych wydarzeń w świecie technologii tego roku.

    Modele te, o nazwie Qwen 2.5, reprezentują zaawansowane możliwości w dziedzinach takich jak matematyka, kodowanie, analiza danych i przetwarzanie języka naturalnego.

    Qwen 2.5

    Modele Qwen 2.5 to najnowsza wersja serii Qwen, która zadebiutowała w 2023 roku. Nowa generacja obejmuje szeroki zakres modeli o różnych rozmiarach, od 0,5 do 72 miliardów parametrów. Te modele AI zostały zaprojektowane z myślą o wsparciu różnorodnych zastosowań w takich sektorach jak motoryzacja, gry komputerowe, badania naukowe oraz przetwarzanie języka naturalnego. Co istotne, modele Qwen 2.5 wspierają ponad 29 języków, co umożliwia ich adaptację w różnych kontekstach, zarówno lokalnych, jak i międzynarodowych.

    Udostępnione modele obejmują zarówno modele podstawowe, jak i te specjalistyczne, przeznaczone do takich zadań jak kodowanie i rozwiązywanie problemów matematycznych. W ramach tej inicjatywy firma Alibaba Cloud udostępniła także modele skwantyzowane, co pozwala na efektywniejsze zarządzanie zasobami obliczeniowymi podczas ich wdrażania. To rozwiązanie ma szczególne znaczenie dla firm, które potrzebują zoptymalizowanych modeli AI do pracy w środowiskach z ograniczoną mocą obliczeniową, na przykład na urządzeniach mobilnych lub w chmurze.

    modele alibaba
    Fot. alibabacloud.com

    Znaczenie udostępnienia modeli open source

    Decyzja o udostępnieniu ponad 100 modeli AI w ramach otwartego oprogramowania stanowi istotny krok w rozwoju globalnej społeczności AI. Modele te są dostępne na platformach takich jak Hugging Face oraz ModelScope, co ułatwia ich szerokie wykorzystanie przez programistów, naukowców oraz korporacje na całym świecie. Do tej pory modele Qwen zostały pobrane ponad 40 milionów razy, a dzięki wersji open source liczba ta może znacząco wzrosnąć.

    Jingren Zhou, dyrektor techniczny Alibaba Cloud Intelligence, podkreślił, że udostępnienie modeli open source ma na celu wsparcie innowacji w różnych branżach. Modele mogą być wykorzystane zarówno przez małe startupy, jak i przez duże przedsiębiorstwa, co umożliwia szerokie zastosowanie technologii AI na niespotykaną dotąd skalę. Ponadto, poprzez udostępnienie ich w otwartej formie, Alibaba Cloud stymuluje rozwój społeczności open source, co przyczynia się do dynamicznego postępu technologicznego w dziedzinie sztucznej inteligencji.

    Innowacje infrastrukturalne Alibaba Cloud

    Udostępnienie modeli Qwen 2.5 nie było jedyną nowością ogłoszoną podczas konferencji Apsara 2024. Alibaba Cloud zaprezentowała również szereg innowacji w zakresie infrastruktury obliczeniowej, które mają na celu wsparcie rosnących potrzeb w zakresie AI. Jednym z najważniejszych elementów jest wprowadzenie nowej architektury centrum danych – CUBE DC 5.0. Ta architektura, zaprojektowana z myślą o rozwoju AI, wykorzystuje zaawansowane technologie chłodzenia hybrydowego oraz inteligentne zarządzanie zużyciem energii. Dzięki temu nowe centra danych są bardziej efektywne energetycznie, co przekłada się na niższe koszty operacyjne.

    W ramach pełnego stacku infrastrukturalnego, Alibaba Cloud zaprezentowała także nowe rozwiązania w zakresie zarządzania danymi i treningu modeli AI. Jednym z nich jest PAI AI Scheduler, nowatorski silnik do zarządzania zasobami obliczeniowymi, który pozwala na elastyczne i dynamiczne przydzielanie mocy obliczeniowej w czasie rzeczywistym. Z kolei platforma DMS: OneMeta+OneOps umożliwia zintegrowane zarządzanie metadanymi z różnych źródeł danych, co przyspiesza transformację danych w wartościowe informacje.

    Modele multimodalne i AI wideo

    Alibaba Cloud rozszerzyła także swoje możliwości w zakresie modeli multimodalnych, wprowadzając nowy model tekst-wideo w ramach rodziny Tongyi Wanxiang. Model ten potrafi generować wysokiej jakości wideo w różnych stylach wizualnych, od realistycznych scen po animacje 3D, na podstawie poleceń tekstowych w języku chińskim i angielskim. Co więcej, model jest w stanie przekształcać statyczne obrazy w dynamiczne wideo, co otwiera nowe możliwości w dziedzinach takich jak marketing, gry komputerowe czy produkcja filmowa.

    Nowy model Qwen2-VL, będący częścią portfela modeli multimodalnych, pozwala na analizę i zrozumienie długich nagrań wideo oraz wspiera interaktywne funkcje, takie jak odpowiedzi na pytania na podstawie materiałów wideo. Dzięki zaawansowanym zdolnościom w zakresie rozumowania i podejmowania decyzji, model ten może być zintegrowany z urządzeniami mobilnymi, samochodami czy robotami, co umożliwia automatyzację skomplikowanych operacji.

    Modele Qwen 2.5 oferują wiele zastosowań, od przetwarzania języka naturalnego, przez kodowanie, po multimodalne generowanie treści wizualnych. Dzięki nowej infrastrukturze, takiej jak CUBE DC 5.0, oraz innowacyjnym rozwiązaniom, takim jak PAI AI Scheduler, Alibaba Cloud wzmacnia swoją pozycję jako lidera w dziedzinie chmury obliczeniowej i AI. Inicjatywa ta nie tylko wspiera rozwój technologii, ale także przyczynia się do popularyzacji AI wśród globalnych społeczności programistów oraz przedsiębiorstw.

    Czytaj dalej: