Meta wprowadza bardziej wydajny model Llama. Lepszy niż GPT-4o

Meta ma najnowszy dodatek do swojej rodziny generatywnych modeli AI Llama: Llama 3.3 70B. Firma poinformowała o nim na Instagramie Marka Zuckerberga.

W poście na X, Ahmad Al-Dahle, wiceprezes ds. generatywnej AI w Meta, powiedział, że tekstowy model Llama 3.3 70B oferuje wydajność największego modelu Llama Meta, Llama 3.1 405B, ale przy niższych kosztach.

“Wykorzystując najnowsze osiągnięcia w technikach post-treningowych, ten model poprawia podstawową wydajność przy znacznie niższych kosztach” — napisał Al-Dahle.

Introducing Llama 3.3 – a new 70B model that delivers the performance of our 405B model but is easier & more cost-efficient to run. By leveraging the latest advancements in post-training techniques including online preference optimization, this model improves core performance at… pic.twitter.com/6oQ7b3Yuzc
— Ahmad Al-Dahle (@Ahmad_Al_Dahle) December 6, 2024

Al-Dahle opublikował wykres pokazujący, że Llama 3.3 70B przewyższa Google Gemini 1.5 Pro, OpenAI GPT-4o i nowo wydany Amazon Nova Pro w wielu branżowych benchmarkach, w tym MMLU, który ocenia zdolność modelu do rozumienia języka. W e-mailu rzecznik Meta powiedział też, że model powinien przynieść poprawę w takich obszarach jak matematyka oraz wiedza ogólna.

Llama 3.3 70B zapewnia świetne wyniki

Llama 3.3 70B, dostępny do pobrania z platformy developerskiej AI Hugging Face i innych źródeł, w tym oficjalnej strony Llama, to najnowsza próba Meta, aby zdominować pole AI za pomocą “otwartych” modeli, które mogą być używane i komercjalizowane w różnych zastosowaniach.

Warunki Meta ograniczają, jak niektórzy developerzy mogą używać modeli Llama — platformy z ponad 700 milionami użytkowników miesięcznie muszą ubiegać się o specjalną licencję. Ale dla wielu nie ma znaczenia, że modele Llama nie są “otwarte” w najściślejszym sensie. Przykładowo, Llama ma już ponad 650 milionów pobrań.

Meta również wewnętrznie wykorzystała Llama. Meta AI, asystent AI firmy, który jest w pełni zasilany przez modele Llama, ma teraz prawie 600 milionów aktywnych użytkowników miesięcznie — według CEO Meta Marka Zuckerberga. Zuckerberg twierdzi, że Meta AI jest na dobrej drodze, aby stać się najczęściej używanym asystentem AI na świecie.

Kontrowersyjne zastosowania

Dla Meta otwarta natura Llama była błogosławieństwem i przekleństwem. W listopadzie raport twierdził, że chińscy badacze wojskowi użyli modelu Llama do opracowania chatbota obronnego. Meta odpowiedziała, udostępniając swoje modele Llama amerykańskim kontrahentom obronnym.

Meta wyraziła również obawy dotyczące swojej zdolności do przestrzegania ustawy o AI, unijnego prawa ustanawiającego ramy regulacyjne dla AI, nazywając wdrożenie prawa “zbyt nieprzewidywalnym” dla swojej strategii otwartego wydania. Związane z tym problemem dla firmy są przepisy RODO. Meta trenuje bowiem modele AI na publicznych danych użytkowników Instagrama i Facebooka.

Regulatorzy UE na początku tego roku zażądali, aby Meta wstrzymała szkolenie na danych europejskich użytkowników. Meta ustąpiła, jednocześnie popierając otwarty list wzywający do nowoczesnej interpretacji RODO, która nie “odrzuca postępu” technologicznego.

Meta inwestuje w data center

Meta zwiększa swoją infrastrukturę komputerową, aby szkolić i obsługiwać przyszłe generacje Llama. Firma ogłosiła w środę, że zbuduje centrum danych AI o wartości 10 miliardów dolarów w Luizjanie — będzie to największe centrum danych AI, jakie Meta kiedykolwiek zbudowała.

Zuckerberg powiedział na konferencji wynikowej Meta za IV kwartał w sierpniu, że aby wyszkolić następną główną serię modeli Llama, Llama 4, firma będzie potrzebować 10 razy więcej mocy obliczeniowej niż było potrzebne do wyszkolenia Llama 3. Meta zakupiła klaster ponad 100 000 procesorów graficznych Nvidia do rozwoju modeli, rywalizując o zasoby z konkurentami takimi jak xAI Elona Muska.

Szkolenie generatywnych modeli AI to kosztowny biznes. Wydatki kapitałowe Meta wzrosły o prawie 33% do 8,5 miliarda dolarów w II kwartale 2024 roku, w porównaniu do 6,4 miliarda dolarów rok wcześniej, napędzane inwestycjami w serwery, centra danych i infrastrukturę sieciową.

Czytaj też:

ChatGPT w pracy biurowej – kiedy można go używać, a jakie sytuacje go wykluczają

Gdzie pojechać na majówkę? Określ swoje preferencje i zapytaj chatbota

Cyberlekcje 3.0 pozwolą zrozumieć i przekazywać wiedzę o zagrożeniach technologicznych w sieci

Czym jest silna sztuczna inteligencja?

Jak Polska radzi sobie z adaptacją generatywnej AI? Sprawdzamy w raporcie Generative AI Adoption

CERT Orange Polska podsumowuje 10 lat ochrony użytkowników przed zagrożeniami w sieci. Co zmieniło AI?

Czy AI zadomowiło się w polskich firmach? Sprawdzamy z raportem EFL

Chcemy kreować innowacje, budować suwerenność technologiczną a państwo ma pozostać w centrum rozwoju cyfryzacji – analiza PIE

Zakupy bez kliknięcia. Agentic AI zmieni e-commerce szybciej, niż myślisz

Windsurf chce przejąć kontrolę nad całym procesem inżynierii oprogramowania

Potencjał i aspiracje mamy. Polska może wziąć udział w wyścigu o AI

Szwajcarska firma IT sięga po prywatną chmurę dla AI

Obserwuje świat i wyciąga wnioski – nowy model AI – V-JEPA 2 od Meta

Czym jest vibe coding i co ma wspólnego z AI?

Google zachwyca swoim najnowszym modelem wideo Veo 3

Rola Edge Computing w AI. Nowe kierunki technologicznego rozwoju sztucznej inteligencji

Europa przyspiesza wyścig o suwerenną AI. Gigafabryki, miliardy i ostrzeżenie Nvidii

ChatGPT ma pamiętać wszystko na twój temat. To budzi grozę i ekscytację zarazem

Czy sztuczna inteligencja jest niebezpieczna? To zależy

Przyszłość robotyki w 2025 r. Od humanoidów po AI

Jak zyskać na sztucznej inteligencji czas (i pieniądze)?

Dla pracowników IT wynagrodzenie nie jest najważniejsze

Łukasz Kaiser: ekspert stojący za rozwojem machine learning z prestiżową nagrodą

AI w programach edukacyjnych Centrum Kształcenia Podyplomowego Uczelni Łazarskiego

Europa przyspiesza wyścig o suwerenną AI. Gigafabryki, miliardy i ostrzeżenie Nvidii

Zakupy bez kliknięcia. Agentic AI zmieni e-commerce szybciej, niż myślisz

Obserwuje świat i wyciąga wnioski – nowy model AI – V-JEPA 2 od Meta

ChatGPT w pracy biurowej – kiedy można go używać, a jakie sytuacje go wykluczają

Meta wprowadza bardziej wydajny model Llama. Lepszy niż GPT-4o

Llama 3.3 70B zapewnia świetne wyniki

Kontrowersyjne zastosowania

Meta inwestuje w data center

Europa przyspiesza wyścig o suwerenną AI. Gigafabryki, miliardy i ostrzeżenie Nvidii

Zakupy bez kliknięcia. Agentic AI zmieni e-commerce szybciej, niż myślisz

Obserwuje świat i wyciąga wnioski – nowy model AI – V-JEPA 2 od Meta

Meta wprowadza bardziej wydajny model Llama. Lepszy niż GPT-4o

Llama 3.3 70B zapewnia świetne wyniki

Kontrowersyjne zastosowania

Meta inwestuje w data center

Polecane