Meta Galactica przerywa milczenie na temat burzliwego startu modelu

Rok później developer modelu LLM Meta Galactica opowiada o swojej drodze i wyciągniętych wnioskach.

Wróć na chwilę myślami o rok wstecz, na dwa tygodnie przed momentem, gdy OpenAI wprowadziło ChatGPT. Model AI od Meta (dawniej Facebook) pojawił się w tym czasie, wywołał masę kontrowersji, a potem zniknął. Teraz jeden z oryginalnych autorów wypowiedział się.

Ross Taylor współzałożył platformę Papers with Code, która gromadzi prace badawcze dla modeli uczenia maszynowego. Był jednym z autorów pracy opisującej Galactica, duży model językowy wytrenowany na pracach naukowych.

Jednak demonstracja modelu wywołała kontrowersje – Meta Galactica generowała cytowania do prac, które nie istniały. Zaledwie kilka dni po jej opublikowaniu została szybko wycofana.

Meta Galactica. Co poszło nie tak?

W poście na X (Twitter) Taylor przerwał milczenie, mówiąc, że zespół stojący za modelem był “przeciążony i stracił świadomość sytuacji podczas startu, wypuszczając [demonstrację]” bez większej kontroli.

“Byliśmy świadomi, jakie mogą być potencjalne opinie krytyków, ale straciliśmy z oczu oczywiste rzeczy w obciążeniu pracą, jaka na nas ciążyła”.

I am the first author of the Galactica paper and have been quiet about it for a year. Maybe I will write a blog post talking about what actually happened, but if you want the TLDR:

1. Galactica was a base model trained on scientific literature and modalities.
2. We approached… https://t.co/EPZqIly7QX
— Ross Taylor (@rosstaylor90) November 14, 2023

Model Mety przewyższał takie jak PaLM od Google i Chinchilla od DeepMind, ale jego demonstracja zawiodła.

Taylor powiedział, że pomysł na demonstrację polegał na zrozumieniu rozkładu naukowych zapytań, które ludzie mogliby używać dla LLM-ów. Dodał: “Oczywiście było to wolne pole do gry dla dziennikarzy, którzy zamiast tego zapytali o rzeczy spoza domeny naszej AI. Ale tak, powinniśmy byli wiedzieć lepiej i nie liczyć na inne zachowania”.

W tamtym czasie Michael Black, dyrektor renomowanego Instytutu Maxa Plancka dla Inteligentnych Systemów powiedział, że Galactica może “zapoczątkować erę głębokich fałszywych nauk”.

Grady Booch, część trio, które opracowało Unified Modeling Language, opisał zaś Galacticę jako “niewiele więcej niż statystyczną bzdurę na dużą skalę”.

“Zrobiłbym to wszystko jeszcze raz”

Taylor powiedział na X, że trzyma się badań nad Galactica – nawet decyzji o demonstracji, którą udostępnił z zespołem. Była “bezprecedensową otwartością dla dużej firmy z dużym modelem językowym w tamtym czasie. Demonstracja była tylko błędnie ukierunkowana, biorąc pod uwagę wektory ataku, które otworzyła przed nami” — dodał.

Meta od tego czasu trzyma się swojej strategii open source, prowadząc do wydania popularnego dużego modelu językowego LLaMA i następnego, bardziej potężnego Llama 2, co Taylor określa jako szczęśliwy wynik, ponieważ lekcje i praca z Galactica nie poszły na marne.

ChatGPT w pracy biurowej – kiedy można go używać, a jakie sytuacje go wykluczają

Gdzie pojechać na majówkę? Określ swoje preferencje i zapytaj chatbota

Cyberlekcje 3.0 pozwolą zrozumieć i przekazywać wiedzę o zagrożeniach technologicznych w sieci

Czym jest silna sztuczna inteligencja?

Jak Polska radzi sobie z adaptacją generatywnej AI? Sprawdzamy w raporcie Generative AI Adoption

CERT Orange Polska podsumowuje 10 lat ochrony użytkowników przed zagrożeniami w sieci. Co zmieniło AI?

Czy AI zadomowiło się w polskich firmach? Sprawdzamy z raportem EFL

Chcemy kreować innowacje, budować suwerenność technologiczną a państwo ma pozostać w centrum rozwoju cyfryzacji – analiza PIE

Zakupy bez kliknięcia. Agentic AI zmieni e-commerce szybciej, niż myślisz

Windsurf chce przejąć kontrolę nad całym procesem inżynierii oprogramowania

Potencjał i aspiracje mamy. Polska może wziąć udział w wyścigu o AI

Szwajcarska firma IT sięga po prywatną chmurę dla AI

Obserwuje świat i wyciąga wnioski – nowy model AI – V-JEPA 2 od Meta

Czym jest vibe coding i co ma wspólnego z AI?

Google zachwyca swoim najnowszym modelem wideo Veo 3

Rola Edge Computing w AI. Nowe kierunki technologicznego rozwoju sztucznej inteligencji

Europa przyspiesza wyścig o suwerenną AI. Gigafabryki, miliardy i ostrzeżenie Nvidii

ChatGPT ma pamiętać wszystko na twój temat. To budzi grozę i ekscytację zarazem

Czy sztuczna inteligencja jest niebezpieczna? To zależy

Przyszłość robotyki w 2025 r. Od humanoidów po AI

Jak zyskać na sztucznej inteligencji czas (i pieniądze)?

Dla pracowników IT wynagrodzenie nie jest najważniejsze

Łukasz Kaiser: ekspert stojący za rozwojem machine learning z prestiżową nagrodą

AI w programach edukacyjnych Centrum Kształcenia Podyplomowego Uczelni Łazarskiego

Europa przyspiesza wyścig o suwerenną AI. Gigafabryki, miliardy i ostrzeżenie Nvidii

Zakupy bez kliknięcia. Agentic AI zmieni e-commerce szybciej, niż myślisz

Obserwuje świat i wyciąga wnioski – nowy model AI – V-JEPA 2 od Meta

ChatGPT w pracy biurowej – kiedy można go używać, a jakie sytuacje go wykluczają

Meta Galactica przerywa milczenie na temat burzliwego startu modelu

Meta Galactica. Co poszło nie tak?

“Zrobiłbym to wszystko jeszcze raz”

Tinder wdraża obowiązkową weryfikację twarzy użytkownika w stanie Kalifornia. To początek nowej strategii

Dania pracuje nad zakazem rozpowszechniania deepfake’ów w sieci

Nvidia wraca na szczyt najlepiej wycenianych firm – triumf sztucznej inteligencji i precyzyjnej strategii

Meta Galactica przerywa milczenie na temat burzliwego startu modelu

Meta Galactica. Co poszło nie tak?

“Zrobiłbym to wszystko jeszcze raz”

Polecane