Meta Galactica przerywa milczenie na temat burzliwego startu modelu

Rok później developer modelu LLM Meta Galactica opowiada o swojej drodze i wyciągniętych wnioskach.

Wróć na chwilę myślami o rok wstecz, na dwa tygodnie przed momentem, gdy OpenAI wprowadziło ChatGPT. Model AI od Meta (dawniej Facebook) pojawił się w tym czasie, wywołał masę kontrowersji, a potem zniknął. Teraz jeden z oryginalnych autorów wypowiedział się.

Ross Taylor współzałożył platformę Papers with Code, która gromadzi prace badawcze dla modeli uczenia maszynowego. Był jednym z autorów pracy opisującej Galactica, duży model językowy wytrenowany na pracach naukowych.

Jednak demonstracja modelu wywołała kontrowersje – Meta Galactica generowała cytowania do prac, które nie istniały. Zaledwie kilka dni po jej opublikowaniu została szybko wycofana.

Meta Galactica. Co poszło nie tak?

W poście na X (Twitter) Taylor przerwał milczenie, mówiąc, że zespół stojący za modelem był „przeciążony i stracił świadomość sytuacji podczas startu, wypuszczając [demonstrację]” bez większej kontroli.

„Byliśmy świadomi, jakie mogą być potencjalne opinie krytyków, ale straciliśmy z oczu oczywiste rzeczy w obciążeniu pracą, jaka na nas ciążyła”.

I am the first author of the Galactica paper and have been quiet about it for a year. Maybe I will write a blog post talking about what actually happened, but if you want the TLDR:

1. Galactica was a base model trained on scientific literature and modalities.
2. We approached… https://t.co/EPZqIly7QX
— Ross Taylor (@rosstaylor90) November 14, 2023

Model Mety przewyższał takie jak PaLM od Google i Chinchilla od DeepMind, ale jego demonstracja zawiodła.

Taylor powiedział, że pomysł na demonstrację polegał na zrozumieniu rozkładu naukowych zapytań, które ludzie mogliby używać dla LLM-ów. Dodał: „Oczywiście było to wolne pole do gry dla dziennikarzy, którzy zamiast tego zapytali o rzeczy spoza domeny naszej AI. Ale tak, powinniśmy byli wiedzieć lepiej i nie liczyć na inne zachowania”.

W tamtym czasie Michael Black, dyrektor renomowanego Instytutu Maxa Plancka dla Inteligentnych Systemów powiedział, że Galactica może „zapoczątkować erę głębokich fałszywych nauk”.

Grady Booch, część trio, które opracowało Unified Modeling Language, opisał zaś Galacticę jako „niewiele więcej niż statystyczną bzdurę na dużą skalę”.

„Zrobiłbym to wszystko jeszcze raz”

Taylor powiedział na X, że trzyma się badań nad Galactica – nawet decyzji o demonstracji, którą udostępnił z zespołem. Była „bezprecedensową otwartością dla dużej firmy z dużym modelem językowym w tamtym czasie. Demonstracja była tylko błędnie ukierunkowana, biorąc pod uwagę wektory ataku, które otworzyła przed nami” — dodał.

Meta od tego czasu trzyma się swojej strategii open source, prowadząc do wydania popularnego dużego modelu językowego LLaMA i następnego, bardziej potężnego Llama 2, co Taylor określa jako szczęśliwy wynik, ponieważ lekcje i praca z Galactica nie poszły na marne.

AI slop – zjawisko, które degeneruje dziś treści w sieci

ChatGPT w pracy biurowej – kiedy można go używać, a jakie sytuacje go wykluczają

Gdzie pojechać na majówkę? Określ swoje preferencje i zapytaj chatbota

Cyberlekcje 3.0 pozwolą zrozumieć i przekazywać wiedzę o zagrożeniach technologicznych w sieci

Sztuczna inteligencja „uczy się” o Rzymie. DeepMind otwiera nową epokę w badaniach nad starożytnością

Chińscy operatorzy koparek przenoszą plac budowy do biura. AI już szykuje się, by przejąć joystick

Jak Polska radzi sobie z adaptacją generatywnej AI? Sprawdzamy w raporcie Generative AI Adoption

CERT Orange Polska podsumowuje 10 lat ochrony użytkowników przed zagrożeniami w sieci. Co zmieniło AI?

Zakupy bez kliknięcia. Agentic AI zmieni e-commerce szybciej, niż myślisz

Windsurf chce przejąć kontrolę nad całym procesem inżynierii oprogramowania

Potencjał i aspiracje mamy. Polska może wziąć udział w wyścigu o AI

Szwajcarska firma IT sięga po prywatną chmurę dla AI

Rewolucja w animacji. Runway Act-Two pozwala każdemu przenieść ruch i mimikę na dowolną postać w kilka sekund

Obserwuje świat i wyciąga wnioski – nowy model AI – V-JEPA 2 od Meta

Czym jest vibe coding i co ma wspólnego z AI?

Google zachwyca swoim najnowszym modelem wideo Veo 3

Donald Trump przedstawił plan dotyczący AI. Wyraził sprzeciw wobec opłat za prawa autorskie

Europa przyspiesza wyścig o suwerenną AI. Gigafabryki, miliardy i ostrzeżenie Nvidii

ChatGPT ma pamiętać wszystko na twój temat. To budzi grozę i ekscytację zarazem

Czy sztuczna inteligencja jest niebezpieczna? To zależy

Jak zyskać na sztucznej inteligencji czas (i pieniądze)?

Dla pracowników IT wynagrodzenie nie jest najważniejsze

Łukasz Kaiser: ekspert stojący za rozwojem machine learning z prestiżową nagrodą

AI w programach edukacyjnych Centrum Kształcenia Podyplomowego Uczelni Łazarskiego

Sztuczna inteligencja „uczy się” o Rzymie. DeepMind otwiera nową epokę w badaniach nad starożytnością

Donald Trump przedstawił plan dotyczący AI. Wyraził sprzeciw wobec opłat za prawa autorskie

Rewolucja w animacji. Runway Act-Two pozwala każdemu przenieść ruch i mimikę na dowolną postać w kilka sekund

Chińscy operatorzy koparek przenoszą plac budowy do biura. AI już szykuje się, by przejąć joystick

Meta Galactica przerywa milczenie na temat burzliwego startu modelu

Meta Galactica. Co poszło nie tak?

„Zrobiłbym to wszystko jeszcze raz”

Niektórzy już tęsknią za udanym GPT-4o. Tymczasem OpenAI chwali się, że GPT-5 jest milszy

Losy Chrome się ważą. W tle potężna inwestycja i rozwój AI

Licealista z Wrocławia wygrał elitarny konkurs IOAI w Pekinie. To był pokaz talentów z Polski

Meta Galactica przerywa milczenie na temat burzliwego startu modelu

Meta Galactica. Co poszło nie tak?

„Zrobiłbym to wszystko jeszcze raz”

Polecane