OpenAI usunęło potencjalne dowody naruszenia praw autorskich w sprawie New York Times

Spór prawny między New York Times (NYT) a OpenAI jest jednym z najgłośniejszych procesów w USA dotyczących praw autorskich w erze sztucznej inteligencji. NYT zarzuca OpenAI oraz Microsoftowi nielegalne wykorzystanie swoich materiałów w procesie szkolenia modeli AI. Gdy na jaw wyszło, że dane, które mogłyby być dowodami w sprawie, zostały usunięte, konflikt przybrał na sile.

Konflikt między OpenAI a New York Times trwa w najlepsze

Problem dotyczył dostępu do zestawu danych treningowych, które OpenAI musiało udostępnić zgodnie z decyzją sądu. Aby zapewnić NYT możliwość przeanalizowania danych, OpenAI stworzyło tzw. „sandbox”. Jednak w wyniku błędu inżynierowie OpenAI skasowali dane zgromadzone przez prawników NYT, co spowodowało poważne zakłócenia w procesie gromadzenia dowodów.

Skutki „przypadkowego” usunięcia danych

Według dokumentów sądowych NYT, ponad 150 godzin pracy zespołu prawniczego i ekspertów poszło na marne, gdyż OpenAI usunęło zapisane dane. Choć firma podjęła próby odzyskania informacji, brak folderów i nazw plików uniemożliwił prawidłowe powiązanie danych z konkretnymi treściami wykorzystanymi w procesie szkolenia modeli AI.

W odpowiedzi na te wydarzenia OpenAI nazwało incydent „glitchem”, czyli błędem technicznym, który miał być niezamierzony. Zespół prawniczy NYT potwierdził, że nie ma dowodów na celowe działanie, jednak wskazał, że incydent pokazuje, iż to OpenAI powinno samodzielnie przeszukiwać swoje dane w poszukiwaniu materiałów chronionych prawem autorskim. Wymóg ten miałby zmniejszyć ryzyko podobnych problemów w przyszłości.

In the New York Times' lawsuit against OpenAI, NYT lawyers spent 150 hours combing through OAI's training data. OpenAI engineers *erased it* and admitted to erasing it. The NYT is now unable to get that data back. This should be a serious scandal. https://t.co/IzlNfCPzfr
— Brian Merchant (@bcmerchant) November 21, 2024

Prawa autorskie a szkolenie modeli AI są do pogodzenia?

Spór z NYT to nie jedyna sytuacja, w której OpenAI zmaga się z oskarżeniami o naruszenie praw autorskich. Firma utrzymuje, że wykorzystanie publicznie dostępnych materiałów w procesie szkolenia modeli mieści się w ramach tzw. dozwolonego użytku („fair use”). Jednak prawnicy i wydawcy podkreślają, że generowanie zysków z modeli, które bazują na treściach chronionych prawami autorskimi, wymaga stosownych licencji.

Choć OpenAI zawarło już liczne umowy licencyjne z wydawcami, w tym z Associated Press czy Axel Springer, brak przejrzystości co do warunków tych umów wzbudza kontrowersje. Dla porównania, niektóre umowy – jak ta z Dotdash Meredith – gwarantują wydawcom roczne wpływy na poziomie co najmniej 16 milionów dolarów.

Znaczenie sprawy dla branży AI

Konflikt między NYT a OpenAI nie dotyczy wyłącznie jednej sprawy sądowej. To także test dla całego sektora technologicznego, który dynamicznie rozwija modele językowe. Wyroki w takich sprawach mogą zdefiniować ramy prawne dla przyszłych działań firm AI, wskazując, czy i w jakim zakresie mogą korzystać z materiałów chronionych prawem autorskim.

Jednocześnie sprawa podkreśla wyzwania związane z przejrzystością w procesie szkolenia modeli AI. Udostępnienie danych przez OpenAI stanowiło wyjątek od polityki tajemnicy firmy, która dotychczas unikała ujawniania szczegółów na temat źródeł danych. Incydent z usunięciem danych uwypuklił trudności w pogodzeniu wymogów prawnych z ochroną własnych interesów komercyjnych.

Dylematy sięgają dalej niż przepisy prawa

Warto również zastanowić się nad etycznymi konsekwencjami działań OpenAI. Usunięcie danych, choć uznane za przypadkowe, wywołało pytania o odpowiedzialność firm technologicznych w kontekście współpracy z wydawcami. Czy takie działania podważają zaufanie do sektora AI? Czy firmy technologiczne powinny przyjąć bardziej proaktywną postawę w zakresie ochrony praw autorskich?

Sprawa między OpenAI a NYT to ważny moment w daleszej debacie na temat praw autorskich w erze sztucznej inteligencji. Ostateczne rozstrzygnięcie może wpłynąć na sposób, w jaki firmy AI podchodzą do kwestii licencjonowania treści. Jedno jest pewne – dalszy rozwój technologii AI będzie wymagał zarówno transparentności, jak i współpracy z wydawcami, by uniknąć podobnych konfliktów w przyszłości.

Czytaj dalej:

AI slop – zjawisko, które degeneruje dziś treści w sieci

ChatGPT w pracy biurowej – kiedy można go używać, a jakie sytuacje go wykluczają

Gdzie pojechać na majówkę? Określ swoje preferencje i zapytaj chatbota

Cyberlekcje 3.0 pozwolą zrozumieć i przekazywać wiedzę o zagrożeniach technologicznych w sieci

Jak Polska radzi sobie z adaptacją generatywnej AI? Sprawdzamy w raporcie Generative AI Adoption

CERT Orange Polska podsumowuje 10 lat ochrony użytkowników przed zagrożeniami w sieci. Co zmieniło AI?

Czy AI zadomowiło się w polskich firmach? Sprawdzamy z raportem EFL

Chcemy kreować innowacje, budować suwerenność technologiczną a państwo ma pozostać w centrum rozwoju cyfryzacji – analiza PIE

Zakupy bez kliknięcia. Agentic AI zmieni e-commerce szybciej, niż myślisz

Windsurf chce przejąć kontrolę nad całym procesem inżynierii oprogramowania

Potencjał i aspiracje mamy. Polska może wziąć udział w wyścigu o AI

Szwajcarska firma IT sięga po prywatną chmurę dla AI

Obserwuje świat i wyciąga wnioski – nowy model AI – V-JEPA 2 od Meta

Czym jest vibe coding i co ma wspólnego z AI?

Google zachwyca swoim najnowszym modelem wideo Veo 3

Rola Edge Computing w AI. Nowe kierunki technologicznego rozwoju sztucznej inteligencji

Europa przyspiesza wyścig o suwerenną AI. Gigafabryki, miliardy i ostrzeżenie Nvidii

ChatGPT ma pamiętać wszystko na twój temat. To budzi grozę i ekscytację zarazem

Czy sztuczna inteligencja jest niebezpieczna? To zależy

Przyszłość robotyki w 2025 r. Od humanoidów po AI

Jak zyskać na sztucznej inteligencji czas (i pieniądze)?

Dla pracowników IT wynagrodzenie nie jest najważniejsze

Łukasz Kaiser: ekspert stojący za rozwojem machine learning z prestiżową nagrodą

AI w programach edukacyjnych Centrum Kształcenia Podyplomowego Uczelni Łazarskiego

AI slop – zjawisko, które degeneruje dziś treści w sieci

Europa przyspiesza wyścig o suwerenną AI. Gigafabryki, miliardy i ostrzeżenie Nvidii

Zakupy bez kliknięcia. Agentic AI zmieni e-commerce szybciej, niż myślisz

Obserwuje świat i wyciąga wnioski – nowy model AI – V-JEPA 2 od Meta

OpenAI usunęło potencjalne dowody naruszenia praw autorskich w sprawie New York Times

Konflikt między OpenAI a New York Times trwa w najlepsze

Skutki „przypadkowego” usunięcia danych

Prawa autorskie a szkolenie modeli AI są do pogodzenia?

Znaczenie sprawy dla branży AI

Dylematy sięgają dalej niż przepisy prawa

Sędziowie liniowi zastąpieni przez AI. Wimbledon w 2025 r. to namiastka przyszłości?

AI slop – zjawisko, które degeneruje dziś treści w sieci

Od Dreamcasta do Reymonta. Peter Moore i Synerise nadają Wiśle Kraków cyfrowe skrzydła

OpenAI usunęło potencjalne dowody naruszenia praw autorskich w sprawie New York Times

Konflikt między OpenAI a New York Times trwa w najlepsze

Skutki „przypadkowego” usunięcia danych

Prawa autorskie a szkolenie modeli AI są do pogodzenia?

Znaczenie sprawy dla branży AI

Dylematy sięgają dalej niż przepisy prawa

Polecane