Raport

    Silicon Valley jest optymistycznie nastawione do agentów AI. CEO OpenAI Sam Altman powiedział, że agenci „dołączą do siły roboczej” w tym roku. CEO Microsoftu Satya Nadella przewidział, że agenci zastąpią pewne prace wymagające wiedzy. CEO Salesforce Marc Benioff powiedział, że celem Salesforce jest bycie „numerem jeden w dostarczaniu cyfrowej siły roboczej na świecie” poprzez różne „agentowe” usługi firmy.

    Ale nikt nie może się zgodzić, czym dokładnie jest agent AI.

    W ciągu ostatnich kilku lat branża technologiczna odważnie ogłaszała, że agenci AI — najnowsze modne słowo — zmienią wszystko. W ten sam sposób, w jaki chatboty AI, takie jak ChatGPT OpenAI, dały nam nowe sposoby na uzyskiwanie informacji, agenci fundamentalnie zmienią nasze podejście do pracy, twierdzą CEO, tacy jak Altman i Nadella.

    To może być prawda. Ale to także zależy od tego, jak definiuje się „agentów”, co nie jest łatwym zadaniem. Podobnie jak inne żargonowe terminy związane z AI (np. „multimodalny”, „AGI” i samo „AI”), terminy „agent” i „agentowy” stają się rozmyte do tego stopnia, że tracą sens.

    To grozi pozostawieniem OpenAI, Microsoftu, Salesforce, Amazonu, Google i niezliczonych innych firm budujących całe linie produktów wokół agentów w niezręcznej sytuacji. Agent z Amazonu nie jest tym samym, co agent z Google czy innego dostawcy, co prowadzi do zamieszania — i frustracji klientów.

    REKLAMA
    Raport

    Ryan Salva, starszy dyrektor ds. produktów w Google i były lider GitHub Copilot, powiedział, że zaczął „nienawidzić” słowa „agenci”.

    „Myślę, że nasza branża nadużywa terminu ‘agent’ do tego stopnia, że jest on prawie bezsensowny,” powiedział Salva w wywiadzie dla TechCrunch. „[To jest] jedna z moich irytacji.”

    Dylemat definicji agenta nie jest nowy. W artykule z zeszłego roku, były reporter TechCrunch Ron Miller zapytał: Czym jest agent AI? Problem, który zidentyfikował, polega na tym, że prawie każda firma budująca agentów podchodzi do technologii inaczej.

    To problem, który ostatnio się pogorszył.

    W tym tygodniu OpenAI opublikowało wpis na blogu, w którym zdefiniowało agentów jako „zautomatyzowane systemy, które mogą samodzielnie wykonywać zadania w imieniu użytkowników.” Jednak w tym samym tygodniu firma opublikowała dokumentację dla deweloperów, która definiowała agentów jako „LLM wyposażone w instrukcje i narzędzia.”

    Leher Pathak, liderka marketingu produktu API w OpenAI, później powiedziała w poście na X, że rozumie terminy „asystenci” i „agenci” jako zamienne — co jeszcze bardziej zaciemnia sytuację.

    Tymczasem blogi Microsoftu próbują rozróżnić agentów i asystentów AI. Ci pierwsi, których Microsoft nazywa „nowymi aplikacjami” dla „świata napędzanego AI”, mogą być dostosowani do posiadania określonej wiedzy, podczas gdy asystenci po prostu pomagają w ogólnych zadaniach, takich jak redagowanie e-maili.

    Laboratorium AI Anthropic bardziej bezpośrednio odnosi się do mieszaniny definicji agentów. W poście na blogu Anthropic mówi, że agenci „mogą być definiowani na kilka sposobów”, w tym jako „w pełni autonomiczne systemy, które działają niezależnie przez dłuższe okresy” oraz „preskryptywne implementacje, które podążają za zdefiniowanymi wcześniej przepływami pracy.”

    Salesforce ma być może najszerszą definicję agenta AI. Według giganta oprogramowania, agenci to „rodzaj […] systemu, który może rozumieć i odpowiadać na zapytania klientów bez interwencji człowieka.” Strona internetowa firmy wymienia sześć różnych kategorii, od „prostych agentów refleksyjnych” po „agentów opartych na użyteczności.”

    Dlaczego więc ten chaos?

    Cóż, agenci — podobnie jak AI — są nieuchwytną rzeczą i stale się rozwijają. OpenAI, Google i Perplexity dopiero zaczęły wprowadzać to, co uważają za swoich pierwszych agentów — Operator OpenAI, Project Mariner Google i agent zakupowy Perplexity — a ich możliwości są bardzo zróżnicowane.

    Rich Villars, wiceprezes ds. badań na całym świecie w IDC, zauważył, że firmy technologiczne „mają długą historię” nieprzestrzegania sztywnych definicji technicznych.

    „Bardziej zależy im na tym, co próbują osiągnąć” na poziomie technicznym, powiedział Villars TechCrunch, „szczególnie na szybko rozwijających się rynkach.”

    Ale marketing również w dużej mierze jest winny, według Andrew Ng, założyciela platformy do nauki AI DeepLearning.ai.

    „Koncepcje ‘agentów’ AI i ‘agentowych’ przepływów pracy miały kiedyś techniczne znaczenie,” powiedział Ng w niedawnym wywiadzie, „ale około rok temu marketerzy i kilka dużych firm się nimi zainteresowało.”

    Brak jednolitej definicji agentów jest zarówno szansą, jak i wyzwaniem, mówi Jim Rowan, szef AI w Deloitte. Z jednej strony, niejasność pozwala na elastyczność, umożliwiając firmom dostosowanie agentów do swoich potrzeb. Z drugiej strony, może — i prawdopodobnie już to zrobiło — prowadzić do „niedopasowanych oczekiwań” i trudności w mierzeniu wartości i zwrotu z inwestycji z projektów agentowych.

    „Bez ustandaryzowanej definicji, przynajmniej w ramach organizacji, staje się wyzwaniem benchmarkowanie wydajności i zapewnienie spójnych wyników,” powiedział Rowan. „To może skutkować różnymi interpretacjami tego, co agenci AI powinni dostarczać, co potencjalnie komplikuje cele i wyniki projektów. Ostatecznie, chociaż elastyczność może napędzać kreatywne rozwiązania, bardziej ustandaryzowane zrozumienie pomogłoby przedsiębiorstwom lepiej poruszać się po krajobrazie agentów AI i maksymalizować ich inwestycje.”

    Niestety, jeśli rozpad terminu „AI” jest jakimkolwiek wskaźnikiem, wydaje się mało prawdopodobne, że branża wkrótce zgodzi się na jedną definicję „agenta” — jeśli w ogóle kiedykolwiek.