Firma ElevenLabs, lider w dziedzinie generatywnego dźwięku AI, ogłosiła wprowadzenie funkcji „Expressive Mode” dla platformy ElevenAgents. Premiera zbiega się w czasie z ogłoszeniem rekordowej rundy finansowania, która winduje wycenę spółki do poziomu 11 miliardów dolarów.
Nowa technologia ma sprawić, że rozmowy z botami staną się niemal nieodróżnialne od interakcji z ludźmi, oferując bezprecedensowy poziom empatii i inteligencji emocjonalnej w obsłudze klienta. Współczesna obsługa klienta często opiera się na rozwiązaniach, które brzmią mechanicznie i nie potrafią zareagować na stres rozmówcy. Wraz z pojawieniem się AI w pełni oddającego ekspresję wypowiedzi człowieka, obsługa klienta wchodzi w nową erę. Dzięki Expressive Mode, zespoły call centers zyskują kontrolę nad tonem głosu agentów AI. Technologia ta pozwala np. uspokajać zdenerwowanych rozmówców i prowadzić rozmowy do jasnego rozwiązania nawet pod presją.
Sztuczna Inteligencja emocjonalna
Za przełomem stoją dwie kluczowe innowacje. Pierwsza z nich, to model Eleven v3 Conversational. To najbardziej inteligentny emocjonalnie i świadomy kontekstu model Text-to-Speech (TTS), jaki do tej pory stworzyła firma. Optymalizacja pod kątem dialogu w czasie rzeczywistym pozwala mu oddawać intencje i emocje bez efektu „skryptowości”.
Z kolei system „turn-taking” polega na wykorzystaniu modelu transkrypcji Scribe v2 Realtime, dzięki któremu AI potrafi wywnioskować emocje z tego, jak coś zostało powiedziane (np. nagły wzrost tempa czy głośności). Pozwala to maszynie lepiej decydować, kiedy mówić, a kiedy zrobić pauzę.
Globalna skala i sukces Revoluta
Nowa technologia nie posiada ograniczeń językowych. Expressive Mode skaluje niuanse emocjonalne na ponad 70 języków, w tym hindi czy hiszpański z argentyńskim akcentem. Skuteczność rozwiązań ElevenLabs potwierdzają wdrożenia u liderów rynku. Revolut, który wykorzystuje wielojęzycznych agentów firmy, odnotował ośmiokrotne skrócenie czasu rozwiązywania zgłoszeń (ticketów). Takie wyniki budują zaufanie inwestorów.
Eleven Labs ogłosił właśnie pozyskanie 500 milionów dolarów w rundzie finansowania serii D, co przy wycenie 11 miliardów dolarów stawia ją w ścisłej czołówce globalnych jednorożców AI.
Warto przypomnieć, że ElevenLabs ma polskie korzenie. Firma została założona w 2022 roku przez Piotra Dąbkowskiego (byłego inżyniera Google) oraz Mateusza Staniszewskiego (byłego stratega Palantir). Choć dziś jest globalnym graczem z siedzibami w Londynie i Nowym Jorku, jej sukces jest często stawiany za wzór polskiej myśli technologicznej na świecie.
Choć obecnie w centrum uwagi są agenci głosowi, ElevenLabs rozwija cały ekosystem narzędzi audio, m.in.: AI Music Generator do tworzenia muzyki, Voice Isolator do czyszczenia nagrań z szumów, Dubbing Studio do automatycznego tłumaczenia i podkładania głosu w filmach czy Voiceover Studio i aplikacja mobilna ElevenReader.
CZYTAJ TEŻ: Prof. Sankowski: Pora na infuzję polskich technologii
CZYTAJ TEŻ: Sztuczna inteligencja w służbie obywateli – jak wpływa na usługi cyfrowe w administracji publicznej

