Rozwiązania oparte na sztucznej inteligencji coraz częściej zmieniają sposób, w jaki komunikujemy się w pracy i w życiu codziennym. Microsoft, jeden z liderów w branży technologicznej, planuje wprowadzić do platformy Teams nową funkcję klonowania głosu.

    Dzięki tej technologii użytkownicy będą mogli rozmawiać w czasie rzeczywistym w różnych językach, wykorzystując cyfrową replikę swojego głosu. Choć zapowiada się rewolucyjnie, na obsługę języka polskiego przyjdzie nam jeszcze poczekać.

    Czym jest funkcja Interpreter w Teams?

    Microsoft ogłosił nowość podczas konferencji Ignite 2024, prezentując narzędzie nazwane Interpreter. Jest to funkcja wykorzystująca sztuczną inteligencję do tłumaczenia mowy w czasie rzeczywistym. Wyróżnia się możliwością klonowania głosu użytkownika, co oznacza, że tłumaczenie może brzmieć jak mówca, a nie jak neutralny lektor. Jak podkreślił Jared Spataro, dyrektor marketingu Microsoft, rozwiązanie to ma sprawić, że komunikacja w wielojęzycznych zespołach stanie się bardziej osobista i angażująca.

    Interpreter będzie dostępny dla subskrybentów pakietu Microsoft 365 i początkowo obsłuży dziewięć języków, takich jak angielski, francuski, niemiecki, japoński czy hiszpański. Niestety, język polski nie znalazł się w pierwszej grupie obsługiwanych języków, co może rozczarować wielu użytkowników w naszym kraju.

    Pozostała część artykułu pod materiałem wideo:

    Jak działa klonowanie głosu?

    Klonowanie głosu polega na stworzeniu cyfrowego modelu, który imituje ton, akcent i intonację użytkownika. Microsoft zapewnia, że funkcja Interpreter działa w sposób bezpieczny – nie przechowuje danych biometrycznych i wymaga wyraźnej zgody użytkownika na jej aktywację. Dzięki temu rozwiązaniu tłumaczenia będą wierniejsze i bardziej spersonalizowane niż kiedykolwiek wcześniej.

    W praktyce oznacza to, że podczas spotkania w Teams użytkownik mówi w swoim języku, a uczestnicy słyszą tłumaczenie w ich ojczystym języku, ale w głosie mówcy. Microsoft zapewnia również, że narzędzie nie dodaje emocji czy treści, które nie są obecne w oryginalnej wypowiedzi.

    Potencjalne zastosowania i korzyści

    Nowa funkcja w Teams ma ogromny potencjał, szczególnie w obszarze międzynarodowej współpracy biznesowej. Wydaje się, że możemy liczyć m.in. na poniższe benefity.

    • Lepszą komunikację w wielojęzycznych zespołach – brak bariery językowej to krok w stronę bardziej inkluzywnego środowiska pracy.
    • Wsparcie w obsłudze klienta – firmy będą mogły lepiej obsługiwać klientów z różnych krajów, oferując im spersonalizowaną interakcję.
    • Zwiększenie dostępności – klonowanie głosu może pomóc osobom z zaburzeniami mowy w lepszym wyrażaniu siebie w środowiskach cyfrowych.

    Opcja ma oczywiście potencjalne ciemne strony

    Jak każda innowacja, technologia klonowania głosu budzi także obawy. Przede wszystkim dotyczą one potencjalnego wykorzystania narzędzia w celach niezgodnych z prawem, takich jak oszustwa czy tworzenie deepfake’ów. Już teraz raporty wskazują na przypadki, w których cyfrowo zrekonstruowane głosy zostały wykorzystane do wyłudzeń, np. podczas fałszywych spotkań wideo.

    Microsoft deklaruje, że Interpreter posiada zabezpieczenia, takie jak wymóg zgody na klonowanie głosu oraz możliwość wyłączenia tej funkcji w ustawieniach. Nie zmienia to jednak faktu, że narzędzia tego typu mogą stać się celem cyberprzestępców, a błędy w tłumaczeniach mogą prowadzić do nieporozumień, zwłaszcza w kontekstach biznesowych.

    Klonowanie głosu w Polsce – kiedy możemy się go spodziewać?

    Obecnie Microsoft nie ogłosił daty wprowadzenia obsługi języka polskiego w Interpreterze. To, że nasz język nie znalazł się w pierwszej grupie obsługiwanych, wynika zapewne z jego relatywnie mniejszej obecności na arenie międzynarodowej. Niemniej jednak, biorąc pod uwagę rosnącą popularność platformy Teams w Polsce, można przypuszczać, że funkcja ta zostanie wdrożona w naszym języku w kolejnych etapach.

    Pomimo wyzwań związanych z bezpieczeństwem i dokładnością tłumaczeń, narzędzie to może zrewolucjonizować sposób, w jaki komunikujemy się w środowisku cyfrowym. Choć użytkownicy w Polsce będą musieli poczekać na jej pełną funkcjonalność, globalny potencjał tego rozwiązania jest niezaprzeczalny. Microsoft po raz kolejny udowadnia, że granice językowe można pokonać dzięki nowoczesnym technologiom.

    Przeczytaj także: