Samurai Labs chroni już 59 milionów użytkowników Discorda

Misją Samurai Labs jest zapobieganie negatywnym zachowaniom w społecznościach online. W tym celu wykorzystujemy proaktywną sztuczną inteligencję (AI), która podejmuje autonomiczne działania w czasie rzeczywistym, aby zapobiec krzywdom zanim się pojawią. Nasza technologia wykrywa i łagodzi różne formy agresji, takie jak cyberprzemoc, nękanie, groźby czy seksizm, zapewniając bezpieczeństwo użytkownikom społeczności online. Dzięki Samurai Labs organizacje mogą prowadzić zautomatyzowaną moderację treści w czasie rzeczywistym, redukując koszty i czas. Oferujemy również rozwiązania, które zmniejszają ryzyko reputacyjne dla reklamodawców, chroniąc społeczności, w których się reklamują.

Jak to robimy?

Poleganie wyłącznie na manualnej weryfikacji zgłoszonych naruszeń nie jest skalowalne. Dlatego naszym głównym celem było osiągnięcie wysokiej precyzji wykrywania toksycznych zachowań w społecznościach online, co umożliwia wdrożenie zautomatyzowanych działań mających na celu eliminację szkodliwych interakcji. Gdy wykryjemy cyberprzemoc, możemy natychmiast podjąć działanie, interweniować autonomicznie lub powiadomić moderatorów, zanim zostanie wyrządzona krzywda. To podejście umożliwia szybkie i szeroko zakrojone działania, odróżniające nas od metod opartych na wykrywaniu słów kluczowych czy sztucznej inteligencji opartej na modelach statystycznych, które wymagają manualnej weryfikacji.

W przeciwieństwie do systemów opartych wyłącznie na dużych modelach językowych lub na słowach kluczowych, w Samurai Labs łączymy duże modele językowe z symbolicznym wnioskowaniem wzbogaconym o wiedzę ekspercką z danej dziedziny. Dzięki temu nasze modele osiągają dziesięciokrotnie niższy poziom wykrywania fałszywie pozytywnych wyników niż powszechnie stosowane rozwiązania. Dzięki czemu możemy reagować w czasie rzeczywistym, niezależnie od rozmiaru chronionej społeczności.

Z kim współpracujemy?

Technologia Samurai Labs chroni 59 milionów użytkowników Discorda na ponad 1,3 miliona serwerów, w tym 7. największy serwer – Grand Theft Auto Online, który ma ponad 518 000 użytkowników. Zapewniamy moderację w czasie rzeczywistym podczas największych turniejów esportowych, takich jak IASI 2023, Road to Riyadh i Girl Gamer. W tym roku udzieliliśmy pomocy ponad 25 tysiącom osób w kryzysie samobójczym. Działania te prowadzimy w ramach projektu One Life, który realizujemy we współpracy z serwisem pomocowym “Życie Warte Jest Rozmowy”, przez identyfikowanie osób w kryzysie samobójczym w społecznościach na Reddicie i interweniowanie przez bezpośrednią interakcję z osobą w kryzysie. Interwencje te zaprojektowaliśmy we współpracy z ekspertami z zakresu suicydologii i psychologii (eksperci ZWJR).

Zmieniający się krajobraz regulacyjny

26 października 2023 roku brytyjski parlament wprowadził Ustawę o Bezpieczeństwie Online (Online Safety Act), która zobowiązuje platformy do odpowiedzialności za treści, które są publikowane na ich platformach. Ustawa ma na celu ochronę użytkowników przed szkodliwymi treściami, takimi jak materiały promujące wykorzystywanie seksualne dzieci, cyberprzemoc, nakłanianie do samookaleczeń i podsycanie skłonności samobójczych. Platformy będą miały obowiązek podejmować działania wobec nielegalnych lub szkodliwych treści. Niewywiązanie się z tego obowiązku będzie skutkować grzywnami do 18 milionów funtów lub 10% rocznego obrotu, w zależności od tego, która kwota jest wyższa. Obecnie rządowa agencja OFCOM opracowuje przepisy wykonawcze, które wejdą w życie w połowie przyszłego roku. Regulatorzy w USA i UE również pracują nad podobnymi regulacjami mającymi na celu ochronę użytkowników internetu.

Sprawdź więcej: https://www.samurailabs.ai

ChatGPT w pracy biurowej – kiedy można go używać, a jakie sytuacje go wykluczają

Gdzie pojechać na majówkę? Określ swoje preferencje i zapytaj chatbota

Cyberlekcje 3.0 pozwolą zrozumieć i przekazywać wiedzę o zagrożeniach technologicznych w sieci

Czym jest silna sztuczna inteligencja?

Jak Polska radzi sobie z adaptacją generatywnej AI? Sprawdzamy w raporcie Generative AI Adoption

CERT Orange Polska podsumowuje 10 lat ochrony użytkowników przed zagrożeniami w sieci. Co zmieniło AI?

Czy AI zadomowiło się w polskich firmach? Sprawdzamy z raportem EFL

Chcemy kreować innowacje, budować suwerenność technologiczną a państwo ma pozostać w centrum rozwoju cyfryzacji – analiza PIE

Zakupy bez kliknięcia. Agentic AI zmieni e-commerce szybciej, niż myślisz

Windsurf chce przejąć kontrolę nad całym procesem inżynierii oprogramowania

Potencjał i aspiracje mamy. Polska może wziąć udział w wyścigu o AI

Szwajcarska firma IT sięga po prywatną chmurę dla AI

Obserwuje świat i wyciąga wnioski – nowy model AI – V-JEPA 2 od Meta

Czym jest vibe coding i co ma wspólnego z AI?

Google zachwyca swoim najnowszym modelem wideo Veo 3

Rola Edge Computing w AI. Nowe kierunki technologicznego rozwoju sztucznej inteligencji

Europa przyspiesza wyścig o suwerenną AI. Gigafabryki, miliardy i ostrzeżenie Nvidii

ChatGPT ma pamiętać wszystko na twój temat. To budzi grozę i ekscytację zarazem

Czy sztuczna inteligencja jest niebezpieczna? To zależy

Przyszłość robotyki w 2025 r. Od humanoidów po AI

Jak zyskać na sztucznej inteligencji czas (i pieniądze)?

Dla pracowników IT wynagrodzenie nie jest najważniejsze

Łukasz Kaiser: ekspert stojący za rozwojem machine learning z prestiżową nagrodą

AI w programach edukacyjnych Centrum Kształcenia Podyplomowego Uczelni Łazarskiego

Europa przyspiesza wyścig o suwerenną AI. Gigafabryki, miliardy i ostrzeżenie Nvidii

Zakupy bez kliknięcia. Agentic AI zmieni e-commerce szybciej, niż myślisz

Obserwuje świat i wyciąga wnioski – nowy model AI – V-JEPA 2 od Meta

ChatGPT w pracy biurowej – kiedy można go używać, a jakie sytuacje go wykluczają

Samurai Labs chroni już 59 milionów użytkowników Discorda

Jak to robimy?

Z kim współpracujemy?

Zmieniający się krajobraz regulacyjny

Tensorflight podbija sektor property intelligence

Deepsense.ai pomaga wdrażać AI na szeroką skalę

Samurai Labs chroni już 59 milionów użytkowników Discorda

Jak to robimy?

Z kim współpracujemy?

Zmieniający się krajobraz regulacyjny

Polecane