Alexa jest instalowana na ponad 100 milionach urządzeń na całym świecie, uzyskując w ten sposób miliardy zapytań użytkowników. Podobnie jak wszyscy asystenci cyfrowi, Alexa polega na modelach danych, aby oferować lepsze odpowiedzi, ale wygląda na to, że Amazon również pomógł asystentowi cyfrowemu pomocną dłoń w postaci ludzkich recenzji. Badanie przeprowadzone przez Bloomberg ujawniło, że Amazon ma globalny zespół, który transkrybuje i ogłasza nagrania Alexy z całego świata, aby „wyeliminować luki w rozumieniu mowy ludzkiej przez Alexę” i pozwolić asystentowi na udzielenie lepszych odpowiedzi na twoje pytania.
Publikacja wykazała, że Amazon zatrudnia tysiące ludzi na całym świecie - zarówno wykonawców, jak i pracowników zatrudnionych w pełnym wymiarze godzin - do przeglądu nagrań Alexa, z zespołami rozmieszczonymi w Bostonie, Kostaryce, Indiach i Rumunii. Według nienazwanego źródła, każdy recenzent analizuje ponad 1000 klipów audio podczas dziewięciogodzinnej zmiany, dodając do nich adnotacje i przekazując je z powrotem do systemu, aby poprawić reakcje Alexy. Od Bloomberg:
Jeden z pracowników w Bostonie powiedział, że wydobywał zgromadzone dane głosowe dla konkretnych wypowiedzi, takich jak „Taylor Swift”, i opatrzył je adnotacjami, aby wskazać, że poszukiwacz oznacza artystę muzycznego.
Czasami słuchacze wybierają rzeczy, które właściciele Echo prawdopodobnie wolą zachować prywatność: kobieta śpiewa źle pod klucz, powiedzmy, lub dziecko krzyczy o pomoc. Zespoły korzystają z wewnętrznych pokojów czatowych, aby udostępniać pliki, gdy potrzebują pomocy w analizie mętnego słowa - lub natrafiają na zabawne nagranie.
W publikacji stwierdzono również, że pracownicy napotykają niepokojące nagrania:
Czasami słyszą nagrania, które uważają za niepokojące lub być może przestępcze. Dwóch pracowników powiedziało, że podnieśli napaść seksualną. Kiedy coś takiego się zdarza, mogą dzielić się doświadczeniami na wewnętrznym czacie jako sposób na rozładowanie stresu.
Amazon twierdzi, że obowiązują procedury, które powinni stosować pracownicy, gdy słyszą coś niepokojącego, ale dwóch pracowników z Rumunii stwierdziło, że po zwróceniu się o wskazówki w takich przypadkach powiedziano im, że to nie przeszkadza Amazonowi.
Nagrania nie mają pełnej nazwy ani adresu użytkownika, ale zawierają imię i nazwisko użytkownika, numer konta oraz numer seryjny urządzenia. Amazon wspominał wcześniej, że do uczenia Alexy wykorzystuje przetwarzanie języka naturalnego, ale przyznał Bloombergowi, że używa elementu ludzkiego do opisania „małej próbki nagrań Alexy:”
Poważnie podchodzimy do bezpieczeństwa i prywatności danych osobowych naszych klientów. Adnotujemy jedynie wyjątkowo małą próbkę nagrań głosowych Alexa, aby poprawić jakość obsługi klienta. Na przykład te informacje pomagają nam szkolić nasze systemy rozpoznawania mowy i rozumienia języka naturalnego, dzięki czemu Alexa może lepiej zrozumieć Twoje żądania i zapewnić, że usługa działa dobrze dla wszystkich.
Posiadamy ścisłe zabezpieczenia techniczne i operacyjne oraz politykę zerowej tolerancji dla nadużyć na naszym systemie. Pracownicy nie mają bezpośredniego dostępu do informacji umożliwiających identyfikację osoby lub konta w ramach tego przepływu pracy. Wszystkie informacje są traktowane z najwyższą poufnością i używamy uwierzytelniania wieloskładnikowego w celu ograniczenia dostępu, szyfrowania usług i audytów naszego środowiska kontrolnego w celu ich ochrony.
Nie tylko Amazon zwraca się do ludzi pomagających w opracowaniu cyfrowego asystenta. Bloomberg stwierdził, że Apple ma również ludzki zespół, który sprawdza, czy interpretacja żądań Siri odpowiada temu, o co pytali użytkownicy. Google ma recenzentów, którzy szkolą Asystenta, ale klipy nie zawierają żadnych danych osobowych, a sam dźwięk jest zniekształcony, aby uniemożliwić jakąkolwiek identyfikację.