Logo pl.androidermagazine.com
Logo pl.androidermagazine.com

Co to jest Google Duplex?

Spisu treści:

Anonim

Na Google I / O 2018 widzieliśmy demo najnowszej nowej fajnej rzeczy Google, Duplex. 60-metrowy ekran na scenie pokazał coś, co wygląda tak jak Twoja aplikacja Google Assistant z odtwarzaniem linia po linii Asystenta dzwoniącego do fryzjera i umawiającego się na spotkanie, wraz z pauzami, ummms i ahhhs oraz pozostałe osobliwości towarzyszące ludzkiej mowie. Osoba umawiająca się na spotkanie zdawała się nie wiedzieć, że rozmawia z komputerem, ponieważ to nie brzmiało jak komputer. Ani trochę.

Tego rodzaju demo wygląda niesamowicie (i może trochę przerażająco), ale co ze szczegółami? Czym dokładnie jest dupleks? Jak to w ogóle działa? Wszyscy mamy pytania, gdy widzimy coś innego, a znalezienie odpowiedzi w Internecie jest uciążliwe. Zobaczmy, co wiemy o Google Duplex.

Co to jest Google Duplex?

To nowe narzędzie od Google, które ma na celu wykorzystanie sztucznej inteligencji (AI) do „wykonywania rzeczywistych zadań przez telefon”, według badaczy i programistów AI w Google. Na razie oznacza to bardzo specyficzne zadania, takie jak umawianie spotkań, ale technologia jest rozwijana z myślą o ekspansji w innych obszarach. Wydanie miliardów na stworzenie fajnego sposobu na rezerwację obiadu brzmi jak coś, co zrobiłby Google, ale nie jest świetnym wykorzystaniem czasu lub pieniędzy.

Dupleks to także więcej niż widzieliśmy w wersji demo i jeśli kiedykolwiek opuści laboratorium, będzie o wiele więcej niż widzimy lub słyszymy z naszej strony. Istnieją ogromne banki danych i komputery do ich przetworzenia, które nie są tak fajne, jak wynik końcowy. Ale są one niezbędne, ponieważ zmuszanie komputera do mówienia i myślenia w czasie rzeczywistym, jak osoba, jest trudne.

Czy to nie jest tak jak zamiana tekstu na mowę?

Nie. Nawet nie blisko. I dlatego jest to wielka sprawa.

Dupleks ma na celu zmianę sposobu, w jaki komputer „rozmawia” przez telefon.

Celem Duplex jest sprawienie, aby wszystko brzmiało naturalnie, i aby Asystent myślał w locie, aby znaleźć termin spotkania, który działa. Jeśli Joe powie: „Tak, o tym - nie mam nic otwartego przed 10, czy to w porządku?” Asystent musi zrozumieć, co mówi Joe, dowiedzieć się, co to znaczy, i pomyśleć, czy to, co oferuje Joe, zadziała. Jeśli jesteś zajęty w mieście o 10, a jazda do garażu Joe zajmie 40 minut, Asystent musi być w stanie to zrozumieć i powiedzieć, że 11:15 będzie dobrze.

Równie ważne dla Google jest to, że Dupleks odpowiada i brzmi jak osoba. Google powiedział, że chce, aby osoba przez telefon nie wiedziała, że ​​rozmawia z komputerem, ale ostatecznie zdecydowała, że ​​najlepiej będzie o tym poinformować. Kiedy rozmawiamy z ludźmi, mówimy szybciej i mniej formalnie (czytaj: niespójne bełkotanie z punktu widzenia komputera) niż kiedy rozmawiamy z Asystentem na naszym telefonie lub komputerem w DMV, kiedy dzwonimy. Dupleks musi zrozumieć i odtwórz to, odpowiadając.

Wreszcie najbardziej imponujące jest to, że Dupleks musi zrozumieć kontekst. Piątek, następny piątek i piątek po następnym tygodniu to wszystkie warunki, które rozumiemy. Dupleks też je rozumie. Gdybyśmy rozmawiali w ten sam sposób, piszemy, nie byłby to problem, ale umm, wiesz, że nie, bo to brzmi tak duszno, tak, to nie jest mylące, chociaż słyszeliśmy to przez całe życie i jesteśmy do tego przyzwyczajeni. nie, nie mamy problemów, wiesz o tym, ani nic takiego.

Udzielę pierwszej pomocy redaktorowi po wpisaniu tego, gdy mówisz to na głos, więc zrozumiesz, co to oznacza.

Jak działa dupleks?

Od strony użytkownika jest to tak proste, jak polecenie Asystentowi, aby coś zrobił. Na razie, jak już wspomniano, że coś jest ograniczone do umawiania się na spotkania, więc powiedzielibyśmy: „Hej, Google umów mnie na wymianę oleju w garażu Joe'ego we wtorek rano” i (po przypomnieniu nam, żeby powiedzieć, proszę) zadzwoni skonfiguruj Garaż Joe i skonfiguruj, a następnie dodaj go do swojego kalendarza.

W ciągłych rozmowach używa się tej samej technologii, co w przypadku drukowania dwustronnego.

Całkiem fajne. Ale to, co dzieje się poza kamerą, jest jeszcze prostsze.

Dupleks wykorzystuje tak zwaną rekurencyjną sieć neuronową. Jest zbudowany przy użyciu technologii Google TensorFlow Extended. Google przeszkolił sieć w zakresie wszystkich anonimowych wiadomości głosowych i rozmów Google Voice, na które zgodziłeś się pozwolić jej słuchać, jeśli zdecydowałeś się na połączenie oprogramowania do rozpoznawania mowy oraz możliwości uwzględnienia historii rozmowy i szczegółów, takich jak pora dnia i lokalizacja obu stron.

Zasadniczo cała sieć komputerów o dużej mocy przeskakuje dane w chmurze i rozmawia przez Asystenta w telefonie lub innym produkcie z Asystentem na pokładzie.

Co z bezpieczeństwem i prywatnością?

Wszystko sprowadza się do jednej prostej rzeczy: czy ufasz Google. Inteligencja maszynowa na urządzeniu jest prawdziwa, choć jest ograniczona i stosunkowo nowa. Google opracował ML Kit, aby pomóc programistom robić więcej tego rodzaju rzeczy na samym urządzeniu, ale wszystko to zależy od mocy obliczeniowej. Umówienie się w ten sposób na spotkanie wymaga niewiarygodnej liczby obliczeń i nie można tego zrobić na telefonie ani w Google Home.

Musisz ufać Google ze swoimi danymi, aby korzystać z jej inteligentnych produktów, a Duplex nie będzie inaczej.

Google musi wykorzystać większość twoich danych osobowych, aby zrobić specjalne rzeczy, które Asystent może zrobić w tej chwili, a Dupleks tego nie zmienia. Nowością jest to, że teraz zaangażowana jest inna partia, która nie wyraziła zgody Google na wysłuchanie ich rozmowy.

Jeśli / kiedy Dupleks stanie się faktycznym produktem konsumenckim, z którego może korzystać każdy, należy spodziewać się, że będzie on krytykowany i kwestionowany przez sądy. I powinno być; pozwalanie Google decydować, co jest najlepsze dla naszej prywatności, jest jak stare powiedzenie dwóch lisów i kurczaka decydujących o tym, co jest na obiad.

Kiedy będę mieć dupleks na swoim telefonie?

Spodziewaj się dużych zmian w Asystencie jeszcze w tym roku.

Obecnie nikt nie wie. To może się nigdy nie zdarzyć. Google jest podekscytowany, gdy może zrobić tego rodzaju fantastyczną rzecz i chce się nią podzielić ze światem. To nie znaczy, że odniesie sukces lub stanie się prawdziwym produktem.

Na razie dupleks jest testowany w zamkniętym i nadzorowanym środowisku. Jeśli wszystko pójdzie dobrze, pierwsze eksperymentalne wydanie dla klientów, aby zrobić rezerwację w restauracji, umówić się na wizytę do salonu fryzjerskiego i uzyskać godziny świąteczne przez telefon, pojawi się jeszcze w tym roku za pomocą Asystenta tylko na telefonach.

Gdzie mogę dowiedzieć się więcej?

Google jest zaskakująco otwarty na technologię używaną do tworzenia dupleksów. Odpowiednie informacje znajdziesz na następujących stronach internetowych:

  • Blog Google AI (Google)
  • Deepmind
  • Tensorflow.org
  • Biblioteka Uniwersytecka Cornell
  • Google Research (Google)
  • Słowo kluczowe (Google)
  • Zestaw ML (Google)

Oczywiście, uważnie śledzimy również Dupleks, a usłyszysz najnowsze osiągnięcia, gdy tylko będą dostępne.