Taula de continguts:
- Què és Google Duplex?
- No és això com parlar de text?
- Com funciona Duplex?
- Què passa amb la seguretat i la privadesa?
- Quan tindré Duplex al telèfon?
- On puc aprendre més?
A Google I / O 2018 vam veure una demostració de l’última novetat més recent de Google, Duplex. La pantalla de 60 peus de pantalla va mostrar el que s’assembla a la vostra aplicació de Google Assistant amb una reproducció línia per línia d’Assistent que realitza una trucada telefònica a una perruqueria i configura una cita, completada amb les pauses, els ummms i ahhhs i la resta d’idiosincràcies que acompanyen la parla humana. La persona que prenia la cita no semblava saber que estava parlant amb un ordinador perquè no semblava un ordinador. Ni tan sols una mica.
Aquest tipus de demostració sembla increïble (i potser una mica esgarrifós), però, i els detalls? Què és exactament el dúplex? Com funciona fins i tot? Tots tenim preguntes quan veiem una cosa diferent i trobar respostes repartides per Internet és un dolor. Anem a sobre del que sabem fins ara sobre Google Duplex.
Què és Google Duplex?
És una nova eina de Google que té com a objectiu utilitzar la intel·ligència artificial (AI) per "realitzar tasques del món real per telèfon" segons els investigadors i desenvolupadors de l'AI de Google. Ara per ara, això vol dir tasques molt específiques com fer cites, però la tecnologia es desenvolupa amb vista a l’expansió cap a altres àrees. Gastar milers de milions per crear una manera fantàstica de fer que les reserves del sopar semblin una cosa que Google faria, però no és un gran ús del temps o dels diners.
El dúplex també és més del que vam veure en una demostració i, si surt algun cop del laboratori, serà molt més del que veiem o escoltem al nostre final. Hi ha grans bancs de dades i els equips per processar-los, que no són tan fantàstics com el resultat final. Però són fonamentals perquè fer parlar una informàtica i pensar, en temps real, com una persona és difícil.
No és això com parlar de text?
No, no. Ni tan sols a prop. I per això és un gran problema.
Duplex està dissenyat per canviar la forma en què un ordinador "parla" per telèfon.
L’objectiu de Duplex és fer que les coses sonin naturals i que l’Assistent pensi sobre la marxa per trobar una cita que funcioni. Si Joe diu: "Sí, d'això, no tinc res obert fins a les 10, està bé?" L’assistent ha d’entendre el que diu Joe, esbrineu què significa això i pensi si el que ofereix Joe funciona per a vosaltres. Si esteu ocupats a la ciutat a les 10 i us triguen 40 minuts a conduir fins a Joe's Garage, l'Assistent ha de ser capaç de descobrir-ho i dir 11:15 seria bo.
Igualment important per a Google és que Duplex respon i sona com a persona. Google ha dit que volia que la persona del telèfon no sabés que parlava amb un ordinador, tot i que finalment va decidir que seria millor informar-los. Quan parlem amb persones, parlem més ràpidament i menys formal (llegiu: balbucejament incoherent des del punt de vista d’un ordinador) que quan parlem amb Assistant al nostre telèfon o a l’ordinador del DMV quan truquem. El Duplex ha d’entendre això i recreeu-lo en respondre.
Finalment, i el més impressionant, és que Duplex ha d’entendre el context. Divendres, divendres vinent i divendres després de la setmana que ve són tots els termes que tú i jo entenc. El dúplex també els ha d’entendre. Si parléssim de la mateixa manera que escrivim això no seria cap problema, però sí, no sap que no, perquè sembla que sembli tan molest, no és confús, tot i que ho hem sentit tota la vida i estem acostumats a això no tenim problemes que no ho entenguis ni res així.
Administraré primers auxilis al meu editor després d'escriure tot mentre ho digueu en veu alta, de manera que veieu què vol dir això.
Com funciona Duplex?
Des del final de l'usuari, és tan senzill com dir a l'Assistent que faci alguna cosa. Per ara, com s'ha esmentat, que alguna cosa es limita a fer cites, així que diríem: "Hola Google em fa una cita per a un canvi de petroli a Joe's Garage per al dimarts al matí" i (després que ens recordés que digués, si us plau), cridaria. configura el Joe's Garage i configura les coses i, a continuació, afegeix-lo al calendari.
Bastant núvol. Però el que passa fora de la càmera és encara més ràpid.
Duplex fa servir el que s'anomena xarxa neuronal recurrent. Es crea mitjançant la tecnologia TensorFlow Extended de Google. Google va entrenar la xarxa en tots els missatges de veu anonimats i en les converses de Google Voice que heu acceptat per deixar-lo escoltar si heu optat amb una combinació de programes de reconeixement de veu i la possibilitat de considerar l'historial de la conversa i els detalls com l'hora i la ubicació del dia. de les dues parts.
Essencialment, tota una xarxa d’ordinadors d’alta potència està escrivint dades al núvol i parla mitjançant Assistant al telèfon o a un altre producte que tingui Assistant a bord.
Què passa amb la seguretat i la privadesa?
Es tracta d’una cosa senzilla: confieu en Google. La intel·ligència de màquina al dispositiu és una cosa real, tot i que és restringida i relativament nova. Google ha desenvolupat el kit ML per ajudar els desenvolupadors a fer més coses d’aquest tipus al propi dispositiu, però tot és qüestió de potència informàtica. Es necessita una quantitat increïble de càlculs per fer una cita per als cabells d'aquesta manera, i no hi ha cap manera de fer-ho al vostre telèfon o a Google Home.
Heu de confiar en Google amb les vostres dades per utilitzar els seus productes intel·ligents i Duplex no serà diferent.
Google necessita aprofitar bona part de les vostres dades personals per fer les coses especials que pot fer l’Assistent ara mateix i Duplex no canvia això. El que hi ha de nou és que ara hi ha una altra part implicada que no va donar permís explícit a Google per escoltar la seva conversa.
Si / quan Duplex es converteix en un producte de consum real per a qualsevol usuari, espera que sigui criticat i impugnat als tribunals. I hauria de ser; deixar que Google decideixi el que és millor per a la nostra privadesa és com el vell adagi de dues guineus i un pollastre que decidís què és el sopar.
Quan tindré Duplex al telèfon?
Ningú ho sap ara mateix. Mai pot passar. Google s’emociona quan pot fer aquest tipus de coses fantàstiques i vol compartir-ho amb el món. Això no vol dir que tingui èxit ni es converteixi en un producte real.
Ara per ara, Duplex s'està provant en un entorn tancat i supervisat. Si tot va bé, un alliberament experimental inicial per als consumidors per fer reserves de restaurants, programar cites per a salons de perruqueria i obtenir hores de vacances per telèfon arribarà a la fi d’aquest any només amb Assistant als telèfons.
On puc aprendre més?
Google és sorprenentment obert sobre la tecnologia que utilitza per crear Duplex. Trobareu informació rellevant als llocs web següents:
- Google AI blog (Google)
- Deepmind
- Tensorflow.org
- Biblioteca de la Universitat de Cornell
- Google Research (Google)
- La paraula clau (Google)
- Kit ML (Google)
Per descomptat, també estem seguint Duplex de prop, i coneixereu les darreres novetats aquí tan aviat com estiguin disponibles.