Vam anar a conèixer la Julie, que havia treballat per una empresa encarregada de «millorar» el funcionament de Cortana, l'assistent vocal de Microsoft, escoltant una a una diverses paraules captades per la màquina (voluntàriament o no).
Compartim aquí el seu inspirador testimoni. Qui escolta les vostres converses quan utilitzeu un assistent vocal com Cortana? Qui mira les vostres cerques quan utilitzeu motors de recerca com Bing? "Ningú", us asseguren els creadors d'aquests dispositius, «són màquines les que ho fan». La realitat és una altra, com ens explica aquest testimoni: una noia que, sense contracte de treball i sense cap acord de confidencialitat, ha transcrit milers de converses privades, cerques d'informació, noms i dades personals de persones que utilitzen productes de Microsoft.
Som de camí per anar a veure la Julie, que ha treballat per a una empresa que ha ajudat a desenvolupar Cortana, l'assistent vocal de Microsoft. Esperem que ens pugui explicar com funcionen aquests tipus de serveis.
-Julie, bon dia
-Bon dia
-Has contactat La Quadrature du Net comentant que havies treballat per aquesta empresa. En què consistia exactament la feina?
-El nostre treball es basava en les dades que recol·lectava Cortana. Quan la gent s'adreçava a Cortana, ella ho enregistrava tot i Microsoft donava les dades a la companyia per a la que jo treballava. Nosaltres, els i les transcriptores, ens connectàvem a una plataforma de treball on teníem accés a totes les transcripcions, a tots els discs durs enregistrats per Cortana, i les havíem de tractar una per una, escoltant un a un tots els enregistraments que Cortana havia fet de les usuàries franceses. Es mostrava un text adjunt amb el que Cortana havia entès i havíem de corregir totes les faltes que havia fet, siguessin de comprensió, d'ortografia, de gramàtica, i a més, havíem de detallar els element sonors que hi havia a l'enregistrament.
-A quin tipus d'informació tenies accés?
-Hi havia de tot, qualsevol cosa. Hi havia enregistraments de cerques en línia, algunes coses poc importants com «Ei, Cortana, quin temps farà avui?» o «Quin temps farà demà?». Hi havia tot tipus dades perquè es recol·lecta molta cosa. Hi havia converses en línia, ja siguessin amb els serveis Xbox de la gent que juga en xarxa, o també de converses de Skype de les persones que usen el servei de traducció instantània. Així que teníem accés converses privades, de vegades a coses molt personals i íntimes. Hi havia també les cerques a Internet on les converses eren directament amb Cortana. Hi ha gent que parla a Cortana i li pregunta coses com «Ei, Cortana, és que puc ser feliç sol?». De vegades, hi ha gent que se sent terriblement trista i parla a Cortana per pujar la moral. Per les recerques a Internet hi havia realment una pila de coses, i com us podeu imaginar, també hi havia les cerques pornogràfiques dels usuaris, que demanaven «Ei, Cortana, busquem vídeos d'aquesta categoria o d'aquesta altra». Hi havia moltíssimes adreces perquè la gent programava el seu GPS també amb això, així que podíem veure l'adreça de casa seva, del seu metge o del seu advocat. Realment, tot passava per les nostres orelles. Un cop, hi havia una dona que treballava d'advocada i teníem accés als noms de les persones per a qui treballava. La dona dictava informes on, tot i ser fragmentaris podia haver-hi detalls rellevants.
Sovint, Cortana enregistrava sense que ningú li demanés, amb el que escoltàvem converses que no havien de ser enregistrades: gent que es discutia al cotxe o amb els fills, gent menjant o anant al lavabo. Hi havia gent que se n'adonava i s'enfadaven molt, així que sentia sovint «Puta Cortana!» i ho havia de transcriure. Hi havia moltes dades d'enregistraments no sol·licitats però, tot i així, Microsoft recol·lectava la informació.
Després, les transcripcions es fragmentaven en petites porcions anònimes pels transcriptors, així que no teníem identificadors dels usuaris de Microsoft però sempre hi havia detalls de noms, d'adreces o de números de telèfon. Mai de números de targeta de crèdit però sí de la seguretat social.
-Així que teníeu informació de tot tipus de gent. Dels infants també?
-Sí, n'hi havia molts als enregistraments que teníem. Moltíssims. De vegades quan jugaven en línia o feien les seves cerques a Internet.
-Imagino que vas haver de signar un contracte amb una clàusula de confidencialitat.
-No, no teníem cap contracte. Jo mai he firmat un contracte de confidencialitat, només calia inscriure't a la plataforma i allà acceptaves les condicions d'ús. De fet, abans d'acceptar no sabia ben bé en què consistia la feina.
-Com vas trobar aquesta feina?
-Buscava feina i vaig veure una oferta. Les condicions eren de comprendre anglès perquè totes informacions estaven en anglès, i d'escriure bé francès. Hi havia una formació en línia i passaves un examen. No havies de donar el currículum ni hi havia entrevista personal amb ningú. Realment, no demanaven res. Passaves l'examen i ja tenies accés a tot.
-Quin tipus de contracte vas signar?
-Jo treballava sense contracte de treball i en règim d'autònoms, així que no hi havia ni contracte de treball ni de confidencialitat. Tampoc cotitzàvem i no teníem cap protecció social, així que era un treball precari on havíem de fer almenys deu hores de treball per setmana. Però en podíem 45 o més, tantes com volguéssim perquè no hi havia restriccions en aquest sentit. En general, se'n feien unes 20 o 25 perquè no es poden fer 35 hores de transcripció, és una feina molt intensa que requereix molta concentració. I n'havíem de fer, de mitja, de 120 a 160 transcripcions per hora, així que era molt, sobretot per trobar totes les faltes gramaticals, i d'ortografia, i verificar els noms... No és fàcil...
-A partir de treballar amb aquesta empresa, et vas adonar que alguna cosa no anava bé? Hi ha molta gent que fa aquesta feina... No només per Cortana, sinó per altres assistents vocals que funcionen exactament de la mateixa manera. Tot i així, ets la primera a denunciar això.
-Sí, molta gent fa aquesta feina. Quan vaig començar buscaven 50 transcriptors francesos. Però també en buscaven per moltes altres llengües com àrab o el francès canadenc. I sí, ho trobava una xocant però era una feina pràctica i podies tenir molta llibertat.
-Quan veus gent que usa aquest tipus de servei, què et vindria de gust dir-els-hi?
-Els diria que paressin perquè, realment, es recol·lecta moltes dades personals. I no és normal que hi hagi gent que pugui tenir accés a tota aquesta informació, ja sigui gent com jo que no he signat cap contracte de confidencialitat, o inclús les empreses com Microsoft. És massa personal i explotable perquè es poden fer moltes coses amb aquestes dades i la gent no té consciència que no només hi ha robots i ordinadors rere aquestes recol·leccions, hi ha humans com jo que tracten totes aquestes informacions, que escolten i teclegen...
Com ens recorda Antonio Cassilli a continuació, aquest relat subratlla exactament les pràctiques «molt humanes» que es troben a la massa sota els miralls enganyosos de l'anomenada «intel·ligència artificial». Antonio Casilli, membre de La Quadrature du Net, es investigador a l'EHESS i professor a Télécom ParisTech (mirar la seva pàgina web).
La seva feina? Ensinistradora d'Intel·ligència Artificial (IA)
Malgrat el que en diuen els seus productors, els assistents virtuals dels aparells connectats que coronen els nostres menjadors o que nien en les nostres butxaques, instal·lats en els nostres telèfons intel·ligents, no neixen intel·ligents. Han d’aprendre a interpretar les cerques i els costums dels usuaris.
Aquest aprenentatge està guiat per humans, que verifiquen que les respostes que donen els assistents virtuals als seus propietaris siguin pertinents. Però encara més sovint, els humans «entrenen» els dispositius donant dades ja tractades, cerques amb les respostes ja fetes (ex. «Quin temps fa avui?» : « Avui estem a 23 graus» o « Està plovent») o frases per les quals donen una interpretació (ex. saber en quin context «cap» es refereix a «la part del cos» o a «una persona o objecte no existent»). Aquests ensinistradors d’intel·ligència artificial són a vegades teletreballadors pagats per hora per empreses especialitzades. En altres casos són feines a preu fet, pagades per unitat, que es contracten en serveis web que s’anomenen plataformes de micro-treball.
La de Microsoft es diu UHRS i proposen remuneracions de 3, 2, o fins i tot 1 cèntim de dollar per micro-tasca (transcriure una paraula, etiquetar una imatge, ...). A vegades les persones que trien les vostres cerques, miren les vostres fotos, escolten les vostres paraules estan al vostre país, fins i tot en la vostra ciutat (podria ser el veí de sota?). En d’altres casos són treballadors precaris de països en els que es parla la mateixa llengua. En el cas de França poden ser països com Tunísia, Marroc o Madagascar (que en els últims temps s’ha imposat com a «lider francès de la intel·ligència artificial».
Els programes d’activació vocal com Cortana, Siri o Alexa són agents conversacionals que posseïxen un gran component de feina no-artificial. Aquesta implicació humana introdueix riscos socials específics. La confidencialitat de les dades personals utilitzades per entrenar les solucions intel·ligents està en risc. Aquestes IA pressuposen enviar grans quantitats de dades de caràcter personal i existeixen en una zona grisa tan legal com ètica.
Mentre que els usuaris d’aquests serveis no estiguin al corrent de la presència d’humans entre els bastidors de la IA, estaran infravalorant el risc que pesa sobre la seva vida privada. De forma urgent s’han d’estudiar les violacions de la privacitat i la confidencialitat associades amb aquesta forma de treball digital, per tal de veure’n el seu abast i poder informar, sensibilitzar i protegir millor les persones més exposades.