💾 Archived View for gamifi.cat › blog › 2019-08-09_lqdn_microsoft captured on 2023-07-10 at 13:40:04. Gemini links have been rewritten to link to archived content
⬅️ Previous capture (2023-03-20)
-=-=-=-=-=-=-
Vam anar a conèixer la Julie, que havia treballat per una empresa encarregada de «millorar» el funcionament de Cortana, l'assistent vocal de Microsoft, escoltant una a una diverses paraules captades per la mà quina (voluntà riament o no).
Compartim aquà el seu inspirador testimoni. Qui escolta les vostres converses quan utilitzeu un assistent vocal com Cortana? Qui mira les vostres cerques quan utilitzeu motors de recerca com Bing? "Ningú", us asseguren els creadors d'aquests dispositius, «són mà quines les que ho fan». La realitat és una altra, com ens explica aquest testimoni: una noia que, sense contracte de treball i sense cap acord de confidencialitat, ha transcrit milers de converses privades, cerques d'informació, noms i dades personals de persones que utilitzen productes de Microsoft.
Som de camĂ per anar a veure la Julie, que ha treballat per a una empresa que ha ajudat a desenvolupar Cortana, l'assistent vocal de Microsoft. Esperem que ens pugui explicar com funcionen aquests tipus de serveis.
-Julie, bon dia
-Bon dia
-Has contactat La Quadrature du Net comentant que havies treballat per aquesta empresa. En què consistia exactament la feina?
-El nostre treball es basava en les dades que recol·lectava Cortana. Quan la gent s'adreçava a Cortana, ella ho enregistrava tot i Microsoft donava les dades a la companyia per a la que jo treballava. Nosaltres, els i les transcriptores, ens connectĂ vem a una plataforma de treball on tenĂem accĂ©s a totes les transcripcions, a tots els discs durs enregistrats per Cortana, i les havĂem de tractar una per una, escoltant un a un tots els enregistraments que Cortana havia fet de les usuĂ ries franceses. Es mostrava un text adjunt amb el que Cortana havia entès i havĂem de corregir totes les faltes que havia fet, siguessin de comprensiĂł, d'ortografia, de gramĂ tica, i a mĂ©s, havĂem de detallar els element sonors que hi havia a l'enregistrament.
-A quin tipus d'informació tenies accés?
-Hi havia de tot, qualsevol cosa. Hi havia enregistraments de cerques en lĂnia, algunes coses poc importants com «Ei, Cortana, quin temps farĂ avui?» o «Quin temps farĂ demĂ ?». Hi havia tot tipus dades perquè es recol·lecta molta cosa. Hi havia converses en lĂnia, ja siguessin amb els serveis Xbox de la gent que juga en xarxa, o tambĂ© de converses de Skype de les persones que usen el servei de traducciĂł instantĂ nia. AixĂ que tenĂem accĂ©s converses privades, de vegades a coses molt personals i Ăntimes. Hi havia tambĂ© les cerques a Internet on les converses eren directament amb Cortana. Hi ha gent que parla a Cortana i li pregunta coses com «Ei, Cortana, Ă©s que puc ser feliç sol?». De vegades, hi ha gent que se sent terriblement trista i parla a Cortana per pujar la moral. Per les recerques a Internet hi havia realment una pila de coses, i com us podeu imaginar, tambĂ© hi havia les cerques pornogrĂ fiques dels usuaris, que demanaven «Ei, Cortana, busquem vĂdeos d'aquesta categoria o d'aquesta altra». Hi havia moltĂssimes adreces perquè la gent programava el seu GPS tambĂ© amb això, aixĂ que podĂem veure l'adreça de casa seva, del seu metge o del seu advocat. Realment, tot passava per les nostres orelles. Un cop, hi havia una dona que treballava d'advocada i tenĂem accĂ©s als noms de les persones per a qui treballava. La dona dictava informes on, tot i ser fragmentaris podia haver-hi detalls rellevants.
Sovint, Cortana enregistrava sense que ningĂş li demanĂ©s, amb el que escoltĂ vem converses que no havien de ser enregistrades: gent que es discutia al cotxe o amb els fills, gent menjant o anant al lavabo. Hi havia gent que se n'adonava i s'enfadaven molt, aixĂ que sentia sovint «Puta Cortana!» i ho havia de transcriure. Hi havia moltes dades d'enregistraments no sol·licitats però, tot i aixĂ, Microsoft recol·lectava la informaciĂł.
DesprĂ©s, les transcripcions es fragmentaven en petites porcions anònimes pels transcriptors, aixĂ que no tenĂem identificadors dels usuaris de Microsoft però sempre hi havia detalls de noms, d'adreces o de nĂşmeros de telèfon. Mai de nĂşmeros de targeta de crèdit però sĂ de la seguretat social.
-AixĂ que tenĂeu informaciĂł de tot tipus de gent. Dels infants tambĂ©?
-SĂ, n'hi havia molts als enregistraments que tenĂem. MoltĂssims. De vegades quan jugaven en lĂnia o feien les seves cerques a Internet.
-Imagino que vas haver de signar un contracte amb una clĂ usula de confidencialitat.
-No, no tenĂem cap contracte. Jo mai he firmat un contracte de confidencialitat, nomĂ©s calia inscriure't a la plataforma i allĂ acceptaves les condicions d'Ăşs. De fet, abans d'acceptar no sabia ben bĂ© en què consistia la feina.
-Com vas trobar aquesta feina?
-Buscava feina i vaig veure una oferta. Les condicions eren de comprendre anglès perquè totes informacions estaven en anglès, i d'escriure bĂ© francès. Hi havia una formaciĂł en lĂnia i passaves un examen. No havies de donar el currĂculum ni hi havia entrevista personal amb ningĂş. Realment, no demanaven res. Passaves l'examen i ja tenies accĂ©s a tot.
-Quin tipus de contracte vas signar?
-Jo treballava sense contracte de treball i en règim d'autònoms, aixĂ que no hi havia ni contracte de treball ni de confidencialitat. Tampoc cotitzĂ vem i no tenĂem cap protecciĂł social, aixĂ que era un treball precari on havĂem de fer almenys deu hores de treball per setmana. Però en podĂem 45 o mĂ©s, tantes com volguĂ©ssim perquè no hi havia restriccions en aquest sentit. En general, se'n feien unes 20 o 25 perquè no es poden fer 35 hores de transcripciĂł, Ă©s una feina molt intensa que requereix molta concentraciĂł. I n'havĂem de fer, de mitja, de 120 a 160 transcripcions per hora, aixĂ que era molt, sobretot per trobar totes les faltes gramaticals, i d'ortografia, i verificar els noms... No Ă©s fĂ cil...
-A partir de treballar amb aquesta empresa, et vas adonar que alguna cosa no anava bĂ©? Hi ha molta gent que fa aquesta feina... No nomĂ©s per Cortana, sinĂł per altres assistents vocals que funcionen exactament de la mateixa manera. Tot i aixĂ, ets la primera a denunciar això.
-SĂ, molta gent fa aquesta feina. Quan vaig començar buscaven 50 transcriptors francesos. Però tambĂ© en buscaven per moltes altres llengĂĽes com Ă rab o el francès canadenc. I sĂ, ho trobava una xocant però era una feina prĂ ctica i podies tenir molta llibertat.
-Quan veus gent que usa aquest tipus de servei, què et vindria de gust dir-els-hi?
-Els diria que paressin perquè, realment, es recol·lecta moltes dades personals. I no és normal que hi hagi gent que pugui tenir accés a tota aquesta informació, ja sigui gent com jo que no he signat cap contracte de confidencialitat, o inclús les empreses com Microsoft. És massa personal i explotable perquè es poden fer moltes coses amb aquestes dades i la gent no té consciència que no només hi ha robots i ordinadors rere aquestes recol·leccions, hi ha humans com jo que tracten totes aquestes informacions, que escolten i teclegen...
Com ens recorda Antonio Cassilli a continuació, aquest relat subratlla exactament les prà ctiques «molt humanes» que es troben a la massa sota els miralls enganyosos de l'anomenada «intel·ligència artificial». Antonio Casilli, membre de La Quadrature du Net, es investigador a l'EHESS i professor a Télécom ParisTech (mirar la seva pà gina web).
La seva feina? Ensinistradora d'Intel·ligència Artificial (IA)
Malgrat el que en diuen els seus productors, els assistents virtuals dels aparells connectats que coronen els nostres menjadors o que nien en les nostres butxaques, instal·lats en els nostres telèfons intel·ligents, no neixen intel·ligents. Han d’aprendre a interpretar les cerques i els costums dels usuaris.
Aquest aprenentatge està guiat per humans, que verifiquen que les respostes que donen els assistents virtuals als seus propietaris siguin pertinents. Però encara més sovint, els humans «entrenen» els dispositius donant dades ja tractades, cerques amb les respostes ja fetes (ex. «Quin temps fa avui?» : « Avui estem a 23 graus» o « Està plovent») o frases per les quals donen una interpretació (ex. saber en quin context «cap» es refereix a «la part del cos» o a «una persona o objecte no existent»). Aquests ensinistradors d’intel·ligència artificial són a vegades teletreballadors pagats per hora per empreses especialitzades. En altres casos són feines a preu fet, pagades per unitat, que es contracten en serveis web que s’anomenen plataformes de micro-treball.
La de Microsoft es diu UHRS i proposen remuneracions de 3, 2, o fins i tot 1 cèntim de dollar per micro-tasca (transcriure una paraula, etiquetar una imatge, ...). A vegades les persones que trien les vostres cerques, miren les vostres fotos, escolten les vostres paraules estan al vostre paĂs, fins i tot en la vostra ciutat (podria ser el veĂ de sota?). En d’altres casos sĂłn treballadors precaris de paĂŻsos en els que es parla la mateixa llengua. En el cas de França poden ser paĂŻsos com TunĂsia, Marroc o Madagascar (que en els Ăşltims temps s’ha imposat com a «lider francès de la intel·ligència artificial».
Els programes d’activaciĂł vocal com Cortana, Siri o Alexa sĂłn agents conversacionals que posseĂŻxen un gran component de feina no-artificial. Aquesta implicaciĂł humana introdueix riscos socials especĂfics. La confidencialitat de les dades personals utilitzades per entrenar les solucions intel·ligents estĂ en risc. Aquestes IA pressuposen enviar grans quantitats de dades de carĂ cter personal i existeixen en una zona grisa tan legal com ètica.
Mentre que els usuaris d’aquests serveis no estiguin al corrent de la presència d’humans entre els bastidors de la IA, estaran infravalorant el risc que pesa sobre la seva vida privada. De forma urgent s’han d’estudiar les violacions de la privacitat i la confidencialitat associades amb aquesta forma de treball digital, per tal de veure’n el seu abast i poder informar, sensibilitzar i protegir millor les persones més exposades.