❌

Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

Zoom et les politiques de confidentialité

By: Framalang
17 August 2023 at 07:42

Cet article a Ă©tĂ© publiĂ© Ă  l’origine par THE MARKUP, il est traduit et republiĂ© avec l’accord de l’auteur selon les termes de la licence CC BY-NC-ND 4.0

 

Publication originale sur le site themarkup.org

 

Traduction Framalang : goofy, MO, Henri-Paul, Wisi_eu

 

Voilà ce qui arrive quand on se met à lire vraiment les politiques de confidentialité

Une rĂ©cente polĂ©mique sur la capacitĂ© de Zoom Ă  entraĂźner des intelligences artificielles avec les conversations des utilisateurs montre l’importance de lire les petits caractĂšres

par Aaron Sankin

 

Photo de l'extérieur du siÚge de Zoom le 07 février 2023 à San José, Californie. Les cÎtés droit et gauche de la photo sont masqués par deux zones sombres qui ne sont pas mises au point.

Justin Sullivan/Getty Images

 

photo de l'auteurBonjour, je m’appelle Aaron Sankin, je suis journaliste d’investigation Ă  The Markup. J’écris ici pour vous expliquer que si vous faites quelque chose de trĂšs pĂ©nible (lire les documents dans lesquels les entreprises expliquent ce qu’elles peuvent faire avec vos donnĂ©es), vous pourrez ensuite faire quelque chose d’un peu drĂŽle (piquer votre crise en ligne).

Au cours du dernier quart de siĂšcle, les politiques de protection de la vie privĂ©e – ce langage juridique long et dense que l’on parcourt rapidement avant de cliquer sans rĂ©flĂ©chir sur « J’accepte » – sont devenues Ă  la fois plus longues et plus touffues. Une Ă©tude publiĂ©e l’annĂ©e derniĂšre a montrĂ© que non seulement la longueur moyenne des politiques de confidentialitĂ© a quadruplĂ© entre 1996 et 2021, mais qu’elles sont Ă©galement devenues beaucoup plus difficiles Ă  comprendre.

Voici ce qu’a Ă©crit Isabel Wagner, professeur associĂ© Ă  l’universitĂ© De Montfort, qui a utilisĂ© l’apprentissage automatique afin d’analyser environ 50 000 politiques de confidentialitĂ© de sites web pour mener son Ă©tude :

« En analysant le contenu des politiques de confidentialitĂ©, nous identifions plusieurs tendances prĂ©occupantes, notamment l’utilisation croissante de donnĂ©es de localisation, l’exploitation croissante de donnĂ©es collectĂ©es implicitement, l’absence de choix vĂ©ritablement Ă©clairĂ©, l’absence de notification efficace des modifications de la politique de confidentialitĂ©, l’augmentation du partage des donnĂ©es avec des parties tierces opaques et le manque d’informations spĂ©cifiques sur les mesures de sĂ©curitĂ© et de confidentialité »

Si l’apprentissage automatique peut ĂȘtre un outil efficace pour comprendre l’univers des politiques de confidentialitĂ©, sa prĂ©sence Ă  l’intĂ©rieur d’une politique de confidentialitĂ© peut dĂ©clencher un ouragan. Un cas concret : Zoom.

En dĂ©but de semaine derniĂšre, Zoom, le service populaire de visioconfĂ©rence devenu omniprĂ©sent lorsque les confinements ont transformĂ© de nombreuses rĂ©unions en prĂ©sentiel en rĂ©unions dans de mini-fenĂȘtres sur des mini-Ă©crans d’ordinateurs portables, a rĂ©cemment fait l’objet de vives critiques de la part des utilisateurs et des dĂ©fenseurs de la vie privĂ©e, lorsqu’un article du site d’actualitĂ©s technologiques Stack Diary a mis en Ă©vidence une section des conditions de service de l’entreprise indiquant qu’elle pouvait utiliser les donnĂ©es collectĂ©es auprĂšs de ses utilisateurs pour entraĂźner l’intelligence artificielle.

version anglaise dĂ©but aoĂ»t, capturĂ©e par la Wayback Machine d’Internet Archive

le texte précise bien l'usage consenti par l'utilisateur de ses données pour l'apprentissage automatique et l'intelligence artificielle

version française fin juillet, capturĂ©e par la Wayback Machine d’Internet Archive

 

Le contrat d’utilisation stipulait que les utilisateurs de Zoom donnaient Ă  l’entreprise « une licence perpĂ©tuelle, non exclusive, libre de redevances, susceptible d’ĂȘtre cĂ©dĂ©e en sous-licence et transfĂ©rable » pour utiliser le « Contenu client » Ă  des fins diverses, notamment « de marketing, d’analyse des donnĂ©es, d’assurance qualitĂ©, d’apprentissage automatique, d’intelligence artificielle, etc. ». Cette section ne prĂ©cisait pas que les utilisateurs devaient d’abord donner leur consentement explicite pour que l’entreprise puisse le faire.

Une entreprise qui utilise secrĂštement les donnĂ©es d’une personne pour entraĂźner un modĂšle d’intelligence artificielle est particuliĂšrement controversĂ©e par les temps qui courent. L’utilisation de l’IA pour remplacer les acteurs et les scĂ©naristes en chair et en os est l’un des principaux points d’achoppement des grĂšves en cours qui ont paralysĂ© Hollywood. OpenAI, la sociĂ©tĂ© Ă  l’origine de ChatGPT, a fait l’objet d’une vague de poursuites judiciaires l’accusant d’avoir entraĂźnĂ© ses systĂšmes sur le travail d’écrivains sans leur consentement. Des entreprises comme Stack Overflow, Reddit et X (le nom qu’Elon Musk a dĂ©cidĂ© de donner Ă  Twitter) ont Ă©galement pris des mesures Ă©nergiques pour empĂȘcher les entreprises d’IA d’utiliser leurs contenus pour entraĂźner des modĂšles sans obtenir elles-mĂȘmes une part de l’activitĂ©.

La rĂ©action en ligne contre Zoom a Ă©tĂ© fĂ©roce et immĂ©diate, certaines organisations, comme le mĂ©dia Bellingcat, proclamant leur intention de ne plus utiliser Zoom pour les vidĂ©oconfĂ©rences. Meredith Whittaker, prĂ©sidente de l’application de messagerie Signal spĂ©cialisĂ©e dans la protection de la vie privĂ©e, a profitĂ© de l’occasion pour faire de la publicité :

« HUM : Les appels vidĂ©o de @signalapp fonctionnent trĂšs bien, mĂȘme avec une faible bande passante, et ne collectent AUCUNE DONNÉE SUR VOUS NI SUR LA PERSONNE À QUI VOUS PARLEZ ! Une autre façon tangible et importante pour Signal de s’engager rĂ©ellement en faveur de la vie privĂ©e est d’interrompre le pipeline vorace de surveillance des IA. »

Zoom, sans surprise, a éprouvé le besoin de réagir.

Dans les heures qui ont suivi la diffusion de l’histoire, le lundi mĂȘme, Smita Hashim, responsable des produits chez Zoom, a publiĂ© un billet de blog visant Ă  apaiser des personnes qui craignent de voir  leurs propos et comportements ĂȘtre intĂ©grĂ©s dans des modĂšles d’entraĂźnement d’IA, alors qu’elles souhaitent virtuellement un joyeux anniversaire Ă  leur grand-mĂšre, Ă  des milliers de kilomĂštres de distance.

« Dans le cadre de notre engagement en faveur de la transparence et du contrĂŽle par l’utilisateur, nous clarifions notre approche de deux aspects essentiels de nos services : les fonctions d’intelligence artificielle de Zoom et le partage de contenu avec les clients Ă  des fins d’amĂ©lioration du produit », a Ă©crit Mme Hashim. « Notre objectif est de permettre aux propriĂ©taires de comptes Zoom et aux administrateurs de contrĂŽler ces fonctions et leurs dĂ©cisions, et nous sommes lĂ  pour faire la lumiĂšre sur la façon dont nous le faisons et comment cela affecte certains groupes de clients ».

Mme Hashim Ă©crit que Zoom a mis Ă  jour ses conditions d’utilisation pour donner plus de contexte sur les politiques d’utilisation des donnĂ©es par l’entreprise. Alors que le paragraphe sur Zoom ayant « une licence perpĂ©tuelle, non exclusive, libre de redevances, pouvant faire l’objet d’une sous-licence et transfĂ©rable » pour utiliser les donnĂ©es des clients pour « l’apprentissage automatique, l’intelligence artificielle, la formation, les tests » est restĂ© intact [N de T. cependant cette mention semble avoir disparu dans la version du 11 aoĂ»t 2023], une nouvelle phrase a Ă©tĂ© ajoutĂ©e juste en dessous :

« Zoom n’utilise aucun Contenu client audio, vidĂ©o, chat, partage d’écran, piĂšces jointes ou autres communications comme le Contenu client (tels que les rĂ©sultats des sondages, les tableaux blancs et les rĂ©actions) pour entraĂźner les modĂšles d’intelligence artificielle de Zoom ou de tiers. »

Comment utilisons-nous vos donnĂ©es Ă  caractĂšre personnel ?Les employĂ©s de Zoom n’accĂšdent pas au Contenu client des rĂ©unions, des webinaires, des messageries ou des e-mails (en particulier, l’audio, la vidĂ©o, les fichiers, les tableaux blancs en rĂ©union et les contenus des messageries ou des e-mails), ni au contenu gĂ©nĂ©rĂ© ou partagĂ© dans le cadre d’autres fonctions de collaboration (comme les tableaux blancs hors rĂ©union), et ne les utilisent pas, Ă  moins que le titulaire du compte hĂ©bergeant le produit ou Service Zoom oĂč le Contenu client a Ă©tĂ© gĂ©nĂ©rĂ© ne le demande ou que cela ne soit nĂ©cessaire pour des raisons juridiques, de sĂ»retĂ© ou de sĂ©curitĂ©. Zoom n’utilise aucun Contenu client audio, vidĂ©o, chat, partage d’écran, piĂšces jointes ou autres communications comme le Contenu client (tels que les rĂ©sultats des sondages, les tableaux blancs et les rĂ©actions) pour entraĂźner les modĂšles d’intelligence artificielle de Zoom ou de tiers.

copie d’écran du 16/08/2023, page https://explore.zoom.us/fr/privacy/

 

Dans son billet de blog, Mme Hashim insiste sur le fait que Zoom n’utilise le contenu des utilisateurs que pour former l’IA Ă  des produits spĂ©cifiques, comme un outil qui gĂ©nĂšre automatiquement des rĂ©sumĂ©s de rĂ©unions, et seulement aprĂšs que les utilisateurs auront explicitement choisi d’utiliser ces produits. « Un exemple de service d’apprentissage automatique pour lequel nous avons besoin d’une licence et de droits d’utilisation est notre analyse automatisĂ©e des invitations et des rappels de webinaires pour s’assurer que nous ne sommes pas utilisĂ©s involontairement pour spammer ou frauder les participants », Ă©crit-elle. « Le client est propriĂ©taire de l’invitation au webinaire et nous sommes autorisĂ©s Ă  fournir le service Ă  partir de ce contenu. En ce qui concerne l’IA, nous n’utilisons pas de contenus audios, de vidĂ©os ou de chats pour entraĂźner nos modĂšles sans le consentement du client. »

La politique de confidentialitĂ© de Zoom – document distinct de ses conditions de service – ne mentionne l’intelligence artificielle ou l’apprentissage automatique que dans le contexte de la fourniture de « fonctions et produits intelligents (sic), tels que Zoom IQ ou d’autres outils pour recommander le chat, le courrier Ă©lectronique ou d’autres contenus ».

Pour avoir une idĂ©e de ce que tout cela signifie, j’ai Ă©changĂ© avec Jesse Woo, un ingĂ©nieur spĂ©cialisĂ© en donnĂ©es de The Markup qui, en tant qu’avocat spĂ©cialisĂ© dans la protection de la vie privĂ©e, a participĂ© Ă  la rĂ©daction de politiques institutionnelles d’utilisation des donnĂ©es.

M. Woo explique que, bien qu’il comprenne pourquoi la formulation des conditions d’utilisation de Zoom touche un point sensible, la mention suivant laquelle les utilisateurs autorisent l’entreprise Ă  copier et Ă  utiliser leur contenu est en fait assez standard dans ce type d’accord d’utilisation. Le problĂšme est que la politique de Zoom a Ă©tĂ© rĂ©digĂ©e de maniĂšre Ă  ce que chacun des droits cĂ©dĂ©s Ă  l’entreprise soit spĂ©cifiquement Ă©numĂ©rĂ©, ce qui peut sembler beaucoup. Mais c’est aussi ce qui se passe lorsque vous utilisez des produits ou des services en 2023, dĂ©solĂ©, bienvenue dans le futur !

Pour illustrer la diffĂ©rence, M. Woo prend l’exemple de la politique de confidentialitĂ© du service de vidĂ©oconfĂ©rence concurrent Webex, qui stipule ce qui suit : « Nous ne surveillerons pas le contenu, sauf : (i) si cela est nĂ©cessaire pour fournir, soutenir ou amĂ©liorer la fourniture des services, (ii) pour enquĂȘter sur des fraudes potentielles ou prĂ©sumĂ©es, (iii) si vous nous l’avez demandĂ© ou autorisĂ©, ou (iv) si la loi l’exige ou pour exercer ou protĂ©ger nos droits lĂ©gaux ».

Cette formulation semble beaucoup moins effrayante, mĂȘme si, comme l’a notĂ© M. Woo, l’entraĂźnement de modĂšles d’IA pourrait probablement ĂȘtre mentionnĂ© par une entreprise sous couvert de mesures pour « soutenir ou amĂ©liorer la fourniture de services ».

L’idĂ©e que les gens puissent paniquer si les donnĂ©es qu’ils fournissent Ă  une entreprise dans un but Ă©vident et simple (comme opĂ©rer un appel de vidĂ©oconfĂ©rence) sont ensuite utilisĂ©es Ă  d’autres fins (comme entraĂźner un algorithme) n’est pas nouvelle. Un rapport publiĂ© par le Forum sur le futur de la vie privĂ©e (Future of Privacy Forum), en 2018, avertissait que « le besoin de grandes quantitĂ©s de donnĂ©es pendant le dĂ©veloppement en tant que « donnĂ©es d’entraĂźnement » crĂ©e des problĂšmes de consentement pour les personnes qui pourraient avoir acceptĂ© de fournir des donnĂ©es personnelles dans un contexte commercial ou de recherche particulier, sans comprendre ou s’attendre Ă  ce qu’elles soient ensuite utilisĂ©es pour la conception et le dĂ©veloppement de nouveaux algorithmes. »

Pour Woo, l’essentiel est que, selon les termes des conditions de service initiales, Zoom aurait pu utiliser toutes les donnĂ©es des utilisateurs qu’elle souhaitait pour entraĂźner l’IA sans demander leur consentement et sans courir de risque juridique dans ce processus.

Ils sont actuellement liĂ©s par les restrictions qu’ils viennent d’inclure dans leurs conditions d’utilisation, mais rien ne les empĂȘche de les modifier ultĂ©rieurement.
Jesse Woo, ingénieur en données chez The Markup

« Tout le risque qu’ils ont pris dans ce fiasco est en termes de rĂ©putation, et le seul recours des utilisateurs est de choisir un autre service de vidĂ©oconfĂ©rence », explique M. Woo. « S’ils avaient Ă©tĂ© intelligents, ils auraient utilisĂ© un langage plus circonspect, mais toujours prĂ©cis, tout en proposant l’option du refus, ce qui est une sorte d’illusion de choix pour la plupart des gens qui n’exercent pas leur droit de refus. »

Changements futurs mis Ă  part, il y a quelque chose de remarquable dans le fait qu’un tollĂ© public rĂ©ussisse Ă  obtenir d’une entreprise qu’elle dĂ©clare officiellement qu’elle ne fera pas quelque chose d’effrayant. L’ensemble de ces informations sert d’avertissement Ă  d’autres sur le fait que l’entraĂźnement de systĂšmes d’IA sur des donnĂ©es clients sans leur consentement pourrait susciter la colĂšre de bon nombre de ces clients.

Les conditions d’utilisation de Zoom mentionnent la politique de l’entreprise en matiĂšre d’intelligence artificielle depuis le mois de mars, mais cette politique n’a attirĂ© l’attention du grand public que la semaine derniĂšre. Ce dĂ©calage suggĂšre que les gens ne lisent peut-ĂȘtre pas les donnĂ©es juridiques, de plus en plus longues et de plus en plus denses, dans lesquelles les entreprises expliquent en dĂ©tail ce qu’elles font avec vos donnĂ©es.

Heureusement, Woo et Jon Keegan, journalistes d’investigation sur les donnĂ©es pour The Markup, ont rĂ©cemment publiĂ© un guide pratique (en anglais) indiquant comment lire une politique de confidentialitĂ© et en  identifier rapidement les parties importantes, effrayantes ou rĂ©voltantes.

Bonne lecture !


Sur le mĂȘme thĂšme, on peut s’intĂ©resser à :

 

❌
❌