Ce qui soulève des questions de sécurité
Un nouveau document d’assistance choquant de Google a suscité l’indignation après avoir dévoilé comment son application Gemini Chatbot stocke en fait les données des utilisateurs par défaut en ligne. Cette pratique est observée sur le web, pour les utilisateurs d’iOS et ceux d’Android. « Les conversations qui ont été examinées ou annotées par des réviseurs humains (et les données connexes telles que votre langue, le type d’appareil, les informations de localisation ou les commentaires) ne sont pas supprimées lorsque vous supprimez votre activité Gemini Apps, car elles sont conservées séparément et ne sont pas connectées à votre compte Google. En revanche, elles sont conservées pendant une période pouvant aller jusqu’à trois ans », révèle Google dans une page d’assistance.
Ne tapez rien dans Gemini, la famille d’applications GenAI de Google, qui soit incriminant (ou que vous ne voudriez pas que quelqu’un d’autre voie). C’est l’avertissement (en quelque sorte) lancé par Google, qui, dans un nouveau document d’assistance, explique comment il recueille les données des utilisateurs de ses applications de chatbot Gemini pour le web, Android et iOS.
Google précise que des annotateurs humains lisent, étiquettent et traitent régulièrement les conversations avec Gemini (même si ces conversations sont « déconnectées » des comptes Google – afin d’améliorer le service. (Il n’est pas précisé si ces annotateurs sont internes ou externalisés, ce qui pourrait avoir une incidence sur la sécurité des données ; Google ne le précise pas). Ces conversations sont conservées jusqu’à trois ans, avec des « données connexes » telles que les langues et les appareils utilisés par l’utilisateur, ainsi que sa localisation.
Quelle est donc la solution ? Comment éviter que cela ne se produise ?
Selon Google, la seule solution semble être de désactiver les applications de Gemini en cliquant sur l’onglet Mon activité, car cette option est activée par défaut et empêche l’accès aux discussions futures ou leur stockage en ligne.
En revanche, si vous êtes plus préoccupé par les chats individuels ou les invites effectuées via Gemini, ne vous inquiétez pas, vous pouvez les supprimer via l’écran Activité des applications dont vous avez été témoin en ligne.
Google a indiqué que les chats effectués par l’intermédiaire de Gemini peuvent toujours être stockés dans la base de données, même si l’activité de Gemini est désactivée. Mais ces données sont conservées pendant 72 heures afin de garantir la sécurité de l’utilisateur sur Gemini et d’améliorer l’expérience de l’utilisateur lors de l’utilisation des applications.
C’est pourquoi le fabricant d’Android avertit désormais les utilisateurs de ne plus ajouter dans les chats des données sensibles ou piratées qu’ils n’auraient jamais voulu exposer pour améliorer les produits et les services, sans parler de la technologie d’apprentissage automatique : « Veuillez ne pas saisir d’informations confidentielles dans vos conversations ni de données que vous ne voudriez pas qu’un évaluateur voie ou que Google utilise pour améliorer nos produits, nos services et nos technologies d’apprentissage automatique », écrit Google.
Il faut dire que les règles de collecte et de conservation des données de GenAI de Google ne diffèrent pas tellement de celles de ses rivaux. OpenAI, par exemple, enregistre tous les chats avec ChatGPT pendant 30 jours, que la fonction d’historique des conversations de ChatGPT soit désactivée ou non, sauf dans les cas où l’utilisateur a souscrit à un plan d’entreprise assorti d’une politique de conservation des données personnalisée.
Un équilibre difficile
La politique de Google illustre les défis inhérents à l’équilibre entre la protection de la vie privée et le développement de modèles GenAI qui se nourrissent des données des utilisateurs pour s’améliorer eux-mêmes.
Les politiques libérales de conservation des données de la GenAI ont récemment mis les fournisseurs dans le collimateur des autorités de régulation.
L’été dernier, la FTC a demandé à OpenAI des informations détaillées sur la manière dont l’entreprise contrôle les données utilisées pour l’entraînement de ses modèles, y compris les données des consommateurs, et sur la manière dont ces données sont protégées lorsqu’elles sont accessibles à des tiers. Du côté de l’Europe, l’autorité italienne de protection des données a déclaré qu’OpenAI ne disposait pas d’une « base juridique » pour la collecte et le stockage massifs de données à caractère personnel en vue de l’entraînement de ses modèles GenAI.
Alors que les outils de GenAI prolifèrent, les organisations se méfient de plus en plus des risques liés à la protection de la vie privée.
OpenAI, Microsoft, Amazon, Google et d’autres proposent des produits GenAI destinés aux entreprises qui ne veulent explicitement pas conserver les données pendant un certain temps, que ce soit pour la formation des modèles ou à d’autres fins. Cependant, les consommateurs – comme c’est souvent le cas – n’ont pas droit à l’erreur.
Une enquête récente de Cisco a révélé que 63 % des entreprises ont établi des limites quant aux données pouvant être introduites dans les outils de GenAI, tandis que 27 % d’entre elles ont complètement interdit la GenAI. La même enquête a révélé que 45 % des employés ont saisi des données « problématiques » dans les outils de GenAI, notamment des informations sur les employés et des fichiers non publics concernant leur employeur.
source : developpez