Selon la CNIL (Commission nationale de l’informatique et des libertés), l’anonymisation désigne un traitement qui vise à garantir le respect de la vie privée d’un individu en empêchant son identification au moyen d’un jeu de données. Elle fait partie des solutions qui permettent d’exploiter des données personnelles sans enfreindre les droits et les libertés des personnes physiques. Comment la mettre en œuvre ?
Quelles sont les techniques d’anonymisation d’une donnée personnelle ?
L’anonymisation des données à caractère personnel permet de les réutiliser tout en assurant la protection de la vie privée de leurs propriétaires. Elle rend aussi possible leur stockage au-delà de la durée de conservation établie.
Pour anonymiser efficacement une donnée personnelle, il est nécessaire d’observer plusieurs règles :
- Analyser la pertinence des informations pour déterminer celles qui doivent être conservées ;
- Supprimer les éléments rendant la personne concernée très facilement identifiable ;
- Catégoriser les informations par ordre d’importance en vue de la suppression de celles qui sont inutiles ;
- Délimiter la finesse tolérable pour toute information conservée.
Ce n’est que de cette manière qu’il sera possible de choisir la technique d’anonymisation appropriée. Il en existe deux principaux types.
La randomisation
La randomisation est une technique d’anonymisation qui consiste à détruire le lien entre une donnée personnelle et un individu. Plus précisément, il s’agit d’apporter des modifications aux attributs dans un ensemble de données. Visant à rendre les informations moins précises, ce procédé n’impacte toutefois pas leur répartition générale.
L’ajout de plusieurs centimètres à la taille réelle d’individus et la permutation des données relatives à leur date de naissance constituent des exemples de randomisation.
La généralisation
La généralisation implique la dilution de données personnelles par la modification de leur échelle ou de leur grandeur. Permettant de rendre des attributs communs aux personnes concernées, cette technique d’anonymisation empêche l’isolation d’un individu dans un jeu de données.
En guise d’illustration, au lieu d’indiquer la date de naissance de personnes dans une base de données, il est possible de ne renseigner que l’année.
Il faut toutefois noter que ces techniques d’anonymisation des données ne sont pas infaillibles. Il est ainsi dans l’intérêt de tout un chacun d’apprendre comment protéger ses données personnelles.
Comment anonymiser une base de données ?
L’anonymisation de bases de données privées doit respecter quelques conditions. Il est notamment nécessaire de remplacer par des informations fictives les données sensibles avant leur diffusion. Il convient aussi de supprimer toute donnée personnelle inutile en dehors de la production. En outre, il est important de se plier aux exigences en matière de mise en conformité au RGPD (règlement général sur la protection des données) pour les environnements hors production.
La méthode la plus répandue pour anonymiser une database est d’abolir les champs contenant des données personnelles. Il peut s’agir d’une adresse IP, d’un numéro de sécurité sociale, etc. La plupart du temps, cette action entraîne toutefois la suppression de données utiles comme les informations géographiques.
Une autre solution consiste à remplacer les champs de données à caractère personnel par de nouvelles informations. Dans ce cas cependant, il reste possible de réidentifier les individus concernés en combinant plusieurs bases de données.
Concernant particulièrement l’anonymisation des données dans des environnements hors production comme le test ou le développement, le RGPD recommande le masking ou l’anonymisation statique. Ce procédé empêche l’accès aux données sensibles grâce à leur remplacement par des informations qui s’en rapprochent sans toutefois présenter une quelconque utilité.
L’anonymisation ne constitue pas l’unique solution pour préserver les données sensibles. Il est par exemple aussi possible de recourir à la méthode de chiffrement. Cette dernière peut d’ailleurs être appliquée pour une base de données comme pour un appareil mobile. Pour en savoir plus, n’hésitez pas à lire l’article qui indique comment protéger ses données personnelles sur smartphone.
Comment anonymiser des données cloud ?
Nous avons évoqué dans un autre article que le risque pour les données personnelles figure parmi les inconvénients du cloud computing. Pour le limiter, l’anonymisation des données stockées dans le nuage informatique s’avère cruciale.
Dans ce cas-ci, le traitement des données peut aussi se baser sur le masking. Faisant disparaître les données originelles, l’anonymisation statique est essentiellement mise au service du droit à l’oubli. L’article 26 du RGPD dispose que le masking supprime l’assujettissement à ce règlement européen. Il s’agit ainsi d’une solution particulièrement intéressante pour les entreprises, car elle leur permettra de profiter pleinement des avantages du cloud computing.
Source image de couverture : MicroOne / Shutterstock.com