La France figure parmi les précurseurs de l’open data en Europe. Dans le pays, l’ouverture des données est surtout pratiquée par le secteur public. De son côté, le secteur privé affiche encore du retard. La plupart du temps, la mise à disposition de leurs jeux de données par les entreprises est motivée par des obligations. Pour lever les freins, il est nécessaire de déterminer l’intérêt de l’open data.
Qu’est-ce qu’un site open data ?
L’open data désigne la publication de données numériques sous licence ouverte. Concrètement, il est possible d’accéder librement à ces données. Par ailleurs, leur réutilisation et leur partage sont autorisés et n’impliquent aucune condition technique, financière ou juridique.
L’open data est également connu sous l’appellation « donnée ouverte ». Selon la Sunlight Foundation, ce terme désigne toute donnée brute qui est :
- Primaire ;
- Complète ;
- Opportune ;
- Accessible ;
- Exploitable ;
- Non-propriétaire ;
- Non discriminatoire ;
- Permanente ;
- Libre de droits ;
- Gratuite.
Un site est dit open data lorsqu’il permet le libre accès à des données répondant à ces critères. Tel est notamment le cas du portail de données ouvertes data.gouv.fr animé par la mission Etalab.
Avec l’évolution rapide du Web et de ses innombrables applications, les données connaissent une multiplication exponentielle. Leur production continue favorise la démocratisation du principe d’open data. En même temps, cette situation tend à faire passer le Web d’un outil d’information et de connaissance à un simple support de données. Pour transformer ces dernières en information, l’intervention d’intermédiaires s’impose. Il est donc nécessaire de réfléchir à une pédagogie des données portant sur divers plans, dont la production, la diffusion, le traitement, la valorisation et l’éthique.
L’open data en France, comme partout ailleurs, pose aussi le problème de compatibilité avec le respect des données personnelles. Par exemple, les communes comptant plus de 3 500 habitants et au moins 50 agents sont tenues de rendre accessibles gratuitement en ligne certains documents et données en leur possession. Il s’agit d’une disposition de l’article L.312-1-1 du CRPA (Code des relations entre le public et l’administration). Toutefois, si les fichiers comportent des données à caractère personnel se rapportant à la vie privée des individus concernés, leur diffusion n’est pas envisageable.
Dans ce contexte, la CNIL, en association avec la CADA, a dévoilé un guide pratique concernant la publication des données publiques en ligne et leur réutilisation. Ces autorités y listent les moyens permettant de concilier obligations des administrations et respect de la vie privée.
D’une façon globale, ce document a été pensé pour mettre en lumière le cadre juridique de l’open data et sa mise en conformité au RGPD.
Qui utilise l’open data ?
Les données produites par les collectivités territoriales et d’autres acteurs publics concernent des domaines variés. Il peut s’agir de données géographiques, de statistiques, de textes réglementaires, de baromètres ou encore d’annuaires.
L’open data en France peut servir à différents types d’acteurs : citoyens, entreprises, chercheurs, associations… Il a pour objectif de faciliter la réutilisation des données ouvertes pour :
- Améliorer les services fournis aux citoyens ou en créer de nouveaux ;
- Dégager de nouvelles connaissances ;
- Nourrir le débat public, etc.
Son usage dans le cadre de la pandémie de Covid-19 illustre très bien le potentiel de l’ouverture des données publiques. Comme l’a souligné le gouvernement, la crise sanitaire a démontré que l’open data peut aider à améliorer significativement les politiques publiques et favoriser leur transparence.
À titre d’illustration, la diffusion des données issues des centres hospitaliers a été exploitée par de nombreuses entreprises pour anticiper les entrées de malades. Grâce à ces données de prédiction, les équipes chargées de s’occuper des patients contaminés peuvent mieux s’organiser. Depuis que le coronavirus sévit en France, pas moins de 200 applications et services ont été élaborés par des entreprises et des collectivités, mais également des particuliers.
Quel est l’intérêt de l’open data pour les organisations ?
L’exemple cité précédemment prouve que l’open data permet d’impulser un changement bénéfique. Pour les organisations (villes, collectivités ou ministères), ce type d’évolution se répercute sur leur structure même, mais aussi sur leurs agents. Plus précisément, lorsqu’une organisation ouvre ses données, elle accroît la transparence de l’action publique.
Par ailleurs, la qualité des données rendues publiques est améliorée. En effet, avant d’ouvrir les données en sa possession, une organisation s’appliquera forcément à les bonifier. Elle verra sa légitimité se renforcer, surtout avec la réutilisation des informations qu’elle gère à diverses fins.
D’autre part, en adoptant une stratégie open data, une organisation sera amenée à multiplier les collaborations avec des acteurs externes. Enfin, ouvrir l’accès à ses données lui permettra de contribuer à l’interopérabilité des services publics étant donné que d’autres administrations pourront les réutiliser plus facilement.
Grâce à l’open data en France, l’offre en matière de services publics sera donc améliorée. Par exemple, les données produites et détenues par les villes peuvent servir à concevoir des applications mobiles visant à améliorer le transport.
Comment l’open data permet de produire de nouveaux services ?
L’ouverture des données rend possible la création de nouveaux services dans la mesure où elle permet de mieux appréhender les comportements des citoyens. À titre d’illustration, grâce aux données relatives au trafic routier, il est possible de déterminer les habitudes des habitants en matière de déplacement. Les organisations, mais aussi tout porteur de projet, peuvent exploiter ces informations pour mettre au point des applications en faveur de la mobilité.
Pour être réutilisées et permettre la mise en place de nouveaux services, les données mises à disposition doivent toutefois respecter plusieurs conditions. Il faut notamment qu’elles soient complètes et contextualisées. Elles doivent aussi être ouvertes sous un format standard (CSV, JSON, Shapefile, etc.). En effet, un potentiel réutilisateur peut se décourager s’il constate que l’exploitation d’un jeu de données risque d’être compliquée.
En outre, il est important d’offrir une certaine marge de manœuvre. Pour ce faire, il convient d’opter pour une licence de réutilisation permissive comme celle d’Etalab. Cette dernière autorise entre autres l’exploitation des données ouvertes à des fins commerciales. Les réutilisateurs ont ainsi la possibilité de créer de nouveaux modèles économiques.
Source image de couverture : Cherries/ Shutterstock.com