Vous êtes ici :

Les grands enjeux de l'Open Data

Interview de Simon CHIGNARD

Etalab

<< Nous sommes encore très loin d'une appropriation des données par le grand -- public. >>.

Date : 12/12/2012

Entretien réalisé par Brice Dury, le 12 décembre 2012

Auteur de l’ouvrage Open data, comprendre l’ouverture des données publiques (FYP éditions, 2012), diplômé de Télécom École de Management, Simon Chignard a participé à l’animation de l’ouverture des données publiques de Rennes Métropole. Consultant et formateur indépendant, il est vice-président de la Cantine numérique rennaise.

Pouvez-vous raconter brièvement votre parcours et ce qui vous a amené à vous intéresser à l’open data ?

Ce qui m’a amené à l’ouverture des données, c’est que j’ai participé à titre bénévole à la création de La Cantine Rennaise (un lieu collaboratif autour du numérique NDLR). À l’époque j’étais directeur marketing dans une entreprise qui fait des systèmes embarqués pour les transports. La création de La Cantine à Rennes correspondait à peu près au moment où Rennes s’est lancée dans l’ouverture des données publiques. L’une des premières missions que s’est donnée La Cantine a été d’organiser un certain nombre d’animations autour du premier concours d’applications lancé par Rennes Métropole dans le cadre de sa politique d’ouverture des données, fin 2010. Ensuite j’ai fait partie du jury du concours, puis j’ai eu l’occasion d’intervenir sur le sujet de l’open data dans de nombreuses régions de France, ce qui m’a permis d’avoir une bonne vision des différentes stratégies territoriales et de mettre en perspective l’expérience Rennaise. Cela m’a donné l’envie d’écrire un livre sur ce sujet de l’open data.

Qu’est-ce qui a poussé Rennes à se lancer dans l’open data ?

Il y a eu conjonction de plusieurs facteurs. Il y a toujours eu à Rennes la capacité à tester des choses, un « droit à l’expérimentation » assez fort qui fait qu’on a pu essayer des choses, dont certaines ont marché et d’autres non, sans pour autant que leurs auteurs soient devenus persona non grata. À Rennes on sait se dire « pourquoi-pas ? », et l’acceptation de l’échec participe beaucoup, je pense, à la capacité d’innovation.Les débuts de la politique d’ouverture des données à Rennes correspondent aussi au moment de la fusion des services de communication de la ville et de la métropole, et l’open data est alors l’occasion de créer une dynamique d’innovation suite à cette mutualisation.Enfin, dernier facteur, on a un acteur qui est Kéolis Rennes, qui vient de récupérer la délégation de service public sur Le Vélo STAR, le système de vélos en libre-service. Et à ce moment donné, il y a quelqu’un qui a proposé sur l’App Store (la plateforme de téléchargement d’applications d’Apple NDLR) une application payante qui permettait de localiser les vélos, en récupérant les données sur le site web du Vélo STAR. Et c’est là que s’est posée la question, de la même manière d’ailleurs qu’à Paris et à Lyon. À Rennes, plutôt que de poursuivre le développeur, on a dit « pourquoi-pas ? », et très vite la ville et Kéolis Rennes ont décidé d’ouvrir les données sur les vélos en libre-service. En quelques semaines il y a une demi-douzaine d’applications qui sont sorties ! Cette première expérience a été importante car elle a bien marché et elle a rassuré en montrant que ça n’était pas risqué. Peu de temps après, Rennes annonce qu’elle se lance dans l’open data, commence à être médiatisée, et les élus se disent alors que ça peut être une démarche porteuse…

En quelques mots, comment expliqueriez-vous l’open data à un néophyte ?

L’open data est un mouvement qui consiste à mettre des données en ligne, de manière à en faciliter la réutilisation. On parle de données « ouvertes » quand elles répondent à un certain nombre de critères techniques. En Français on a cependant une difficulté pour traduire le terme open data, car il y a trois manières de le comprendre. On peut d’abord le traduire par « les données ouvertes », c’est à dire une caractéristique des données. C’est ensuite le terme qui désigne plus largement la dynamique : le mouvement d’ouverture des données. Enfin, en anglais une injonction : « ouvrez vos données ! ».

D’où vient selon vous le mouvement d’ouverture des données ? 

Je pense que le mouvement de l’open data en France est un copié-collé du concept anglo-saxon. Aux Etats-Unis il a toujours eu l’idée que « ouvert » c’est  mieux que « fermé », tant dans l’ouverture des  marchés, des politiques, que des technologies. Et à un moment donné il y a un certain nombre de gens qui ont considéré qu’un gouvernement ouvert est plus efficace qu’un gouvernement fermé, et qu’un gouvernement ouvert c’est entre autre un gouvernement qui ouvre ses données. Ça a donc un lien avec le web 2.0, un web plus participatif dans lequel on n’a plus un producteur et un consommateur, mais deux acteurs. Tim O’Reilly dit bien cela quand il dit que dans un open government, le citoyen n’est pas un administré mais une partie prenante du système. En France, contrairement aux Etats-Unis, le mouvement s’est beaucoup focalisé autour de l’open data et beaucoup moins autour de l’open government. Les gens qui s’y sont intéressés sont des gens issus de l’informatique, et non de la chose publique, ce qui fait qu’on a plutôt vu ça comme un objet technique que comme un objet politique.

À la lecture de votre livre et des différentes contributions sur le sujet que l’on peut trouver sur internet, on constate qu’après une phase de   promotion tous azimuts » de l’open data, on entre aujourd’hui dans une phase où l’enjeu n’est plus seulement la mise à disposition des données, mais également l’invention des méthodologies qui permettront que cette diffusion des données produise effectivement des analyses et des services utiles à la société. Quels sont aujourd’hui les grandes questions et les grands enjeux du mouvement open data ?

On est a un moment où il y a deux choses en parallèle : d’une part on est encore loin d’avoir toutes les données en ligne, et d’autre part il faut se poser la question de l’utilisation de ce qui est mis en ligne. Il y a un vrai problème d’offre, avec des territoires où ce n’est pas du tout ouvert, et même dans les territoires où c’est ouvert, on est encore très loin d’avoir fait le tour de l’offre disponible en matière de données. Parallèlement, l’autre question qui se pose est de savoir comment faire pour que les gens s’approprient ce qui est déjà en ligne. On l’a dit, en France ce sont surtout des personnes issues de l’informatique qui se sont investies dans l’open data. La plupart des acteurs et des médiateurs traditionnels de l’information ne se sont pas ou très peu saisis du sujet : les journalistes, les associations de quartier, les associations militantes, les acteurs de la concertation, les entreprises, etc.

Vous proposez dans votre livre un « guide du réutilisateur débutant »… Que pourrait-on imaginer pour que des « non-technophiles » puissent utiliser ces données et participer à la création de  services ?

Pour commencer, ce qu’il faut c’est une ambition politique derrière l’open data. La première chose pour animer la diffusion des données est de savoir ce qu’on en attend. Il existe trois grands types d’objectifs de l’ouverture des données : la transparence, qui consiste à dire ce que l’on fait en mettant en ligne les données de l’action publique ; la participation, qui vise à faire réagir, à faire intervenir les citoyens sur des sujets ; la création de services.

Pour amener un public plus large à s’approprier les données, il faut éviter de lui parler d’ open data. Le terme est porteur de trop de choses différentes et c’est un terme en anglais. Et même en français, « ouverture des données » : qu’est-ce que c’est qu’une donnée ? Qu’est-ce que c’est qu’ouvrir ? Et une fois qu’on est d’accord sur les définitions il reste une médiation qui est celle de l’informatique, qui reste une vraie problématique. On est donc vraiment loin d’une appropriation par le grand public. Ce qui fonctionne assez bien, c’est l’approche thématique. On dit aux gens « venez, on va parler de tel ou tel sujet ». Par exemple à Rennes on organise des ateliers de sensibilisation à la culture de la donnée et on a fait un atelier sur le Jardin du Thabor. Déjà, il n’y a pas d’ordinateur, on travaille à partir d’une photo aérienne du parc imprimée. Les gens tracent leurs parcours dans le parc, puis en croisant on fait apparaître les points d’intérêts (jeux pour enfants, sculptures, roseraie, arbres remarquables…). On explique ensuite qu’à ces points d’intérêts qu’on a définis correspondent des données : par exemple un jeu pour enfant, situé à tel endroit, accessible pour les 3 à 6 ans, avec tant de places. Puis on leur montre sur le portail open data que ça correspond à un jeu de données qui a été ouvert. Cela permet, à partir d’un cas concret, de comprendre ce qu’est une donnée, comment elle est collectée, à quoi elle pourrait servir, etc.

On comprend bien la fonction pédagogique de ces ateliers. Il s’agit là de faire comprendre à des gens l’intérêt qu’ils peuvent trouver dans les usages de ces données. Mais comment aller plus loin, amener des gens qui pourraient avoir un intérêt à utiliser ces données – des journalistes, des sociologues, des entreprises – à s’en emparer ?

Il y a deux pistes. La première serait de ramener de la « culture data » dans toutes ces organisations. La Fing travaille sur un programme d’Infolabs dans lequel des structures existantes se doteraient d’une compétence d’accompagnement à l’utilisation des données. Par exemple, une association pourrait être guidée, sur le sujet qui l’intéresse, pour trouver les données qui la concernent, les outils existants, les bonnes questions à se poser… La deuxième piste serait de former à ces métiers, d’intégrer cette approche dans certains cursus, comme par exemple dans les écoles de journalisme. Et cela permettrait d’ailleurs de pouvoir porter un regard critique sur ces données. Les informaticiens sont dans le mythe de la « donnée brute », mais d’autres approches permettraient sans doute d’avoir un regard critique sur la manière dont les données sont produites ou diffusées.

On le voit aujourd’hui, un nombre croissant de collectivités s’engagent sur cette voie de l’open data. Quel rôle les collectivités peuvent-elles, doivent-elles jouer dans ce mouvement de l’open data, au-delà de la simple mise à disposition de leurs données ?

Pour la collectivité, l’open data est éminemment un projet d’interface entre l’interne et l’externe. Le chef de projet open data ou la personne en charge de ce sujet doit en interne convaincre les agents et les collègues des services de « donner » des données, et en externe faire l’interface avec les réutilisateurs, composer avec leurs attentes et leurs besoins.

Le rôle de la collectivité dans l’ouverture des données est étroitement lié à son rapport à l’innovation ouverte. La manière d’ouvrir les données détermine clairement la dynamique de réutilisation qu’on aura derrière. Hormis les données de mobilité, personne ne s’empare spontanément des données. Il faut donc jouer un rôle de stimulation sur le territoire : ce sont des concours, des hackatons (événements où des développeurs se réunissent pour faire de la programmation informatique collaborative NDLR), des ateliers, des infolabs (des lieux de médiation sur les données NDLR), etc 1.

Il y a un autre enjeu, c’est celui de la durabilité. C’est aussi le rôle de la collectivité de mettre en valeur les utilisations qui ont été faites des données. On peut par exemple créer un système de labellisation, qui permette à la collectivité de mettre en valeur des applications mobiles qui correspondent au bien public et répondent à certains critères, de créer un site ou une page qui les recense. La collectivité peut donc estimer que cela fait partie de ses missions que de mettre en lumière certaines applications issues des réutilisateurs.

On en vient donc au lien entre open data et politiques publiques. Comment la collectivité peut-elle mettre en cohérence les utilisations qui seront faites de ses données avec ses objectifs de politiques publiques ? Dans une interview récente2 , le coordinateur des programmes de gestion de trafic du Grand Lyon insiste sur le risque de voir se développer des applications qui iraient contre l’intérêt général…

Cette interview est intéressante, mais ce qui est étonnant c’est qu’à aucun moment il n’est envisagé que l’open data puisse être porteur d’innovations que le Grand Lyon n’ait pas imaginées. L’idée d’une innovation ouverte positive est complètement absente du propos. C’est vrai que le risque de voir se créer des applications contre-productives, comme par exemple autour de la circulation routière dans la ville est une vraie question, mais moi je suis convaincu qu’aujourd’hui ouvrir les données c’est le meilleur moyen d’en contrôler l’usage.Il y a beaucoup de moyens pour la collectivité, à tous les niveaux, de raccrocher les utilisations des données à ses objectifs de politiques publiques. Il y a les systèmes de labellisation que nous venons d’évoquer mais pas seulement. Prenons par exemple la petite enfance, imaginons qu’une collectivité se positionne sur ce sujet et souhaite innover. Elle commence par identifier l’ensemble des jeux de données pertinents sur ce sujet. Ensuite on l’a dit, sans animation il n’y a pas de réutilisations, il faut donc des actions de stimulation. Rien n’empêche la collectivité, dans ces actions de stimulation, de commencer à expliquer ses objectifs de politique publique. Elle pourra par exemple organiser un concours de création de services pour lequel elle dira que ce qu’elle souhaite, c’est encourager des services qui vont promouvoir et faciliter le recours à l’accueil collectif des enfants… À un autre niveau, la collectivité peut aussi vérifier les usages qui sont faits de ses données. Les données sont diffusées par un « tuyau », les API (Application Programming Interface, un interface de programmation NDLR) ; rien n’empêche la collectivité de dire qu’elle coupe le tuyau si le réutilisateur en fait un usage qui n’est pas conforme à ses objectifs de politiques publiques. Par exemple à Londres Transport for London s’est réservé le droit, à travers les clauses d’utilisation de ses données, d’en stopper la diffusion pour les usages de nature à dénigrer le service.

C’est parce que la collectivité dispose de tous ces moyens que je ne suis pas d’accord avec le fait de ne pas ouvrir ses données au prétexte de la crainte du mésusage. Quand je dis qu’ouvrir les données c’est mieux contrôler leur usage, c’est que je pense aussi que la posture de vouloir tout fermer et tout contrôler n’est pas durable. En Belgique, vous avez une super plateforme qui vous donne tous les horaires de la SNCB, l’équivalent de la SNCF, alors qu’elle n’a jamais ouvert ses données… Cette plateforme a été créée par des développeurs qui ont conçu un système très bien fait, qui récupère et diffuse toutes les données horaires… Avec la TaM, l’opérateur de transports en commun de Montpellier, c’est la même chose, des développeurs ont créé la plateforme API Tam, qui offre précisément l’accès aux données que la TaM ne veut pas donner. Et là, l’incertitude juridique est maximale pour tous les acteurs.

Lorsqu’on parle des utilisations possibles des données ouvertes, on parle souvent d’innovation de service, de la création d’applications web ou mobiles. Or on le dit de plus en plus, pour passer de l’invention à l’innovation il faut intégrer la question des usages, la manière dont l’usager va percevoir et s’approprier le service… Comment intégrer cette dimension « usager » dans les processus de développement de l’open data ?

L’expérience montre que la force d’un certain nombre d’applications qui ont été créés lors de concours, c’est de répondre à des besoins spécifiques au territoire concerné. La motivation des développeurs à participer à ces concours est souvent une question de proximité et d’appropriation territoriale. Et parmi eux un certain nombre a conçu des outils « qu’ils auraient aimé avoir » et ça change un peu la donne. Dans le concours à Rennes aucune des grosses sociétés qui développent des applications mobiles d’information aux voyageurs n’a participé, et on a pourtant eu pas mal d’idées d’usages vraiment intéressantes.

Il y a cependant une limite à ça, c’est que certains usages ne sont pas traités. Par exemple beaucoup d’applications de mobilité sont pensées pour les usagers réguliers, et peu pour les usagers occasionnels. Je crois vraiment à l’idée de faire travailler les développeurs, les chercheurs, sur des problématiques identifiées. Prenons un exemple : on pourrait récupérer l’ensemble des statistiques détaillées de fréquentation des piscines de la ville, à partir du système de billetterie, qu’on diffuserait avec d’autres jeux de données comme la météo, les jours travaillés, etc. Et on organiserait à partir de ça un concours sur ce qu’on arrive à raconter sur ces fréquentations. Je suis sûr qu’on apprendrait plein de choses. Aux Etats-Unis, il y a un dispositif vraiment intéressant qui est le site challenge.gov. Il propose des appels à projets sur toutes sortes de sujets. Le dernier exemple en date c’est un concours organisé autour d’une problématique « santé et nutrition des adolescents ». Le site organise un concours qui récompense celui qui, à partir des jeux de données diffusés, crée la meilleure application.

On parle de plus en plus de la « ville servicielle »… Quelles pourraient être les conséquences concrètes de l’ouverture des données sur les manières de vivre l’espace public dans la ville ?

Il y a un exemple intéressant à New York. Comme dans la plupart des grandes villes américaines il y a un service téléphonique, le 311, que l’on peut appeler 24h/24 dans plusieurs langues. On peut appeler pour signaler un problème (une coupure d’électricité, des poubelles non ramassées), pour poser une question (comment inscrire un enfant à la crèche…). Bref, c’est le call center de la ville. Chacun des appels est géolocalisé et qualifié, et le fichier d’appels est mis en ligne en temps réel sur la plateforme open data de la ville. Cela permet que des réutilisateurs tiers se saisissent de ces données, puissent travailler à une vraie vision de ce qui est en train de se passer dans la ville, et de reboucler ensuite en revenant vers les services de la ville pour livrer leur analyse ou leurs idées. La ville est un système, qui fonctionne comme une boucle grâce à cette « voie de retour ».

En fonctionnant ainsi, on est à l’antithèse de la manière dont la ville intelligente est aujourd’hui en train de se penser. C’est pour cela qu’il vaut mieux parler de ville servicielle que de ville intelligente, car précisément la ville intelligente telle qu’on nous la présente est l’antithèse de l’open data. L’image de la ville intelligente telle que les grands groupes sont en train de la dessiner, c’est « la tour de contrôle ». La ville de l’open data, c’est une ville dans lequel il y a de la participation. La question c’est de savoir à quel moment j’estime que l’habitant de la ville n’est pas qu’un usager, mais qu’il est partie prenante du service public. Et pour cela, l’open data peut être un vrai levier.

L'open data est finalement un phénomène assez nouveau en France. Si on se projette, comment voyez-vous ce mouvement à 10 ou 20 ans ?

On me demande souvent si c’est une mode, ou même quand ça va passer… Je ne sais pas trop dire si on en parlera plus ou moins que maintenant, mais ce dont je suis convaincu c’est que la notion d’ouverture des systèmes et des organisations est là pour durer. On va de plus en plus vers des systèmes interconnectés, et on va de plus en plus vers des systèmes dans lesquels une partie des choses seront faites par des tiers. Un bon exemple, qui n’est pas du tout de l’open data, c’est Amazon. Une grande partie du succès d’Amazon, c’est d’avoir ouvert une partie de son système d’information. C’est à dire que je peux acheter des livres vendus par Amazon sur de nombreux autres sites que celui d’Amazon : ils ont donné des outils à des tiers pour le faire facilement. À mon avis demain les systèmes ouverts vont se diffuser de plus en plus. Cela ne veut pas dire que tout le monde fera tout, mais par exemple la collectivité trouvera de plus en plus un intérêt à ouvrir ses systèmes d’information, à se dire que sur tel ou tel domaine ça pourrait être intéressant de commencer à les ouvrir.

1-Simon Chignard propose, dans un billet du site compagnon de son ouvrage, une grille d’analyse de l’animation de l’open data

2-Jean COLDEFY