Open Data, le Big Data ouvert à tous...

Rédigé par Joseph MICACCIA - -
Open Data, la Big Data pour tous

Le Big Data est une gigantesque masse de données générée par les activités quotidiennes (emails, transactions bancaires, enregistrements vidéos, signaux GPS, téléphonie...) qui amplifie exponentiellement. Et dans le Big Data, il y a l'Open Data, une information publique brute, qui a vocation à être librement accessible et réutilisable. L’Open Data, c’est surtout une philosophie, une volonté citoyenne, de considérer l’information publique comme un bien commun. En Europe, la donnée ouverte (Open Data) est encadrée par des réglementations légiférées au Parlement européen depuis 2003. Les applications de l'Open Data sont illimitées...

 

L’obligation d’ouvrir les données publiques est entrée en vigueur avec la loi pour une République numérique en 2016. Cela signifie que les collectivités de plus de 3500 habitants et employant 50 équivalents temps plein doivent rendre accessible, de façon libre et gratuite les données produites ou reçues dans le cadre de leur mission de service public et rendre possible leur réutilisation.

 

Les dix principes qui caractérisent l'Open Data 
Complète Toutes les données publiques doivent être ouvertes, à l’exception de celles susceptibles de porter atteinte à la vie privée des individus ou à la sécurité du territoire.
Primaire (données brutes) Les données doivent être mises à disposition sans travail d’agrégation ou d’interprétation, dans leur forme première.
Opportune Les données doivent être à jour et publiées rapidement.
Accessible Les données doivent être accessibles à tous, pour tous les usages.
Exploitable Les données peuvent faire l’objet d’un traitement automatisé, informatique.
Non discriminatoire L’accès aux données ne doit pas faire l’objet d’un enregistrement préalable.
Non propriétaire Les données doivent être mises à disposition dans des formats non propriétaires (le format PDF, par exemple, qui reste la propriété d'Adobe, bien que l'utilisation soit libre).
Libre de droits Les données ne doivent pas être soumises à des droits d’auteur, ni couvertes par la propriété intellectuelle.
Permanente Les données doivent être mises à disposition de manière permanente.
Gratuite  

 

"La philosophie pratique des données ouvertes préconise une libre disponibilité pour tous et chacun, sans restriction de copyright, brevets ou d'autres mécanismes de contrôle" (eduscol.education.fr).

 

https://www.data.gouv.fr/fr/dashboard/

Le site du gouvernement dédié à l'Open Data (www.data.gouv.fr), propose des fichiers librement téléchargeables, parmi lesquels figurent, par exemple :

  • Répertoire des logements locatifs des bailleurs sociaux
  • Cadastre
  • Panorama des grands projets SI de l’État
  • Base Sirene des entreprises et de leurs établissements (SIREN, SIRET)
  • Plan Cadastral Informatisé (PCI)
  • Base Adresse Nationale
  • Liste Publique des Organismes de Formation (L.6351-7-1 du Code du Travail)
  • Découpage administratif communal français issu d'OpenStreetMap
  • Chiffres de l'Aide Publique au Développement (APD) 2015
  • Jurisprudence anonymisée de la Cour des comptes (2006-2008 et 2010-2015)
  • Base officielle des codes postaux

 

https://www.data.gouv.fr/fr/datasets/

 

Les fichiers sont dans des formats exploitables par tous (format CSV avec Excel par exemple). De ce fait il n'est pas indispensable d'être informaticien pour les utiliser, même si l'intégration de ces fichiers dans des bases de données pourront favoriser une exploitation optimale de ce gros paquet d'informations.

L'Open Data ne se limite pas à la France, ou à l'Europe. Le site OpenDataSoft.fr affiche les portails Open Data de tous les pays.

 

https://opendatainception.io/

 

Et tout le monde s'y met... la Sécu, la BNF, la région PACA (particulièrement bien fait, avec moteur de recherche)...

http://opendata.regionpaca.fr/donnees.html?no_cache=1

http://opendata.regionpaca.fr/donnees.html?no_cache=1

 

Voici quelques exemples d'exploitation de l'Open Data :

  • "VroomVroom.fr" est un comparateur d'auto-écoles qui utilise les données issues du taux de réussite.
  • "Tranquilien" est une application qui permet de prédire le taux d'occupation des rames en Ile-d-France.
  • "Sharette" propose un trajet personnalisé grâce aux informations issues de l'Open Data de la SNCF et de la RATP.
  • "Kel Quartier" dresse le portrait-robot des habitants de chaque quartier de France métropolitaine.
  • "Mapbox" est spécialement dédiée à la cartographie.
  • "OpenGov" est dédié aux gouvernements.
  • "Continuum Analytics" est une startup qui développe Anaconda, pour la science des données ouvertes.
  • "Enigma" permet la gestion de données d’exploitation.
  • "FiscalNote" propose de faire des prédictions législatives.
  • "DueDil" regroupe des informations sur les entreprises privées.
  • "Planet OS" est orientée vers les entreprises d’énergie renouvelable.
  • "Cityzenith" exploite l'Open Data pour les "Smart Cities".

 

https://www.lebigdata.fr/

 

Sources :

 

 

 

 

Les commentaires sont fermés.