Les données structurées au format CSV

Numérique et sciences informatiques

donnees

Un fichier CSV (pour comma separated values, soit en français valeurs séparées par des virgules) est un type de fichier texte utilisé pour stocker des données tabulaires sous forme de valeurs séparées par des virgules. Chaque ligne du fichier CSV représente un enregistrement de données, et chaque colonne représente un attribut de données différent. Les données dans un fichier CSV sont souvent structurées de manière à ce qu'elles puissent être facilement importées et exportées à partir de différentes applications et systèmes informatiques.

dep,nom,cp,nb_hab_2010,nb_hab_1999,nb_hab_2012,dens,surf,long,lat,alt_min,alt_max
13,Marseille,13001-13002-13003-13004-13005-13006-13007-13008-13009-13010-13011-13012-13013-13014-13015-13016,850726,797491,851400,3535,240.62,5.37639,43.2967,0,640
60,Beauvais,60155,54711,55371,55000,1642,33.31,2.08333,49.4333,57,170
75,Paris,75001-75002-75003-75004-75005-75006-75007-75008-75009-75010-75011-75012-75013-75014-75015-75016-75017-75018-75019-75020-75116,2243833,2125851,2211000,21288,105.4,2.34445,48.86,27,1271,Ozan,1190,618,469,500,93,6.6,4.91667,46.3833,170,205
86,Poitiers,86000,87697,83507,89300,2082,42.11,0.333333,46.5833,65,144

Dans ce format, chaque ligne représente un enregistrement c'est à dire une structure de données, de types éventuellement différent auxquelles on accède grâce à un nom et, sur une même ligne, les différents champs de l’enregistrement sont réparés par une virgule (d’où le nom).

Le format CSV est un moyen simple et pratique de stocker des données structurées sous forme de tableaux dans un tableur (Google Sheets · LibreOffice Calc · Microsoft Excel), et il peut être utilisé pour stocker une grande variété de types de données.

Entraînement :

Ouvrez le fichier ville_point_virgule.csv à l'aide d'un tableur. En cas de problème avec votre tableur, voici une version "séparateur virgule" : ville_virgule.csv (attention le séparateur "décimal" est ici le point)

Nous avons 12 colonnes (et 36700 lignes si on ne compte pas l'entête !), voici la signification de ces colonnes :

  • dep : numéro de département
  • nom : nom de la commune
  • cp : code postal
  • nb_hab_2010 : nombre d'habitants en 2010
  • nb_hab_1999 : nombre d'habitants en 1999
  • nb_hab_2012 : nombre d'habitants en 2012 (approximatif)
  • dens : densité de la population (habitants par kilomètre carré)
  • surf : superficie de la commune en kilomètre carré
  • long : longitude
  • lat : latitude
  • alt_min : altitude minimale de la commune (il manque des données pour certains territoires d'outre-mer)
  • alt_max : altitude maximale de la commune (il manque des données pour certains territoires d'outre-mer)

A partir du fichier, déterminez la population des Abymes et de votre commune en 2012.