Bandeau haut

Outils pour utilisateurs

Outils du site


geoweb:donnees

Les données

Les formats de données

On distingue les données dites attributaires, qui portent les attributs, les caractéristiques non spatiales des objets ou entités : un nom, une qualité, une quantité et les données spatiales ou géographiques qui décrivent la géométrie des objets, leur forme et leur localisation.

Les données sont accessibles sous forme de fichiers, qu'il est possible de télécharger et de modifier, avant de les mettre en ligne. De plus en plus, elles sont disponibles sous formes de Services Web géographiques qui permettent l'échange de données entre deux applications.

Données attributaires

Elles sont le plus souvent rassemblées dans des tables, composées de lignes et de colonne. A chaque entité géographique correspond une ligne dans la table et les différents attributs (les propriétés des objets) se trouvant en colonne. Ces tables peuvent correspondre du point de vue informatique à des fichiers de formats très variables, qu'il est possible d'ouvrir avec des tableurs comme Excel ou OpenOffice Calc.

Les formats des données attributaires les plus courants sont :

Les formats plus récents apparentés au XML http://fr.wikipedia.org/wiki/XML comme KML/KMZ ou Geojason stockent les attributs et les descriptifs géométriques dans les mêmes fichiers.

Quand les données géographiques sont ponctuelles et que les coordonnées géographiques sont réduites à une paire (x,y), x pour la longitude et y pour la latitude, il arrive que les formats attributaires CSV ou Excel soient utilisés pour stocker ces coordonnées dans deux colonnes.

Problèmes liés aux formats (encodage)

Ces données attributaires de type alphanumérique posent souvent des problèmes d'encodage, liés à la manière dont les caractère d'une langue, par exemple les caractères accentués et les cédilles du français, sont traduits dans le fichier (voir ci-dessous). Pour le français, les deux encodages classiques sont UTF8 qui peut représenter un très grand nombre de caractères de différentes langues ou ISO-8859-1 (également connu comme latin1) qui est spécifique aux langues latines.

Le signe d'un problème d'encodage est que ces caractères sont remplacés par des signes cabalistiques. Il se produit dans le transfert d'un fichier d'une application à l'autre. Il faut alors tenter d'exporter le fichier de la première application dans un encodage que peut lire la deuxième. Cela peut se faire dans les tableurs, en choisissant bien les paramètres à l'import et à l'export ou en utilisant des utilitaires spécialisés dans la gestion ses formats de données

Données géographiques

Fichiers de données

Il existe de nombreux formats de fichiers de données géographiques mais les plus courants sur le Géoweb sont les trois suivants :

Services de données géographiques

Avec le développement d'Internet, l'échange de données se fait de moins en moins sous forme de fichiers et de plus en plus sous forme de services web qui permettent d'échanger des données à travers des serveurs. Il existe de nombreux formats de services Web liés aux données. Les plus courants sont :

Autres formats

Sources de données libres

Fichiers du cours

geoweb/donnees.txt · Dernière modification : //12/11/2014 17:31// de joliveau

Bandeau bas