====== Types et formats de fichier ====== Le développement des Systèmes d'Information Géographique s'est accompagné du développement de formats informatiques spécifiques, aussi bien pour stocker les données, que pour les transformer ou encore les diffuser. Cet article décrit les principaux types de fichiers utilisés dans le cadre du traitement de données géolocalisées, notamment dans les logiciels de type SIG (ex. : QGIS, ESRI ArcGis) ==== Shapefile ==== Il s'agit du format de fichier historique du logiciel ArcGis. En réalité, il ne s'agit pas d'un seul fichier, mais de plusieurs fichiers, dans le même répertoire, ayant le même nom. Seule l'extension du fichier les distingue. ^ Extension ^ Description ^^ Obligatoire ? ^ | .shp | Shapefile | Fichier principal qui stocke la **géométrie** des objets | Oui | | .shx | Shapefile index file | Fichier d'index | Oui | | .dbf | Shapefile data file | Fichier qui stocke la table attributaire **(sémantique)**. Dans les faits, un fichier tabulaire au format dBASE, lisible dans un logiciel de type tableur. | Oui | | .prj | Shapefile projection file | Fichier qui stocke lees méta données du Système de Coordonnées de Référence utilisé pour le shapefile. Fichier pouvant être lu avec un éditeur de texte. | Non | | .xml | xml metadata | Méta données du jeu de données au format xml. | Non | | .sbn | Spatial index files | Permettent d'optimiser le traitement des requêtes spatiales | Non | | .sbx | ::: | ::: | ::: | | .cpg | Code page file | Fichier texte décrivant l'encodage utilisé pour créer le shapefile. Par défaut, l'encodage système. | Non | ==== Geodatabase ESRI ==== C'est le format de données développé par ESRi pour ArcGIS, utilisé par défaut par les versions actuelles de son logiciel. Il s'agit de bien plus qu'un fichier. Une geodatabase structure des données géographiques stockées dans un système de fichiers commun pour le gérer et l'interroger plus facilement. Une geodatabase permet de gérer à la fois des données au format vecteur et au format raster, chaque jeu de données étant stockée dans un fichier dédié/ Il existe trois types de Géodatabase, par niveau de complexité croissant : * //File geodatabase : //Un ensemble de jeux de données géographiques, ordonnés dans un répertoire commun. Prévue pour des usages personnels ou de petites structures * //Mobile geodatabase : //En plus de l'arborescence des fichiers de données, cette geodatabase inclut aussi une base de données relationnelle, implémentée dans un fichier SQLite3. * //Enterprise geodatabase : //La base de données est implémentée sur un serveur de bases de données d'entreprise. Dans une geodatabase, les données vectorielles mettent en œuvre de concept de //classe d'entités//. Il s'agit de la description d'un type de données géolocalisées précis, partageant le même sens et décrites avec la même structure de table attributaire. Chaque classe d'entité dispose : * de son Système de Coordonnées de Référence, * de sa forme : * de ses informations géométriques dans les colonnes //shape, shape_area, shape_length// Les principales formes gérées sont les suivantes : * points * lignes * polygones * annotations * multipoints : gestion de tous les points qui partagent certains attributs * multipatch (géométrie 3D) et objets 3D (textures) * sommets * segments droits ou courbes ==== Geopackage ==== Il s'agit d'un format de données ouvert, développé notamment par l'Open Geospatial Consortium. Il repose sur un fichier unique, avec l'extension //gkpg//. Ce fichier contient une ou plusieurs couches de données. Le format de ce fichier est une base de données SQLite3. Elle est consultable avec un client de base de données tel que SQLite Studio. On y retrouve entre autres les tables suivantes : ^ Nom de la table ^ Description ^ | gpkg_spatial_ref_sys | Contient la liste des SCR utilisés par une ou plusieurs couches du geopackage | | gpkg_contents | Contient la liste des couches contenues dans le geopackage. Une couche peut contenir des entités géométriques (type //features//) ou seulement des données tabulaires (type //attributes//). Chaque couche fait référence à un SCR de la table gpkg_spatial_ref_sys et a des coordonnées d'origine propres à ce SCR. | | gpkg_geometry_columns | Décrit pour chaque couche d'entité géographique le type de **géométrie** (points, lignes ou polygones), et le nom de la colonne qui décrit cette géométrie dans les tables spécifiques aux entités | | //nom_de_la_couche_1// | Table spécifique à une couche. Contient les données attributaires (**sémantique**) ainsi que la géométrie dans une colonne dédiée, renseignée dans gpkg_geometry_columns | | //nom_de_la_couche_2// | ::: | | //nom_de_la_couche_n// | ::: | ==== GeoTiff ==== Format de données développé dans les années 1990 sous l'impulsion de l'OGC FIXME /*Expliquer ce que c'est et placer le lien*/pour intégrer des métadonnées géographiques à un fichier image au format TIFF (Tagged Image File Format), qui était le format de stockage des images le plus mature à cette époque. Il permet de stocker des données au format raster. Les informations de géométrie du raster (SCR, résolution, coordonnées) sont stockées soit dans en-tête du fichier image, soit à par, dans un fichier dit //world file//. ==== GeoJPG ==== Comme le GeoTIFF, c'est une extension du format image original JPEG pour intégrer les métadonnées de géométrie du raster. ==== GeoJSON ==== Il s'agit d'un format ouvert, conçu pour stocker des données géographiques, dont les attributs sont stockés dans la notation JSON (JavaScript Oriented Notation). JSON est un format d'échange de données en texte lisible, utilisé pour représenter des structures de données et des objets simples. Il gère les formes élémentaires utilisées pour les données vectorielles (points, polylignes et polygones). Il permet également de gérer les entités multiparties. ==== Keyhole Markup Language (.kml, .kmz) ==== Ce format de fichier représente et stocke les données géographiques dans des fichiers au format XML. Développé à l'origine par Google pour être utilisé dans Google Earth, ce format a été reconnu comme un standard par Open Geographic Consortium en 2008. il est aujourd'hui exploitable dans la plupart des logiciels de SIG. Ses coordonnées sont toujours exprimées en degrés, dans le Système de coordonnées WGS84. ==== Sources ==== * [[https://www.ogc.org/standard/geotiff/|OGC GeoTiff Standard v1.1]] * [[https://www.ogc.org/standard/geopackage/|OGC GeoPackage Standard v1.3.1]] * [[https://www.esri.com/Library/Whitepapers/Pdfs/Shapefile.pdf|ESRI Shapefile Technical Description]] * [[https://pro.arcgis.com/en/pro-app/latest/help/data/geodatabases/overview/what-is-a-geodatabase-.htm|What is a geodatabase ?]] Dominique Le Gal, M1 2023 (modifié TJ)