Comment les IDS aident-elles à améliorer la compréhension des données grâce à la visualisation?
Les infrastructures de données spatiales (IDS) et l’interopérabilité des données permettent aux praticiens des SIG d’obtenir et d’utiliser facilement plusieurs ensembles de données provenant de nombreuses organisations. Il s’agit de savoir si ces ensembles de données sont utiles pour vos applications. Si plusieurs sources de données sont disponibles, laquelle le praticien devrait-il utiliser? La visualisation des données constitue une méthode rapide et fiable de valider des données inconnues. Lisez ce billet de blogue pour découvrir comment la visualisation des données peut être utilisée afin de comparer des ensembles de données SIG volumineux, complexes ou peu familiers.
Votre patron vous a remis plusieurs fichiers de données géospatiales volumineux et vous a demandé d’examiner les données afin de déterminer si elles peuvent être utilisées dans le cadre d’un futur projet de développement d’applications. Sans avoir établi de plan d’ensemble pour étudier les données, vous commenceriez probablement par les visualiser.
Lorsque vous analysez un fichier de données inconnues, pourquoi votre première réaction est-elle de l’examiner? Parce que les gens obtiennent plus de renseignements par la vision que par tous les autres sens réunis. De plus, en tant qu’humains, nous avons la capacité de mieux nous souvenir des images que des chiffres ou des phrases. C’est d’ailleurs pourquoi nous dressons des cartes et représentons les feuilles de calcul par des graphiques. La visualisation nous aide à comprendre des renseignements complexes.
Mais comment effectuez-vous cette visualisation? Commencez-vous par examiner les spécifications du format des données et les outils de flux de travaux d’ETL, ou simplement par charger les fichiers dans ArcGIS pour y jeter un œil? Vous souhaiterez fort probablement examiner les données dans ArcGIS Pro. L’un des grands avantages d’ArcGIS Pro est qu’il possède plusieurs couches de fond de carte intégrées qui peuvent être utilisées comme couches de référence pour comparer vos données.
De plus, vous serez sans doute porté à examiner les données visuellement parce qu’ArcGIS peut lire et afficher des données assorties et les intégrer dans une représentation commune. Si la lecture et la visualisation des données géospatiales se sont avérées difficiles ou longues, vous pourriez envisager de faire les choses différemment. Toutefois, ArcGIS est la solution par excellence pour charger différents formats et modèles de données qui permettent aux utilisateurs de comparer visuellement des ensembles de données dans un seul endroit en quelques minutes.
Voici un exemple de données de bâtiments ouverts (affichées en rouge) établies pour Régina, en Saskatchewan, et visualisées dans ArcGIS Pro. En effectuant une rapide inspection visuelle, vous pouvez constater un léger décalage constant entre l’emplacement des bâtiments et le fond de carte. De plus, certains bâtiments dans la couche de bâtiments ne sont pas dans la couche de fond de carte, et vice-versa. Enfin, quelques bâtiments ouverts présentent des formes différentes de celles du fond de carte.
Les IDS et l’amélioration de l’interopérabilité permettent aux utilisateurs d’intégrer, de visualiser et de comparer plusieurs couches de données provenant de sources multiples. Il est presque certain que deux couches de données issues de deux sources distinctes et de provenances complètement différentes présenteront de légères variantes. La meilleure façon d’effectuer l’inspection initiale des données consiste simplement à les visualiser et à les comparer dans ArcGIS. Même si cette inspection visuelle n’aide pas le praticien en SIG à comparer les attributs d’entité, elle lui donne une idée de la qualité spatiale des deux ensembles de données.
Voici un exemple de visualisation de quatre ensembles de données de réseaux routiers différents d’une région d’Ottawa, en Ontario. Les quatre réseaux routiers sont le Réseau routier national (RRN), le Fichier du réseau routier (FRR) de Statistique Canada, OpenStreetMap (OSM) et la couche du réseau routier municipal de GeoFoundation Exchange (GFX) d’Esri Canada. Une bonne partie des différences est attribuable à des normes de collecte différentes. Par exemple, des routes privées sont incluses dans certaines couches du réseau routier, et non dans d’autres. De plus, certains réseaux sont définis comme l’axe médian de la route, tandis que d’autres sont établis par des voies de circulation.
Pour conclure, la visualisation des données constitue un outil important, rapide et simple dont vous disposez dans votre boîte à outils afin de comparer des ensembles de données volumineux, complexes ou peu familiers. Même si vous n’acquérez pas une valeur d’évaluation quantitative en effectuant une inspection visuelle, vous obtiendrez une évaluation qualitative qui vous aidera à déterminer les prochaines étapes à suivre en ce qui concerne l’utilisation des ensembles de données pour vos applications.
Ce billet a été écrit en anglais par Gordon Plunkett et peut être consulté ici.