Comment préparer vos données pour des résultats de projet fiables
Avez-vous confiance dans la qualité de vos données? Si la réponse est « ouin », vous devriez peut-être pousser plus loin leur préparation avant votre prochain projet. Je comprends qu’il puisse être difficile de résister à l’impulsion de se lancer corps et âme dans un nouveau projet qu’on attend depuis longtemps, mais une bonne préparation peut s’avérer très rentable au bout du compte. Lisez la suite pour un rappel des étapes de base de la préparation des données que vous devriez effectuer par défaut. Je vous parlerai également d’un tout nouveau cours qui pourrait vous aider à mieux vérifier si vos données répondent aux normes et aux besoins de votre projet et de votre organisation.
La préparation des données est la clé du succès de tout projet SIG. Le processus de préparation peut demander très peu d’efforts ou des examens approfondis; cela dépend de l’état actuel des données, de votre connaissance de celles-ci et des exigences du projet.
Au minimum, la source des données doit être validée. Si vous avez créé vos données, vous savez avec quoi vous travaillez, mais si vous utilisez des sources externes ou des données collectées par un tiers, vous devez être prudent et effectuer des examens appropriés pour vous assurer qu’elles répondent à vos normes.
Si un ensemble de données est bien documenté, ses métadonnées devraient fournir les détails dont vous avez besoin pour valider sa fiabilité. Assurez-vous de prendre le temps d’examiner ce qui est inclus et décidez si vous êtes satisfait de ce que vous voyez. En outre, si les renseignements fournis par les métadonnées sont limités, je vous suggère de soumettre l’ensemble de données aux étapes de validation supplémentaires que je présente plus loin dans ce billet.
Une fois que vous savez d’où provient l’ensemble de données, quand il a été créé et, idéalement, quel type de méthodologie a été utilisé pour l’obtenir, vous pouvez décider s’il vous convient ou non. Mais ce n’est qu’un début.
Ensuite, vous devrez commencer à modifier les données en fonction de vos propres besoins. Voici quelques étapes qui font généralement partie de ce processus :
- Inspectez visuellement les données pour détecter toute irrégularité (géométrie et attributs) et apportez les corrections nécessaires.
- Alignez vos données sur celles d’autres sources afin que de vérifier que tout est à sa place. Il peut s’agir d’une validation visuelle.
- Sélectionnez et découpez (un peu comme on le ferait pour une forme dans du papier avec des ciseaux) les données pour ne garder que la zone dont vous avez besoin pour votre projet. De nombreux ensembles de données couvrent toute une province ou même le pays. Si vous vous concentrez sur une ville, pourquoi ralentir votre processus en utilisant tout l’ensemble des données?
- Supprimez les renseignements indésirables contenus dans la table d’attributs de l’ensemble de données.
- Créez de nouveaux enregistrements ou calculez de nouveaux champs pour ajouter de précieux détails à votre projet.
- Nettoyez la table d’attributs en supprimant les champs vides, en trouvant et en corrigeant les fautes de frappe, en supprimant les caractères indésirables, en éliminant les doublons, etc.
- Enregistrez ce nouveau sous-ensemble de données en tant que nouvelle couche sur laquelle vous travaillerez et conservez-en une copie supplémentaire, au cas où.
- N’oubliez pas de créer vos propres métadonnées détaillées pour cette nouvelle couche!
À ce stade, vous disposez des données dont vous avez vraiment besoin. Cependant, l’ensemble de données n’est peut-être pas encore parfait. Il serait préférable d’aller plus loin et de vous poser les questions suivantes :
- L’ensemble de données est-il conforme aux normes statistiques?
- Est-il complet?
- Est-il logiquement cohérent?
- Qu’en est-il de sa précision de localisation?
- Son évolution au fil du temps est-elle logique?
- Si vous travaillez avec des données matricielles, la classification d’origine correspond-elle aux besoins de votre projet?
Si vous ne savez pas comment répondre à une ou plusieurs de ces questions, vous pourriez être intéressé par un nouveau cours magistral que nous offrons pour vous guider dans ce processus, en utilisant de nombreux outils ArcGIS Pro.
Préparation des données pour les applications SIG
Je sais que ce travail peut sembler fastidieux, mais une fois vos données validées, vous pourrez être sûr que les résultats de votre projet seront dignes de confiance. En apprenant le processus, vous serez en mesure de l’appliquer à de nombreux autres ensembles de données à l’avenir.
Pour terminer, j’aimerais souligner que d’autres pourraient vouloir utiliser vos données en cours de route, surtout si vous les rendez accessibles sur un portail SIG web. Assurez-vous de mentionner tout renseignement utile dans vos métadonnées afin que la prochaine personne qui utilisera votre ensemble de données puisse gagner du temps et faire confiance à votre travail.
Ce billet a été écrit en anglais par Carole Arseneau et peut être consulté ici.