Comment exploiter la puissance de l’informatique répartie de GeoAnalytics Server?
Devez-vous régulièrement traiter une grande quantité de données? Souhaitez-vous que leur traitement soit plus rapide? À partir d’ArcGIS 10.5, vous pouvez analyser les entités au moyen de l’informatique répartie avec les outils d’ArcGIS GeoAnalytics Server. Les analyses qui prenaient des minutes ou des heures à effectuer le sont maintenant en quelques secondes. À l’aide d’un scénario de crime, ce blogue démontre comment exploiter la puissance d’ArcGIS GeoAnalytics Server pour analyser les données massives.
Lorsque j’ai entendu le terme « données massives » pour la première fois, je ne savais pas de quoi il s’agissait. Qu’entend-on par « données massives »? J’ai ensuite été en contact avec les jeux de données volumineux et j’ai mieux compris. Les données massives n’ont pas forcément besoin de contenir des milliards de points, de lignes ou de polygones; il s’agit simplement d’un jeu de données volumineux qui est difficile, voire impossible, à analyser avec des outils de traitement de données traditionnels.
Dans ArcGIS 10.5, nous avons lancé ArcGIS GeoAnalytics Server. Vous pouvez maintenant exploiter la puissance de l’informatique répartie de différents postes et cœurs afin d’analyser les données massives par l’entremise d’ArcGIS Pro et de Portal for ArcGIS. Dans ce blogue, nous parcourrons un scénario où nous détectons des tendances de près d’un demi-million de points de crime en les regroupant par compartiments hexagonaux. Pour expliquer la différence, j’effectuerai la même analyse en suivant deux méthodes : un flux de travaux de Model Builder traditionnel et un outil de géoanalyse. Nous comparerons ensuite les résultats et la rapidité des deux méthodes. Les deux flux de travaux seront exécutés dans ArcGIS Pro. Puisqu’il s’agit d’un jeu de données volumineux et qu’ArcGIS Pro est directement connecté à Portal for ArcGIS, mon analyse fera appel aux données du nuage.
Aux fins de cette analyse, prenons la Ville de Vancouver en exemple. Nous avons téléchargé le jeu de données sur la criminalité du catalogue de données ouvertes de la Ville de Vancouver, qui contient les données pertinentes de 2003 à 2016. Nous aimerions comprendre ces données et déterminer les régions géographiques où le taux de criminalité est le plus élevé. Étant donné que la couche comprend près d’un demi-million de points, le fait de l’appliquer sur une carte ne nous révélera rien.
Points de crime à Vancouver de 2003 à 2016
Une façon de déceler les tendances de la criminalité est de regrouper les points de crime en polygones et de chercher des grappes de points. Pour ceux d’entre vous qui connaissent l’environnement ArcGIS for Desktop, nous avons effectué cette analyse localement avec un modèle comme l’image ci-dessous. Grâce à l’outil Générer une tessellation, le modèle crée des compartiments hexagonaux de 500 m en fonction des limites de la Ville. Il présente ensuite un résumé des points de crime dans ces compartiments, crée une couche d’entités, applique la symbologie prédéterminée, regroupe les résultats et publie ceux-ci sur Portal for ArcGIS.
Un exemple d’une analyse de la criminalité à l’aide de Model Builder
J’ai exécuté moi-même le modèle. Ce que j’ai mis en surbrillance correspond à la durée de l’exécution de l’outil Synthétiser à l’intérieur, qui regroupe les points de crime en compartiments hexagonaux déjà générés. Il s’agit de la plus grosse partie de l’analyse, qui a pris 25 minutes. L’image 2 ci-dessous est le résultat, qui n’est pas si mal pour un processus ayant pris 25 minutes.
Traitement du modèle
Résultat du modèle
La différence que peut apporter GeoAnalytics Server
Effectuons maintenant la même analyse, mais avec un outil de géoanalyse, Regroupement de points. Cet outil gère tous les outils dont nous nous servons dans le modèle et vous permet d’utiliser votre propre couche de polygone pour le processus de regroupement. Sinon, vous pouvez regrouper les points en fonction de deux types de compartiments; hexagones ou carrés. Cependant, contrairement à l’outil Générer une tessellation, cet outil n’a pas besoin des limites de la Ville pour générer les compartiments hexagonaux correspondants : il génère plutôt des compartiments hexagonaux à tous les endroits où il y a des points.
Un autre avantage de cet outil est qu’il exploite la puissance de l’informatique répartie de GeoAnalytics Server. Depuis l’image, vous pouvez constater que l’outil a créé 12 tâches différentes et réparti le travail sur différents postes. Il a également publié les résultats de mon analyse directement sur Portal for ArcGIS. Avec les mêmes paramètres de regroupement de points en compartiments hexagonaux de 500 m, l’analyse a été effectuée en seulement 18,5 secondes. Non, je ne plaisante pas.
Processus de l’outil de géoanalyse, regroupement de points
L’image 6 ci-dessous démontre le résultat de l’outil de géoanalyse. Il est semblable à celui généré par notre modèle. Toutefois, comme je l’ai déjà mentionné, l’outil génère des compartiments hexagonaux partout où il y a des points. Le résultat affiche plus de détails sur les endroits où il y a de la criminalité, y compris les deux endroits dans l’eau, qui ne figuraient pas dans le modèle (image 4).
Résultat de l’outil de géoanalyse, regroupement de points
Il ne s’agissait que d’un simple exemple de la capacité de GeoAnalytics Server à afficher un seul outil. Imaginez le potentiel qu’il offre une fois que vous commencez à utiliser plus d’outils. En tirant profit de la puissance de l’informatique répartie sur différents postes et cœurs dotés de GeoAnalytics Server, les processus nécessitant beaucoup d’étapes et d’outils et prenant plusieurs minutes, voire plusieurs heures, peuvent maintenant être effectués en quelques secondes grâce à l’outil de géoanalyse. C’est maintenant votre tour d’explorer!
Ce billet a été écrit en anglais par Christina Xing et peut être consulté ici.