Pourquoi le mouvement des données massives est-il si important pour les SIG?
Le terme « données massives » n’a pas la même signification pour tout le monde. Mais si vous avez navigué sur Internet récemment, vous avez forcément dû employer une technologie de données massives. Qu’est-ce que ce terme signifie exactement et comment détermine-t-on le moment opportun pour en faire usage? S’agit-il d’une technologie, d’un cadre ou bien d’une application? Que signifient les données massives pour l’ensemble des activités commerciales, et particulièrement en ce qui a trait au secteur des SIG? Lisez ce billet de blogue afin de comprendre la grande importance des données massives.
J’ai récemment pris la parole à un atelier organisé par l’Association canadienne des sciences géomatiques portant sur les données massives. Des conférenciers de partout au Canada et en Europe ainsi qu’une foule de participants étaient présents. Tous ont partagé beaucoup de questions, d’idées et de points de vue tout aussi pertinents. Les conférenciers de l’atelier ont couvert tous les aspects géospatiaux liés aux données massives, tant sur les plans pratique, théorique, technique et commercial que sur celui des services publics. Et alors, avons-nous percé le mystère des mégadonnées? Pas encore, mais nous y avons bien entendu proposé certains concepts intéressants.
Les conférenciers s’accordaient pour dire que les données massives s’avèrent utiles dans un large éventail d’applications géospatiales : soins de santé, environnement, démographie, sécurité publique, changement climatique, villes intelligentes, traitement d’image et services publics, etc. Voici plusieurs cas où Esri a employé des données massives. Aujourd’hui, selon bon nombre des conférenciers, la technologie n’est pas un obstacle de taille. Cela dit, malgré les progrès accomplis pour mettre la technologie des données massives à la disposition de la population, il reste du travail à faire. Des préoccupations techniques sur l’élaboration d’applications de données massives demandent toujours réponse.
À ce sujet, l’aspect analytique est le principal point commun qu’ont apporté les conférenciers. En effet, l’analytique propulse les données massives à l’avant-plan du secteur commercial, des applications et de l’adoption de la technologie. Lorsque les techniques et les technologies de mégadonnées actuelles n’existaient pas, on utilisait des « trucs » tels que la réduction et le lissage de données, ainsi que la réduction d’échantillons et de la période d’étude. De cette manière, on arrivait à obtenir un résultat à valeur scientifique dans un délai raisonnable à l’aide de la technologie de l’époque.
Cette application d’information publique sur les feux de forêt en Alberta constitue un bon exemple d’application de données massives. Son contenu géolocalisé affiché en temps réel provient de sites de médias sociaux comme Twitter, YouTube et Flickr. Il s’est avéré grandement utile pour suivre le fil des événements sur le terrain à Fort McMurray, pendant les feux de forêt qui se sont déclarés en mai.
De nos jours, les progrès réalisés en matière de mise en mémoire, de traitement des données et de capacité de réseautage sont tels qu’en plus de traiter et d’analyser tous les événements recensés, il est désormais possible d’obtenir des résultats rapidement. Pensons par exemple à des applications qui recueillent en continu des données en temps réel sur la position de milliers de taxis dans une ville. Ces applications effectuent des analyses statistiques afin de déterminer le rayon optimal de ramassage des prochains clients et de dépêcher les taxis disponibles aux endroits situés dans la zone circonscrite. Ces systèmes de données massives améliorent l’efficacité des flottes de taxis de la municipalité en plus d’accroître la satisfaction des clients. Comme les taxis perdent moins de temps dans la circulation urbaine, ils arrivent plus rapidement à destination. Tout le monde y gagne.
Les SIG sont fondées sur des mesures, et c’est l’un des aspects uniques de l’application de données massives à un système d’information géographique. De manière générale, les valeurs et les positions recueillies sont considérées comme exactes dans la mesure où elles respectent des spécifications de tolérance. Par conséquent, toutes les données massives appliquées aux SIG sont traitées comme des nombres précis, puis analysées en respectant les mêmes spécifications.
Également, les données massives appliquées aux SIG sont collectées en grandes quantités. La majorité de ces données sont recueillies par des capteurs qui les préparent afin de les acheminer vers une infrastructure d’entreposage. Le développement de l’Internet des objets (IdO) contribue à faciliter l’intégration de la collecte des données provenant de ces capteurs. Actuellement, de nombreuses normes internationales sont mises en place et appliquées à la collecte de données générée par les capteurs stationnaires et les capteurs mobiles. Parmi les premiers, on compte les jauges de profondeur d’eau, les caméras de surveillance de la circulation et les sondes de mesure de la température de l’air. Les seconds comprennent quant à eux les capteurs de position GPS, les caméras vidéo pour la voiture et même les téléphones cellulaires.
Une fois les données collectées par le capteur et envoyées au système d’hébergement de données massives, celles-ci doivent être analysées sans délai aux fins de détection des anomalies. Pour ce faire, on peut utiliser le progiciel d’extension pour ArcGIS GeoEvent for Server. Les anomalies sont, par exemple, des chasse-neige immobilisés à des endroits inhabituels, des individus en libération conditionnelle localisés là où ils ne devraient pas se trouver ou simplement la détection de la foudre. Lorsque des données atypiques sont détectées, une analyse approfondie ou une surveillance accrue peuvent s’avérer nécessaires. En l’absence d’anomalies, les données recueillies par le capteur doivent être conservées dans un entrepôt de données massives afin que chaque événement ou mesure soit accessible aux fins de traitement ou d’analyse en cas de besoin.
Au fil des ans, de nombreuses technologies d’intégration des applications de données massives ont été mises au point. Comme les capteurs ont considérablement évolué sur le plan technologique, ces dispositifs feront de plus en plus partie intégrante de la vie courante. Des réseaux câblés et sans fil seront mis en place afin de recueillir les mesures provenant des capteurs, et des superordinateurs performants seront installés pour traiter ces données. Mais n’oubliez pas : quelqu’un doit assurer la surveillance des anomalies afin de les signaler conformément aux procédures normalisées.
À la lumière de ces nouvelles connaissances, croyez-vous votre organisation prête à intégrer une application de données massives? Si tel est le cas, il existe des logiciels et des services prêts à l’emploi comme ArcGIS Online et ArcGIS for Server qui vous permettent d’intégrer un système de données massives dans votre organisation, et ainsi contribuent à accroître le rendement ou l’efficience de votre entreprise.