De nouvelles approches émergent et l’horizon 2022 sera certainement placé sous le « data-driven ». Pour y arriver, les entreprises doivent aujourd’hui tout miser sur la qualité et la gouvernance de la data. À titre d’exemple, de nombreuses organisations ne réalisent toujours pas à quel point les performances de l'IA et du ML dépendent des données. Chaque modèle d'apprentissage automatique est formé à partir de données, de sorte que les suggestions ou les liens qu'il établit sont tout autant justes ou biaisés que celles sur lesquelles il repose. Selon Gartner, la qualité des données est l'un des principaux obstacles à l'adoption de l'IA, donc la mise en œuvre de cette technologie devrait nécessairement impliquer des pratiques de gestion de données bien gouvernées.

Aujourd'hui, les organisations sont tributaires des données pour chaque décision et les considèrent comme un actif majeur de l'entreprise. Leur volume est certes important mais pas suffisant : d’où le paradoxe du Big Data. Tout le monde en parle comme étant une « solution miracle », et de ce fait les entreprises s'attendent souvent à ce qu’il leur apporte plus de valeur qu'il ne le peut réellement.

Ce décalage entre les attentes et la réalité s'explique principalement par le fait que le volume de données à lui seul ne suffit pas : il s'agit de garantir la qualité de la data et d'éviter les biais. Dans de nombreux cas, les données volumineuses ne sont pas nécessaires pour obtenir des informations pertinentes. Ce dont les entreprises et les organisations ont réellement besoin, c'est d'une approche intelligente de la gestion, de la gouvernance, du suivi et de la sécurisation des données, afin de pouvoir en tirer les bonnes conclusions.

L’une de ces approches, qui a le vent en poupe depuis un moment déjà, est le data mesh. Qu’es Aquo ?

L'explosion des données dans les organisations a entraîné la mise en place de nombreuses méthodes pour les stocker, les cataloguer et les utiliser. Jusqu'à récemment, les organisations abordaient les données volumineuses en les rassemblant en un seul endroit, en les structurant et en les exploitant par le biais de lacs (data lakes) et d'entrepôts de données. Mais ces lacs de données présentent certains inconvénients : ils sont monolithiques et centralisés, nécessitant leurs propres administrateurs pour gérer les données stockées, ce qui peut créer des goulots d’étranglement. À la différence du data mesh, qui peut être défini comme étant une solution de stockage de données en libre-service. Il représente une architecture de données décentralisée qui s'appuie sur une conception orientée domaine.

En somme, le data mesh traduit le passage d'une plateforme de données centralisée à une architecture décentralisée moderne où les organisations peuvent véritablement unifier les données provenant de systèmes et de sources disparates. Cela implique qu’une gouvernance évolutive et efficace des données est indispensable pour le data mesh.

Alors pourquoi la gouvernance des données est-elle essentielle au data mesh ?

Le concept du data mesh repose sur une architecture décentralisée, principe fondamental de la gouvernance des données. Si le lien semble évident entre les deux, il le devient encore plus à mesure que la data devrait être disponible pour tout le monde à travers une entreprise, sans qu'il soit nécessaire de faire appel à des équipes techniques qui la supervisent. L'un des principaux obstacles pour permettre cet accès en libre-service est le manque de connexion entre tous les systèmes et sources de données. Sans cette connectivité, les utilisateurs dépendent des ressources techniques pour savoir d'où viennent les données, comprendre ce qu'elles contiennent, et confirmer leur qualité.

C’est tout le contraire d’un modèle évolutif, car la compréhension des données est retardée, la productivité est affectée et les ressources sont surchargées.

 L'idée de déployer des entrepôts de données était de pallier au manque d'intégration et d'héberger les données dans un stockage central afin que les entreprises puissent avoir une vue unifiée de toutes leurs données. La création d'une vue unique exige un traitement et une transformation continus. Compte tenu du volume, de la diversité et de la mauvaise qualité persistante de certaines données, de nombreuses initiatives en matière de leur gestion n'ont pas été à la hauteur des attentes. Il est vrai que les data lakes avaient permis de contourner les obligations en termes de conformité, mais plusieurs d’entre eux ont également échoué en raison d'un manque de gouvernance et d'une surabondance de données obsolètes et non pertinentes.

La data va sans aucun doute poursuivre sa trajectoire de croissance explosive. IDC prévoyait en 2018 que la sphère de données augmentera de 33 ZB à 175 ZB en 2025. Et cette empreinte croissante continuera à imposer une architecture centralisée, peu évolutive et lente à prendre en charge les sources de données nouvelles et en continuelle expansion. Autre problématique de cette croissance, l'extraction d'informations complémentaires à partir des ressources de données. Aujourd'hui, seules 32 % des entreprises sont en mesure de tirer des valeurs tangibles et quantifiables de leurs données. Continuer avec cette approche peut ne pas fournir l'agilité nécessaire pour pleinement exploiter les perspectives que peuvent apporter les nouvelles données. D’où l’efficacité du data mesh, qui offre un énorme potentiel pour rationaliser la rapidité et la performance du Data Intelligence. 


Source link