Aucune stratégie data driven ne repose sur des indicateurs de performance (KPIs) universels. "Quand on pose la question 'qu'est-ce qu'une stratégie data driven ?', chaque entreprise a sa définition et ses métriques", observe Gaël Philippe, président de Datasulting. "Les enjeux et les objectifs diffèrent en fonction de la taille de la société, de sa culture, de son secteur d'activité." Pour mesurer la maturité data d'une organisation, l'Observatoire de la Maturité Data des Entreprises retient cinq critères que sont le potentiel data, la mise en place d'une stratégie dédiée, les compétences internes, la gouvernance et la culture data.

La volatilité

La première étape d'une stratégie data driven consiste à rendre les données disponibles à l'ensemble des parties prenantes en luttant contre la rétention d'information. Chaque direction métier conservant jalousement ses données, tout l'enjeu consiste à les désiloter pour les rendre exploitables, les croiser voire les enrichir d'informations externes, mais aussi s'entendre sur une terminologie commune. L'ensemble des données sera déversé dans un data lake qui viendra alimenter des référentiels métiers. "Les responsables opérationnels devront également se mettre d'accord sur des indicateurs communs", poursuit Gaël Philippe.*

"Dans quelle mesure une donnée est fiable et s'inscrit dans une chaine de valeur cohérente?"

Dans la cadre de ce désilotage, Alexis Trentesaux, directeur d'unité adjoint chez mc2i et sponsor de l'offre data et analytics de l'ESN, met avant la volatilité de la donnée comme indicateur clé. "Dans quelle mesure une donnée est fiable et s'inscrit dans une chaine de valeur cohérente ? Avant de se déverser dans le data lake, la donnée peut venir de différentes sources : bases de données, applicatifs, open data… Quel est le taux de déperdition de la qualité ?", interroge-t-il.

Autre indicateur de performance essentiel, l'accessibilité de la donnée ne doit pas contrevenir au cadre réglementaire. "Des données personnelles, notamment RH et client, ne doivent pas être visibles dans certaines applications et/ou par certaines personnes", recommande le consultant.

Le niveau de fiabilité

Si la donnée s'apparente à ce fameux nouvel "or noir", elle passe, comme pour le pétrole, par une phase de raffinage avant d'être exploitée. Une entreprise data driven se doit d'établir des règles de nettoyage, de normalisation et de catégorisation des données afin de s'assurer qu'elles soient complètes, au bon format, dédoublonnées, cohérentes et à jour.

Parmi les indicateurs qui mesurent la qualité de la data figure les taux de valorisation des champs et du respect de leur format : adresse postale, date… Des opérations de contrôle devront, par exemple, analyser la présence de l'arobase ou du nom de domaine dans l'adresse mail. Il s'agit aussi de s'assurer de cohérence des saisies entre des champs interdépendants. "Ce travail, en lien avec la définition d'abaques et d'objectifs d'amélioration, permet de réduire le taux d'erreurs, et d'aboutir à un plan d'action d'amélioration continue", ajoute Alexis Trentesaux.

"Il convient de fixer un seuil à partir duquel une dérive des résultats donne lieu à une alerte et déclenche des travaux de revue des modèles d'IA"

Autre indicateur à prendre en compte : le délai de traitement des données. L'utilisateur final obtient-il des résultats rapidement ou bien à la suite de longues itérations ? "Si ce délai est élevé, un travail de refonte de l'architecture voire de l'infrastructure peut être envisagé", en déduit Alexis Trentesaux.

Sur le prisme de la data science et de l'IA, il faudra, rappelle-t-il, assurer un suivi régulier des modèles et des algorithmes en production. "L'évolutivité des applicatifs source, des objets métier, de la réglementation ou, a minima, de l'enrichissement des données d'apprentissage vont provoquer des écarts avec les performances et les résultats initiaux. Il convient de fixer un seuil à partir duquel une dérive des résultats donne lieu à une alerte et déclenche des travaux de revue des modèles", explique Alexis Trentesaux.

Une gouvernance

Le travail de qualification ne se fait pas sans responsabilités clairement identifiées. Dans les entreprises les plus matures, un chief data officer (CDO) sera en charge de la gouvernance de la donnée. Cette gouvernance, dont l'existence constitue un indicateur en soi, décrit les processus assurant le circuit de collecte, d'intégration et de valorisation de la donnée. A chaque étape, des opérationnels sont responsables des contrôles qualité, de la relation avec les métiers ou de la production des données.

Reste qu'une entreprise n'est pas "data driven" par la seule entremise d'experts. Cette évolution passera par la diffusion d'une culture de la data à l'ensemble de l'entreprise. Une culture dont la prise en compte pourra faire partie des objectifs de chacun et d'une rémunération variable. Pour mesurer son niveau d'appropriation, Alexis Trentesaux propose de suivre l'historique du traitement des données. "Qui est à l'origine des demandes ? Par où passe la chaîne de valeur ? Des plateformes de data science comme celles de Dataiku ou d'Informatica sont-elles déployées pour gérer cette traçabilité ?", interroge l'intéressé. Le taux de participation aux formations ou aux communautés est un autre indicateur de maturité.

Enfin, il sera pertinent de mesurer le taux de connexion aux outils de data visualisation parmi lesquels Tableau de Salesforce ou Power BI de Microsoft.


Source link