Un Data warehouse et un Data mart sont deux composantes d’un système d’information décisionnelle.
Le Datawarehouse : la mémoire brute de l’entreprise
Le Data warehouse est un entrepôt de données. A ce titre, ses fonctions principales sont de récupérer l’information, de la stocker, de l’enregistrer et de la mettre à disposition d’utilisateurs avancés. Pourquoi uniquement d’utilisateurs avancés ? Car l’information est stockée dans un format généralement brut, composé de logs, de tables d’événements… Rien qu’un utilisateur lambda de l’entreprise sache exploiter. Seuls les gestionnaires de base des DSI et les statisticiens y trouvent leur compte. Ces derniers sont très souvent en mesure de retravailler eux-mêmes la donnée pour la faire parler, et donc préfèrent construire leurs propres indicateurs parfaitement adaptés à l’étude qu’ils mènent.
On juge de la performance d’un Datawarehouse à sa capacité à sécuriser l’enregistrement de la donnée : redondance, sauvegarde, reprise sur incidents… Rien de sexy mais une base solide qui garantit que l’information ne sera jamais perdue, ou qu’une information corrompue pourra être isolée, nettoyée, sans gâcher toute la base. En sus, des indicateurs de contrôle peuvent être mis en place pour garantir les 3 conditions clés pour une donnée saine : sa qualité, son exhaustivité, et sa fraîcheur.
Le Datamart : la donnée au service de l’intelligence business
Comme expliqué, un entrepôt de données ne met pas l’information à disposition de l’utilisateur basique. Pour cela, il faut adjoindre à l’entrepôt un Data mart, dont le rôle est de retraiter l’information pour la rendre exploitable par un corps de métier de l’entreprise. A chaque métier son Data mart : l’information, pour être transformée en ressources, doit être retravaillée sous forme d’agrégats pour être compréhensible de l’utilisateur. Un comptable et un Marketeux ne partagent pas la même vision de l’entreprise, donc l’information doit leur être adaptée.
Un exemple : dans un data warehouse, les clics sur e-mail sont enregistrés en fonction d’une date de clic, l’adresse e-mail n’étant qu’un des paramètres du clic. Pour un expert CRM, l’adresse e-mail (ou tout autre identifiant client) sera le point d’entrée : en face de chaque contact, le fréquence de clics, la date de dernier clic, etc… Le Datamart est un prisme qui adapte la donnée à l’utilisateur. En cela, ses clés de succès tiennent beaucoup à la façon dont la donnée est agencée. Plus elle est compréhensible par l’utilisateur, meilleur est le résultat. C’est pourquoi les intitulés de chaque champ et leur mode de calcul doivent coller au plus près des usages du métier.
Par ailleurs, si un expert en base de données peut comprendre de devoir attendre plusieurs minutes pour obtenir la réponse à une requête sur la base, un utilisateur classique y verra un bug. C’est pour cela qu’un Datamart pré-calcule la plupart des combinaisons de champs en dehors des heures de bureau. Ainsi, tous les résultats sont pré-enregistrés et l’utilisateur obtient sa réponse en quelques secondes. Bien évidemment, un Data mart permet moins de souplesse dans la manipulation de l’information, mais au moins celle-ci a du sens et permet de diffuser la connaissance véhiculée par la donnée.