Produire ses premières analyses clients – préparer la donnée

Passer un peu de temps à  faire parler les données clients dont on dispose est sûrement la première chose à  faire pour comprendre l’intérêt du CRM. Donc on ne va rien se cacher. Lorsque l’on met son nez pour la première fois dans ce type de données, le résultat n’est souvent pas reluisant :

  • Des informations dont on ne connaît pas la signification ;
  • Des champs pour la plupart vides ou avec des données incohérentes…
  • Ou pas de données du tout ! Des adresses e-mail, mais rien à  côté<

Recenser, consolider, nettoyer, normer la donnée client

Rien de grave dans tout ça, en procédant avec méthode on en tirera forcément quelque chose, à  condition de mettre son meilleur expert Excel sur le coup…

Recenser

Il s’agit de faire le décompte de toutes les informations disponibles sur les clients (et les futurs clients tant qu’à  faire). Aller chercher la donnée partout où elle se cache

  • Dans la base qui sert à  envoyer les communications
  • Dans le système de facturation
  • Dans le back office du site si celui-ci dispose de comptes utilisateurs

Essayer de récupérer 3 types de données clients :

  • Les données de contact : adresse e-mail, numéro de téléphone, adresse postale… Chaque base a au moins une de ces données, elles seront indispensables pour consolider toutes les données.
  • Les données de profil : âge, sexe, code postal… Ce sont les plus fréquentes en base, elles sont un socle solide pour établir un portrait robot du client.
  • Les données comportementales : clic ou ouverture d’e-mails, date d’achat, montant des dépenses, produits achetés, nature de l’offre souscrite… Celles-ci sont sûrement les mieux cachées, car elles ne sont pas toutes explicites. Exemple : on peut déduire qu’un membre de la base est client s’il est présent dans un fichier de facturation. On pourra donc a minima ajouter un champ « client » avec la valeur « oui » à  côté de son profil, histoire de le distinguer dans les fichiers qui mélangent prospects et clients.

Consolider

L’enjeu est de réconcilier les données en trouvant un identifiant commun à  toutes les sources de données. De fortes chances que cet identifiant soit une adresse e-mail ou le couple nom+prénom. Pour une première découverte, ne pas perdre de temps à essayer de rapprocher des données qui ne sont pas cohérentes. On y viendra, mais dans une étape ultérieure.

Nettoyer et normer

Supprimez sans pitié toutes les données qui n’ont pas de sens. Même ainsi, à cause de la multiplicité des sources, il restera des formats de données différents pour un même type d’information (ex : âge vs année de naissance, code postal vs nom du département). Choisir de préférence un format numérique comme référence, plus facile à  trier par la suite, et remplacer tous les autres formats par celui-ci. Exemple : transformer tous les âges en dates de naissance dans 3 champs différents (jour / mois / année). Forcément il manquera le jour et le mois de naissance pour tous les âges convertis. Pour les données manquantes, choisir alors une valeur par défaut qui ne pourra pas être confondue avec autre chose, comme 99/99/anneedenaissance.

Voilà , les données clients sont propres, on va pouvoir commencer à jouer avec par le biais de quelques analyses simples.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *