
La Data Quality : secteurs, usages et finalités.
La Data Quality, ou qualité de données en français, revient progressivement sur le devant de la scène dans les métiers liés à la donnée relationnelle (marketing, commerce, RH, DSI…). Après s’être concentrées sur des technologies avancées en termes de traitement de données, comme le mining ou l’IA, les entreprises souhaitent répondre à des problématiques réelles, concrètes et quotidiennes sur la qualité des données.
En effet, la qualité des données est la pierre angulaire d’une stratégie data efficiente et cohérente. L’ordre logique commence par des traitements de qualité de données, qui seront ensuite complétés par d’éventuels enrichissements, puis pour les entreprises les plus avancés, des traitements complexes comme des créations de segments, de l’Intelligence artificielle pour prédire et anticiper des comportements, mais également du « data mining » pour créer des corrélations statistiques entre plusieurs segments.
Ceci dit, ces derniers traitements complexes sont inenvisageables sans qualité de données. Pour quelles raisons ? Par le simple fait qu’il est impossible de créer des segments, prédications et corrélations intéressantes si les données clients en entrée sont inexactes, illisibles ou présentes en de multiples occurrences dans les fichiers.
Ainsi, les traitements de qualité de données permettent de disposer de fichiers clients qualifiés, dédoublonnés et dédupliqués.
Voyons en détail les différents traitements possibles de la qualité de données et leurs usages particuliers :
- Analyse titre-nom-prénom : Cette analyse permet de séparer dans différentes colonnes les noms et prénoms de vos contacts, dans le cas où ceux-ci ont été saisis dans une seule et même colonne.
- Normalisation syntaxique email : Ce traitement permet de normaliser la syntaxe des emails de vos fichiers clients, c’est-à-dire séparer distinctement la racine (partie locale de l’adresse), le séparateur (@) et le domaine, tout en enlevant les caractères invalides du domaine.
- Formatage et normalisation téléphonique : Permet aux données téléphoniques de correspondre aux normes internationales (nombre de caractères numériques, code pays…)
- Normalisation postale (RNVP) : une suite de traitements sur l’adresse incluant la restructuration, la normalisation et la validation de l’adresse postale. Cette dernière se fait par l’intermédiaire de référentiels officiels, permettant de disposer d’adresses
– dont la structure permet d’être lisibles par les systèmes de routage
– correspondant aux normes postales des pays
– validées et existantes
- Identification des déménagés : L’identification des déménagés est décomposée en deux traitements : « Estocade » qui identifie les déménagés, et le traitement « Charade » qui ajoute au traitement « Estocade » la nouvelle adresse postale du déménagé.
- Géocodage (Iris, carreau) : Le géocodage permet de lier une adresse postale à un découpage au carreau ou par l’IRIS (découpage du territoire français produit par l’IRIS) et créer des segments en fonction des CSP probables des quartiers.
- Dédoublonnage : Ce traitement de Data Quality permet d’identifier et de fusionner des doublons au sein d’un fichier de données clients.
- Déduplication : Ce traitement de Data Quality permet d’identifier et de fusionner des doublons au sein de plusieurs fichiers de données clients.
Dans quels secteurs la Data quality est-elle utilisée ?
A la base, les premières entreprises ayant utilisé la Data Quality étaient des sociétés spécialisées dans le routage postal et la livraison, et utilisant donc des systèmes de GPS. La data quality a ensuite été progressivement exportée vers d’autres secteurs comme le e-commerce,où les besoins de routage sont importants également; puis la banque et l’assurance, où les données clients mais surtout leur fiabilité, représentent une opportunité de croissance commerciale).
Aujourd’hui, la qualité de données est répandue dans tous les secteurs, et est devenue un tel enjeu qu’il est difficile pour n’importe quelle société, quelle que soit sa taille, de s’en passer.
Quelles sont les finalités de la qualité de données ?
Quand on parle de finalités en data quality, il est plus évident de parler de l’impact de la non qualité des données clients. Les problématiques liées à cette non qualité sont nombreuses, dommageables pour l’entreprise et la relation client.
Une mauvais qualité de données implique :
- Un problème de maintien de la relation client : les contacts sont amenés à déménager, changer de numéro de téléphone ou d’email. Ne pas disposer d’informations actualisées sur les clients / prospects peut amener à la fin de la relation, du simple fait qu’il devient impossible de les contacter.
- Un problème de normes : des données non normées, c’est à dire ne respectant pas les normes réglementaires sur les adresses postales, les téléphones, les emails et autres points de contact, sont illisibles par les systèmes opérateurs.
Comment fonctionne la Data Quality sur Hubbi ?
La qualité de données conçues par Hubbi a été créée dans le but d’éviter les écueils classiques connus sur le marché.
Généralement, quand une société souhaite mettre en qualité des données, plusieurs contraintes viennent s’agréger :
- Les entreprises doivent sortir les données de leur système d’information pour procéder à leur mise en qualité, posant un problème de sécurité.
- Sortir les données en clair de votre SI est également un risque en termes de RGPD, si des données de contact fuitent, vous devrez avertir via une communication officielle l’ensemble de vos clients / prospects.
- La qualité des traitements n’est pas toujours au rendez-vous (problèmes de normes, de doublons non identifiés ou de restructuration des données)
- Les prix du marché sont volatiles, opaques, et changent d’un client à l’autre.
C’est pour répondre à ces problématique que la plateforme Hubbi intègre aujourd’hui une solution de qualité de données tout à fait différente des solutions du marché :
- Sur Hubbi, vos traitements de qualité de données se font sans que vous ayez à sortir les données en clair de votre système d’information. Toutes les données sont anonymisées, aucune donnée ne sort.
- Les traitements sont faits à partir de données anonymisées, et répondent donc aux exigences du RGPD en matière de confidentialité des données.
- La qualité des traitements de DQM est assurée par des algorithmes éprouvés de Data Quality, utilisés par de nombreux clients de toutes tailles (de la PME au grands comptes)
- Les prix sont fixes, et largement en dessous des prix du marché !
Vous souhaitez mettre vos données en qualité ? Contactez nous !
- Date - 1 février 2022