Notes de projet (article complet à rédiger)
- Mise en place d'une plateforme de données groupe (CDP) qui mutualise les données clients de 20M+ de contacts et les algorithmes de plusieurs enseignes
- Plus de 4 Md€ de ventes couvertes
- Permet l'enrichissement de données entre enseignes
- Cloud Platform: GCP
- Data Warehouse: BigQuery (multi-petabyte scale)
- Orchestration: Airflow (100+ DAGs)
- Infrastructure: Terraform (infrastructure as code)
- Compute: Kubernetes
- Languages: Python, SQL
- Algorithme de déduplication client grâce au développement d'un graphe client avec multithreading
- Infrastructure as code et versionnement de l'ensemble de la plateforme avec Terraform
- Mise en place d'Airflow CI/CD pour l'orchestration des pipelines
- Partage et enrichissement de données compliant sans opt-in groupe
- Challenge des définitions non communes entre plusieurs enseignes
- Absence de déduplication des clients au sein même d'une enseigne alors qu'au niveau groupe cette déduplication est effectuée
- 20M+ customers deduplicated across brands
- Customer 360 view covering €4B+ in sales
- Multi-brand customers are 2.5x more valuable
- €50M+ e-commerce investment secured based on data insights