L'adoption des Reverse ETL
Développés à partir de 2018, les Reverse ETL font partie d'une nouvelle famille de software. Devenus réellement populaires à partir de 2021, les Reverse ETL transforment les habitudes et redéfinissent comment les entreprises peuvent tirer parti de leurs données.
Dans cet article, vous apprendrez ce que sont les Reverse ETL et comment ils peuvent vous faire gagner du temps et de l'argent en répondant à ces questions :
Qu'est-ce qu'un ETL ?
Qu'est-ce qu'un Reverse ETL ?
Comment les Reverse ETL fonctionnent-ils ?
Quelles sont les alternatives aux Reverse ETL ?
Quels sont les bénéfices d'un Reverse ETL ?
ETL vs. Reverse ETL
Pour comprendre ce qu'est un Reverse ETL, il faut déjà saisir ce qu'est un ETL (Extract, Transform, Load). Le processus d'Extraction, Transformation et Chargement est exactement ce que les ETL font. Ils extraient de la donnée depuis les différentes sources des entreprises, la transforment pour en construire des modèles et la chargent dans un data warehouse.
De nombreux outils d'ETL existent, en passant de Fivetran, AWS Glue à Hevo.
Illustration du processus ETL
💡 Le processus ELT existe ici. La différence entre les ETL et les ELT est bien plus profonde que le switch de 2 lettres. Cela détermine comment, quand et où la transformation de la donnée est faite.
Dans le cas du processus ETL, la donnée brute est transformée avant d'être transmise au data warehouse. Au contraire, le processus ELT implique de charger de la donnée brut dans le data warehouse puis de la transformer.
Depuis les années 2010, d'énormes investissements ont été réalisés dans l'infrastructure de données cloud. Des études récentes prévoient même un taux de croissance annuel de 22 % pour le stockage des données cloud.
Pourquoi ? Plusieurs raisons peuvent être avancées :
Évolutivité : Les data warehouse cloud s'adaptent aux besoins des entreprises et évolue avec l'utilisation qui en est faite
Rentabilité : Le modèle de paiement à l'utilisation réduit les dépenses et les coûts de stockage sont réduits.
Flexibilité et agilité : Les data warehouse cloud permettent un déploiement rapide et une intégration facile avec les outils existants. Ils sont facile à utiliser et permettent le traitement de données massives.
Sécurité : Toutes les solutions prennent de mesures robustes, ont certifications de conformité et cryptent les données.
Avec des réglementations de plus en plus strictes sur les données de première partie, les data warehouse cloud peuvent être le moyen idéal de reprendre le contrôle de ses données pour répondre aux exigences des clients. Pourtant, la plupart de ces données centralisées dans des data warehouse sont aujourd'hui sous-utilisées : en 2021, seules 9 % des entreprises optimisaient leurs opérations marketing sur tous leurs canaux d'acquisition et tout au long du parcours client pour atteindre leurs résultats commerciaux.
En effet, une fois que les données résident dans le data warehouse, les récupérer et les utiliser dans les outils des équipes métiers devient un défi. C'est là que les Reverse ETL entrent en jeu...
La principale différence entre l'ETL et le Reverse ETL réside dans le sens du flux de données. En effet, l'ETL extrait les données des systèmes sources, les transforme en fonction des besoins d'analyse et les charge dans un data warehouse. Comme expliqué dans la suite de cet article, le Reverse ETL, quant à lui, transfère les données d'un data warehouse vers des outils métiers.
Que sont les Reverse ETL ?
Le Reverse ETL est le processus de transfert de données d'un data warehouse vers des applications métier, utilisées par les équipes Marketing, Sales, Support, Opérations, etc. Ce processus tire parti de la stack existante d'une entreprise et permet de mettre en place des expériences client personnalisées et automatisées.
Les données peuvent être transformées et exploitées en temps réel en les envoyant directement aux applications opérationnelles telles que les CRM, les plateformes d'automatisation du marketing et les outils de support client.
La plupart du temps, quand les équipes métiers ont besoin de données dans leurs outils, ils ont besoin de créer des tickets auprès des équipes IT et doivent ensuite attendre longtemps avant de l'avoir à disposition. Les Reverse ETL font le lien entre les équipes data et les équipes opérationnelles.
Illustration du processus Reverse ETL
Les Reverse ETL font en effet le processus inverse des ETL, permettant de transférer des données centralisées dans le data warehouse vers toutes les applications de l'entreprise - telles que celles du marketing, les ventes, le service client, pour n'en citer que quelques-unes.
Les Reverse ETL ne sont pas seulement des pipelines. Au-delà du transfert de données, ils permettent aux organisations de modéliser et de transformer les données avant de les envoyer aux applications métier. Des fonctions telles que le nettoyage des données, la segmentation et la création d'audiences améliorent l'utilisabilité et la pertinence des données dans les différents systèmes opérationnels.
👉🏼 En résumé, les Reverse ETL permettent la synchronisation de la donnée entre différents systèmes et applications pour assurer précision et cohérence.
Pour en savoir plus sur les Reverse ETL, télécharger notre guide complet.
👇
Le guide ultime des Reverse ETL
Tout ce que vous devez savoir sur les Reverse ETL et comprendre pour bien choisir la votre
Comment fonctionnent les Reverse ETL ?
Les Reverse ETL fonctionnent en exécutant des requêtes dans votre data warehouse et en transférant les résultats aux outils que vous avez sélectionnés (que ce soit une destination marketing, un CRM ou une plateforme d'automatisation).
Il y a 5 composants principaux à un Reverse ETL :
Source : Fait référence au data warehouse (ou data lake) où toutes les données dont vous souhaitez tirer de la valeur sont stockées. Snowflake ou Google BigQuery figurent parmi les data warehouses les plus courants.
Modèles : Le modèle de données sert de représentation de vos données, définissant les données auxquelles vous souhaitez que vos équipes métier aient accès. Il est généralement créé et maintenu par un utilisateur expert en données familier avec le data warehouse. Une fois configuré, tout le monde peut l'utiliser facilement sans avoir à coder.
Segments : Un segment est un sous-ensemble du modèle de données. Par exemple, il est possible de créer un segment tel que "utilisateurs résidant en Europe" ou un segment de "utilisateurs ayant dépensé plus de 100€", à partir de l'entité Clients (définie dans le modèle).
Syncs : Cela fait référence au processus de synchronisation des données d'un segment avec un outil en aval selon un calendrier défini. Vous pouvez configurer plusieurs synchronisations à partir du même modèle de données vers différentes destinations, garantissant que toutes les équipes de votre entreprise travaillent à partir de la même donnée (grâce à une source unique de vérité).
Destinations : Une destination fait référence à tout outil externe ou service vers lequel vous pouvez envoyer des données source. C'est généralement là que les utilisateurs finaux (i.e. les équipes métier) accèdent et utilisent les données. Les destinations les plus courantes sont les plateformes publicitaires, les CRMs ou les plateformes d'automatisation marketing.
Composants principaux d'un Reverse ETL
Quelles sont les alternatives aux Reverse ETL
Le transfert des données peut se faire de différentes manières : téléchargements manuels de fichiers csv / excel, pipelines personnalisés ou autres outils tels que iPaaS ou CDP.
Reverse ETL vs. iPaaS
Les Integration Platform as a Service (iPaaS - littéralement Plateforme d'intégration en tant que service) sont des plateformes qui connectent des applications de manière à ce qu'un déclencheur spécifique dans un outil entraîne une réponse spécifique dans un autre. Par exemple, une soumission de formulaire sur Typeform peut automatiquement créer un nouveau contact dans Hubspot.
Les iPaaS peuvent connecter des applications via des API, ce qui facilite grandement la tâche pour des intégrations simples, c'est-à-dire de point à point et sans dépendances.
La principale différence entre un Reverse ETL et l'iPaaS est que le Reverse ETL s'applique à envoyer de la donnée d'une source unique vers des destinations marketing alors que l'iPaaS crée un flux bi-directionnel, bougeant de la donnée d'un point A vers un point B.
Les iPaaS populaires sont des outils tels que Workato, Zapier ou Boomi.
Une iPaaS connecte simplement des systèmes un-à-un et présente plusieurs limitations :
Elle génère un réseau complexe de pipelines et de workflow qui ne sont pas évolutifs.
À mesure que les workflows deviennent complexes, les utilisateurs ont besoin de connaissances en matière d'API, annulant l'avantage du "no code", car les équipes métier auront besoin d'aide de la part des équipes de données.
Elle n'est pas conçue pour les mises à jour en masse de gros volumes (ou est extrêmement coûteuse si vous vous y risquez).
Elle ne repose pas sur source unique de vérité et un profil unique pour un client (Customer 360) et peut donc entraîner des expériences client incohérentes.
Elle fonctionne comme une "boîte noire" et pose des problèmes de gouvernance et de qualité de la donnée.
iPaaS vs. Reverse ETL
Reverse ETL vs. CDP
Une Customer Data Platform (CDP) est une plateforme prête à l'emploi qui stocke et organise les données clients provenant de sources multiples afin de créer une source unique de vérité. En tant que telle, la CDP est une alternative au data warehouse. Cependant, la CDP offre des fonctionnalités avancées en plus des objectifs de BI :
Préparation des données pour les cas d'usage métiers : segmentation, création d'agrégats, de scores client, etc.
Redistribution vers les applications des équipes métiers
En résumé, la CDP joue le même rôle que la combinaison d'un data warehouse et d'un Reverse ETL. La CDP offre donc des fonctionnalités supplémentaires qu'un Reverse ETL, mais le Reverse ETL reste une brique essentiel de ce type de platforme.
Pourtant, depuis une dizaine d'années que les CDP existent, l'écosystème a considérablement évolué et les CDP ne sont plus si attrayant. Seulement 1 % des entreprises pensent que les CDP répondent réellement à leurs besoins actuels et futurs.
La CDP a en effet plusieurs défauts :
Rigidité : La CDP impose des modèles de données rigide et limite la création de modèles personnalisés.
Prix : La CDP est une solution coûteuse, inaccessible à la plupart des petites et moyennes entreprises.
Confidentialité et sécurité : Comme elle stocke les données, la CDP est une solution moins sûre et soulève une question de contrôle des données.
Le processus de Reverse ETL fait partie de la CDP composable, qui s'appuie sur un data warehouse cloud et active ces données vers de nombreuses destinations différentes.
CDP vs. Reverse ETL
Quels sont les bénéfices des Reverse ETL ?
Les Reverse ETL aident les entreprises à garantir que leurs données sont cohérentes et toujours à jour sur l'ensemble de leurs systèmes. Les données sont en effet partagées entre les applications opérationnelles et l'ensemble des équipes au sein de votre entreprise, garantissant que vos données ne restent pas silotées.
Avec ce type d'outil, vous pouvez obtenir :
Une vue à 360° de votre parcours client : L'équipe data se charge de rendre les données pertinentes accessibles et prêtes à être utilisées dans le data warehouse. Par la suite, les équipes métier peuvent mener de manière autonome leurs analyses pour obtenir des informations pertinentes en temps réel. Ceci permet d'améliorer l'expérience client tout au long du parcours.
Une prise de décision rapide et basée sur les données : Des informations toujours à jour peuvent être chargées rapidement dans les systèmes opérationnels. Ceci garantit que les équipes disposent de données pertinentes et précises, permettant une réactivité rapide face aux changements du marché, demandes des clients et opportunités émergentes.
Des contenus et campagnes marketing plus personnalisés :
Le Reverse ETL est particulièrement utile pour la publicité. Les équipes marketing ont souvent besoin de segmenter les données pour diverses raisons, comme la création d'audiences similaires (lookalike), l'exclusion de certains groupes de clients des campagnes, ou le ciblage de "top" clients. Avec le Reverse ETL, toutes les audiences peuvent être gérées de manière centralisée et synchronisées avec les plateformes marketing.
Le Reverse ETL permet également de transmettre des données first party, comme des attributs, des caractéristiques ou des métriques prédictives personnalisées, pour enrichir votre connaissance client dans votre CRM/outil de marketing du cycle de vie (par exemple Braze). Cela permet une personnalisation tout au long du parcours client.
Amélioration des opérations client :
Les outils des équipes commerciales peuvent être enrichis avec des informations supplémentaires (utilisation du produit, préférences de canal, etc.).
Les équipes de support peuvent également bénéficier du Reverse ETL, car il permet de synchroniser en temps réel les informations client dans leur système. Ceci permet de prioriser les actions de support en fonction de l'utilisation du produit et de la valeur du contrat du client.
👉🏼 Beaucoup de cas d'usage sont possibles avec les Reverse ETL. Consultez notre article détaillé pour en avoir une idée complète ou écoutez le podcast Data Gen dans lequel nous sommes intervenus.
Comment choisir son Reverse ETL ?
Une comparaison des outils existants sur le marché
A noter qu'ils existent plusieurs catégories de Reverse ETL :
Les outils d'intégrations qui se concentrent sur la simplification du mouvement des données pour les équipes data
Les outils Reverse ETL généralistes qui prennent en charge l'intégration de n'importe quelle source vers n'importe quelle destination, mais qui sont dédiés aux équipes data
Les outils Reverse ETL spécialisés, qui mettent l'accent sur la possibilité pour les équipes métiers d'utiliser les données de manière plus efficace, sans dépendre des équipes data
🌟 Plusieurs acteurs se positionnent sur le marché et dans les différentes catégories. Nous avons écrit un benchmark des Reverse ETL pour vous aider à choisir une solution adaptée à votre entreprise.
Comparaison des catégories de Reverse ETL
Chez DinMo, nous ne répondons pas seulement aux besoins des équipes data, mais nous offrons également aux équipes métier un outil qu'elles peuvent parfaitement utiliser sans avoir besoin d'un ingénieur. DinMo est la seule solution de Reverse ETL facile à utiliser pour les équipes non techniques. Nous combinons l'expérience utilisateur sans code des meilleurs CDP traditionnelles et la simplicité et la flexibilité des Reverse ETL.
Nous avons choisi la Reverse ETL DinMo parce que la solution était simple à mettre en place et surtout à utiliser. En 1 heure, tout était configuré. Nous avons pu construire nous mêmes nos segments sans passer par l'équipe data, et les utiliser directement dans nos outils acquisition
Sylvain Seng Bandith, Lead Perfomance @Ankorstore
Si vous voulez en discuter avec nous👇
Passez de Census ou Hightouch à DinMo
Le tout en quelques minutes, avec un accompagnement personnalisé de notre équipe. A vous les fonctionnalités no-code sans coûts supplémentaires !
Les critères de choix
Avant d'acheter un outil Reverse ETL ou d'essayer de le construire vous-même, il est important de connaître les principales fonctionnalités à rechercher :
Compatibilité avec vos destinations préférées : La pertinence d'un outil Reverse ETL dépend largement de sa compatibilité avec vos destinations d’intérêt. Lors du choix d'un outil, pensez à vos besoins actuels et futurs. Certaines destinations ne sont pas encore disponibles sur la plupart des éditeurs. Par exemple, Batch est uniquement disponible avec DinMo.
Service de sync robuste : La synchronisation des données est un aspect crucial des outils Reverse ETL. Elle doit être rapide et fiable. Choisissez un fournisseur qui utilise une approche “différentielle” pour la synchronisation des données, qui n'envoie que les données nouvelles ou mises à jour. Cela peut économiser du temps et de l'argent.
Observabilité : Un outil Reverse ETL doit fournir des capacités d'observabilité pour une détection rapide des erreurs et doit aider à les résoudre. Des fonctionnalités d'alerte et des messages d'erreur clairs peuvent faire gagner du temps aux équipes techniques.
Sécurité : La protection des données est essentielle. Votre fournisseur doit répondre à toutes vos exigences pour garantir la sécurité de vos données sensibles. Cela comprend par exemple la conformité avec des réglementations telles que RGPD/CCPA, des certifications comme SOC 2, des pratiques sécurisées de stockage des données, et des méthodes robustes de cryptage des données.
Facilité d'utilisation : Les outils Reverse ETL sont conçus pour simplifier la gestion des données. Ils doivent donc être faciles à utiliser. Cherchez des fonctionnalités telles qu'un Segment Builder sans code, des interfaces utilisateurs intuitives, et des processus de mappage de données simples qui ne nécessitent pas de connaissances techniques avancées (par exemple sur les APIs sous-jacentes).
Facilité de mise en œuvre : Un bon outil Reverse ETL doit être facile à configurer. Le modèle de données doit être suffisamment flexible pour répondre à vos besoins spécifiques, et toute personne ayant accès au data warehouse doit être capable de configurer l'outil facilement.
Support : Des experts en activation de données et des ressources (comme une documentation de qualité et des tutoriels) doivent être disponibles pour aider votre équipe à surmonter des obstacles éventuels. DinMo est l'unique Reverse ETL du marché à avoir un support français.
Tarification transparente et évolutive : Le prix est un facteur important à prendre en compte lors du choix d'un outil. Assurez-vous de comprendre la structure tarifaire de l'éditeur. Pensez également à comment le coût pourrait évoluer avec votre utilisation. Même si les prix initiaux semblent raisonnables, ils peuvent rapidement augmenter avec l'augmentation de vos besoins. Il est donc important de choisir une solution qui peut évoluer avec vous.
Conclusion
Alors que les entreprises s'efforcent de réussir leur transformation digitale, les Reverse ETL apparaissent comme un outil clé pour libérer le véritable potentiel des données centralisées dans un data warehouse. En envoyant les données aux applications de l'entreprise, les Reverse ETL sont des outils de choix dans le Modern Data Stack. En comprenant ses fonctions et ses avantages, les organisations peuvent s'engager sur la voie royale d'une stratégie data-driven.
👉🏼 Si vous avez envie d'améliorer votre Data Stack en adoptant des outils de première classe et souhaitez investir dans une solution de Reverse ETL actionnable en quelques minutes, réservez une démo avec nous.
💡 Si vous voulez en savoir plus sur les Reverse ETL ou avez besoin d'aide sur des sujets d'activation de la donnée, n'hésitez pas à me contacter : alexandra@dinmo.com.