Comprendre, enfin, les data-lakes !

Dans son dernier livre blanc, Converteo (ADLPerformance), cabinet de conseil en stratégie digitale et cross-canal, dresse un panorama des data-lakes. Cette analyse inédite met en lumière les avantages d’une technologie innovante, sa complémentarité avec les autres outils de collecte, d’analyse et d’activation des données et présente des exemples d’usages par les marques. Elle démontre ainsi l’intérêt de recourir à un data-lake dans un écosystème digital.

Le data-lake permet d’exploiter et de valoriser le potentiel data des entreprises

Part d’une infrastructure de « big data », le data-lake ou lac de données est un espace de stockage qui permet de traiter des volumes d’informations quasi illimités issus de tout type de sources.

Il présente de nombreux avantages. Connecté à l’écosystème digital et permettant un stockage quasi illimité, il offre l’opportunité à l’entreprise de centraliser et conserver de larges quantités de données, qu’elles soient structurées ou non.

Le data-lake offre aussi, au travers d’une architecture évolutive et pérenne, la possibilité de comparer et analyser rapidement ces données de manière exhaustive et transversale. Par conséquent, il aide à désiloter la donnée au sein de l’organisation.

La flexibilité, la qualité de la donnée et l’agilité qu’offre le data-lake permettent donc d’alimenter de véritables campagnes de marketing data-driven.

De nombreux projets big data, au sein d’une multitude de secteurs (loisirs, banques/assurances, retail ou encore transports/industrie) peuvent bénéficier de cette opportunité technologique dont les champs d’application sont très divers : expérience client, marketing media, optimisation industrielle, innovation produit/service…

Voici quelques exemples d’organisations ayant déjà adopté un data lake afin d’améliorer leur service client, d’optimiser leur tarification ou encore d’améliorer les process opérationnels.

9259676-14786107.jpg

Le data-lake, une solution complémentaire de collecte et d’exploitation de la donnée

Alors que le Datawarehouse a uniquement vocation à stocker les données structurées (considérées comme « utiles ») - généralement des métriques quantitatives - le data-lake stocke toute typologie de données. Il se présente sous une architecture flexible, une structure évolutive et non figée alors que le Datawarehouse présente un espace de stockage standardisé et une architecture qui repose sur des tables relationnelles. Les finalités divergent et se complètent donc : des analyses répétitives pour le datawarehouse et des données traitées selon les besoins pour le data-lake (logique Extract-Transform-Load vs logique Extract-Load-Transform).

En outre, le data-lake est également complémentaire à la mise en place d’une Data Management Platform (DMP) qui ne stocke pas les données personnelles des visiteurs, prospects et clients (PII) et les données sensibles de l’entreprise. Data-lake et DMP divergent aussi en ce qui concerne le mode de connexion : la DMP est reliée en temps réel à l’écosystème digital tandis que le data-lake n’a pas vocation à être connecté.

DMP et data-lake ont vocation à communiquer : le date-lake agrège et traite la donnée avant de la transformer et de la transmettre. La DMP, outil d’identification opérationnel, récupère l’intelligence et l’active sur différents canaux on et off-line.

9259676-14786065.jpg

Deux modes d’hébergement possible : On Premise et Cloud Services

L’entreprise doit choisir le mode d’hébergement qui répondra le mieux à ses besoins en termes de gouvernance, d’évolution, de facilité de déploiement, les deux modes d’hébergement présentant chacun des avantages spécifiques.

9259676-14786068.jpg

Les pré-requis à la mise en place d’un projet data-lake

Le déploiement d’un data-lake est facilité par la constitution d’une équipe projet ad hoc bénéficiant d’un solide soutien de la part de la direction.

L’agilité nécessaire à un projet data-lake, la spécificité des ressources pour son exploitation ainsi que la transversalité de ses implications dans l’organisation nécessitent souvent sa construction en marge ou en parallèle d’un système d’information historique auquel il sera étroitement lié.

La réussite du projet dépend des 3 étapes décrites ci-dessous :

9259676-14786076.jpg

Source