D'un entrepôt de données classique à une architecture de données moderne : ce dont il faut tenir compte

D'un entrepôt de données classique à une architecture de données moderne : ce dont il faut tenir compte

20 avril 2021

Data

Chaque organisation axée sur les données (soon to be) a besoin d’une plateforme de données moderne. Une telle entreprise veut en effet faire plus avec ses données que seulement réaliser un reporting efficace. Les données sont également placées au cœur de l’entreprise afin de créer de la valeur, d’assurer une organisation plus efficace et même d’offrir de nouveaux services aux clients. Outre une culture et des processus optimisés, une plateforme technologique intelligente est également nécessaire pour tout faciliter.

Un datawarehouse classique n’est plus suffisant

Aujourd'hui, un entrepôt de données classique ne suffit plus pour organiser les données selon les normes actuelles. En raison notamment de l’évolution de l’Internet des Objets, une profusion de données (potentielles) sont disponibles. Ces énormes collectes de données se caractérisent par quatre dimensions, également connues comme les 4 V du big data.

  • Volume
    L'ampleur des ensembles de données à analyser et à traiter est devenue beaucoup plus importante. Rien que le volume des données nécessite d’autres technologies de traitement que les capacités traditionnelles de stockage et de traitement.
     
  • Vélocité
    La vitesse à laquelle les informations sont transmises a également énormément augmenté. Avec l’arrivée de la 5G, nous allons encore évoluer vers un traitement en temps réel parce que les données peuvent ainsi être échangées rapidement.
     
  • Variété
    Il existe de nombreuses sources qui fournissent différents types de données. Auparavant, vous disposiez de données structurées qui arrivaient au datawarehouse. Aujourd'hui, il y a aussi des données semi-structurées ou non structurées, et une adaptation de l’architecture s’impose. Vous pourriez même faire appel à des données de tiers. En établissant les liens corrects entre toutes ces données disponibles, un contexte est créé et des formes de création de valeur plus complexes sont possibles.
     
  • Véracité
    Il s’agit de la qualité des données. La qualité et l’exactitude requièrent davantage d’attention. Les données doivent représenter la réalité. Si une certaine perception ou un certain préjugé est intégré dans les données sources, vous prolongez cette perception et en faites une vérité.

 

Une plateforme de données adaptée à vos besoins

Une plateforme de données qui tient compte de toutes ces dimensions occupe une place centrale dans une organisation axée sur les données. De nombreuses entreprises travaillent actuellement avec une version très simple ou disposent de données dans différents silos. Pour exploiter tout le potentiel des données, celles-ci doivent être centralisées. D’autres spécifications de la plateforme doivent être définies en fonction des besoins.

La solution la plus simple consiste à opter pour une plateforme via un fournisseur de cloud. Les arguments « oui mais » les plus fréquemment entendus concernent la sécurité, avec des sujets tels que le respect de la vie privée et le RGPD. Si de tels aspects jouent un rôle, vous pouvez opter pour la stratégie « oui et » sous la forme d’une solution hybride. Vous pouvez par exemple conserver localement les données les plus sensibles.

Un tel fractionnement peut également s’avérer intéressant sur le plan financier. La puissance de calcul dans le cloud ne coûte en effet que si vous l’utilisez. Un tel modèle hybride peut constituer une première étape vers une propre plateforme de données moderne.

À cela s’ajoute encore la distinction entre stockage et puissance de calcul. Celle-ci facilite l’application de mesures de sécurité poussées. Il est préférable de mener une réflexion préalable à cette distinction afin qu'elle soit la plus efficace et optimisée possible. Gardez à l’esprit qu’une plateforme n’est pas un but en soi, tout doit être placé sous le signe de la création de valeur à l’aide de données.

data-blog-3

Ce à quoi vous devez réfléchir lors de la mise en place d’une architecture de données moderne

Dans une organisation axée sur les données, il existe quatre phases dans lesquelles les données évoluent. Les données sont reprises dans l’architecture, traitées, consommées et utilisées. Chaque phase comporte différents éléments pour mener tout à bien. Il faut bien réfléchir à tout. De quoi avez-vous précisément besoin, à quoi cela doit-il servir, qu'est-ce que cela doit faciliter...

Premièrement, il est important que les données soient stockées sous une forme utilisable. Le travail général doit déjà avoir été effectué afin qu’un data engineer puisse utiliser son temps de manière optimale. Attention toutefois à un excès d’opérations ou de corrélations, les données doivent pouvoir être utilisées de manière globale. Une stratégie doit également être élaborée en ce qui concerne la protection des données. Lors de la classification des ensembles de données, vous déterminez les mesures de sécurité nécessaires à chaque phase de la plateforme. Attribuez aux données une catégorie de sensibilité et décidez quels éléments sont partageables. La confiance dans le domaine de la sécurité des données peut en effet disparaître très rapidement et est difficile à rétablir. Un aperçu de l’origine des données est également important pour être en règle en ce qui concerne le RGPD. Un catalogue de données vous aidera également en la matière. Vous y notez notamment quelles données existent dans l’entreprise. Lorsqu'une personne demande de supprimer ses données, on a immédiatement un aperçu de tout ce qui est présent. De nombreux autres composants sont importants pour une bonne qualité des données et une bonne gouvernance. Intégrez également des possibilités d’analyse des données. Veillez à ce qu’il existe une manière de vous plonger dans les données pour rechercher des possibilités.

Réfléchissez également à ce que vous voulez faire des données en fin de compte. Vous souhaitez créer un tableau de bord pour surveiller ce qui se passe dans un domaine spécifique de votre organisation et/ou vous souhaitez mettre en place des modèles prédictifs ou intelligents ? Outre la construction de telles visualisations ou de tels modèles, les données peuvent également être intégrées dans des applications d'entreprise existantes ou même mises à la disposition de tiers.

Finalement, les données peuvent être utilisées dans toutes sortes d’applications, après avoir parcouru un long chemin. Pourtant, cela reste le point de départ de nombreuses entreprises (« nous voulons faire quelque chose avec nos données »), elles oublient le reste du puzzle et n’obtiennent donc pas le résultat ou la valeur qu’elles espéraient. Construire un rapport ou un modèle AI n'est pas suffisant en soi. Les connaissances doivent être utilisées et mises en œuvre pour créer de la valeur ajoutée au sein de l’organisation. Si les données ne s'infiltrent pas au cœur de votre organisation, elles restent des modèles intéressants mais isolés et sans impact.

Savez-vous déjà comment vous mettre au travail pour être orienté sur les données ?

Il s’agit du troisième blog d’une série sur l’ancrage des données au cœur de l’organisation. Ne manquez pas de lire les autres blogs.

Découvrez tous les blogs
En savoir plus

Inscrivez-vous et recevez nos blogs dans votre boîte mail

Inscrivez-vous à notre newsletter

Aimeriez-vous rester au courant des nouvelles, offres et événements à propos des sujets qui vous intéressent?

Inscrivez-vous ici