Un datawarehouse classique n’est plus suffisant
Aujourd'hui, un entrepôt de données classique ne suffit plus pour organiser les données selon les normes actuelles. En raison notamment de l’évolution de l’Internet des Objets, une profusion de données (potentielles) sont disponibles. Ces énormes collectes de données se caractérisent par quatre dimensions, également connues comme les 4 V du big data.
- Volume
L'ampleur des ensembles de données à analyser et à traiter est devenue beaucoup plus importante. Rien que le volume des données nécessite d’autres technologies de traitement que les capacités traditionnelles de stockage et de traitement.
- Vélocité
La vitesse à laquelle les informations sont transmises a également énormément augmenté. Avec l’arrivée de la 5G, nous allons encore évoluer vers un traitement en temps réel parce que les données peuvent ainsi être échangées rapidement.
- Variété
Il existe de nombreuses sources qui fournissent différents types de données. Auparavant, vous disposiez de données structurées qui arrivaient au datawarehouse. Aujourd'hui, il y a aussi des données semi-structurées ou non structurées, et une adaptation de l’architecture s’impose. Vous pourriez même faire appel à des données de tiers. En établissant les liens corrects entre toutes ces données disponibles, un contexte est créé et des formes de création de valeur plus complexes sont possibles.
- Véracité
Il s’agit de la qualité des données. La qualité et l’exactitude requièrent davantage d’attention. Les données doivent représenter la réalité. Si une certaine perception ou un certain préjugé est intégré dans les données sources, vous prolongez cette perception et en faites une vérité.
Une plateforme de données adaptée à vos besoins
Une plateforme de données qui tient compte de toutes ces dimensions occupe une place centrale dans une organisation axée sur les données. De nombreuses entreprises travaillent actuellement avec une version très simple ou disposent de données dans différents silos. Pour exploiter tout le potentiel des données, celles-ci doivent être centralisées. D’autres spécifications de la plateforme doivent être définies en fonction des besoins.
La solution la plus simple consiste à opter pour une plateforme via un fournisseur de cloud. Les arguments « oui mais » les plus fréquemment entendus concernent la sécurité, avec des sujets tels que le respect de la vie privée et le RGPD. Si de tels aspects jouent un rôle, vous pouvez opter pour la stratégie « oui et » sous la forme d’une solution hybride. Vous pouvez par exemple conserver localement les données les plus sensibles.
Un tel fractionnement peut également s’avérer intéressant sur le plan financier. La puissance de calcul dans le cloud ne coûte en effet que si vous l’utilisez. Un tel modèle hybride peut constituer une première étape vers une propre plateforme de données moderne.
À cela s’ajoute encore la distinction entre stockage et puissance de calcul. Celle-ci facilite l’application de mesures de sécurité poussées. Il est préférable de mener une réflexion préalable à cette distinction afin qu'elle soit la plus efficace et optimisée possible. Gardez à l’esprit qu’une plateforme n’est pas un but en soi, tout doit être placé sous le signe de la création de valeur à l’aide de données.