Multidimensionnel ou relationnel ? Lequel de ces systèmes vous convient le mieux ?

Multidimensionnel ou relationnel ? Lequel de ces systèmes vous convient le mieux ?

Les bases de données relationnelles et multidimensionnelles diffèrent en tous points : tableaux, colonnes et lignes, cubes, mesures et dimensions; requêtes sur des jointures par rapport à des agrégations précalculées sur plusieurs dimensions; Langage de requête structuré (SQL) vs expressions multidimensionnelles MDX.. La liste est longue.

Pourtant, si vous posez la question à un éditeur préférant l’un des deux camps, il vous expliquera que son système peut exécuter n’importe quelle tâche avec succès. L’analyse bidimensionnelle, par exemple, peut parfaitement être effectuée par ces deux types de systèmes.

La plupart du temps, il est préférable de laisser de côté les évaluations techniques et de partir plutôt de vos besoins. Quel type d’utilisateur analysera les données et dans quel but ? Quelle sera la profondeur de l’analyse ? À quelle fréquence l’analyse sera-t-elle exécutée ? Quelle doit être la rapidité d’affichage des résultats ? Ce ne sont là que quelques-unes des questions que vous devriez vous poser.

Voici quelques conseils sur les différents points à prendre en compte afin de prendre votre décision et répondre à la question la plus importante : « Lequel de ces systèmes vous convient le mieux ? »

Quelle sera la complexité de l’analyse ?

L’une des questions fondamentales à se poser dès le départ est celle de la profondeur et la complexité de l’analyse. Votre analyse ne portera-t-elle que sur quelques dimensions statiques, comme dans «la rentabilité de la gamme de produits XYZ pour le troisième trimestre dans la région Nord-Est» ? Ou les requêtes impliqueront-elles potentiellement des dizaines voire des centaines de dimensions ? Une enseigne du e-commerce peut avoir plusieurs magasins en ligne, proposant chacun des milliers de produits (jouets, livres, informatique, etc.). Chaque boutique en ligne possède divers attributs que vous souhaitez associer à des informations sur les stocks, les prix proposés par les concurrents et le trafic web afin d’effectuer des analyses pertinentes. Cela peut facilement représenter des centaines de dimensions.

Si les analyses métier prévues ne comportent que quelques dimensions et une logique simple, vous n’avez peut-être pas besoin de plus qu’une base de données relationnelle. Dans le cas contraire, vous devriez envisager des systèmes de SGBD multidimensionnels.

Un autre aspect à considérer est la logique métier impliquée. Votre analyse nécessite-t-elle des calculs simples, tels que le calcul de sommes ou de moyennes, ou implique-t-elle une logique plus complexe comprenant des matrices, des calculs statistiques ou des mesures prédictives? Avez-vous besoin de procéder à une analyse de type « what-if » pour évaluer différents scénarios et bénéficier d’aide à la prise de décision ? Pour une analyse aussi complexe, vous souhaitez un type de fonctionnalité de mesure calculé par OLAP, afin que les nouvelles dimensions soient automatiquement prises en compte sans avoir à écrire de nouvelles requêtes, configurer des dashboards et des rapports.

 

Quelle doit être la rapidité d’affichage des résultats ?

Lorsque l’analyse est effectuée à des fins de reporting – par exemple, à la fin de chaque trimestre d’activité – la rapidité peut ne pas être une priorité. L’analyse peut être exécutée pendant la nuit et les résultats affichés le lendemain matin. Mais si l’analyse doit impérativement contribuer à une prise de décision rapide, la performance devient cruciale. Lorsqu’une institution financière évalue le risque de différentes possibilités de trading, les décisions doivent être prises dans l’instant.

Évaluez donc les besoins en performances de votre analyse et prenez en compte le volume de données. Les solutions OLAP, par exemple, fournissent une solution adéquate pour l’analyse d’un petit nombre de dimensions. Cependant, lorsqu’ils tentent de gérer une analyse plus intensive comportant de nombreuses dimensions, les systèmes OLAP existants ont tendance à s’effondrer en raison du « curse of dimensionality« . Les systèmes OLAP modernes utilisent la technologie in-memory pour relever de tels défis et permettre une navigation illimitée à grande vitesse.

 

À quelle fréquence l’analyse sera-t-elle exécutée ?

Suivant votre secteur d’activité et votre fonction, se baser sur les données les plus à jour peut être important. A quelle fréquence ces données évoluent-elles ? L’analyse doit-elle être effectuée sur des données récentes, ou cela n’a-t-il pas d’importance ? Par exemple, générer des rapports à un rythme hebdomadaires peut être suffisant pour un service de comptabilité. En revanche, pour des sociétés comme Fedex, effectuer des analyses portant sur la localisation des colis à partir de données datant de la veille est déjà inacceptable. Ces informations doivent être intégrées en temps réel pour leur permettre de réagir à tout imprévu sans impacter les délais de livraison communiqués à leurs clients.

Par le passé, une distinction très claire était établie entre les systèmes OLTP et OLAP. OLTP signifiait centré sur les transactions et OLAP, axé sur les analyses. L’arrivée des Big Data a brouillé la frontière nette entre ces deux approches. De nos jours, les systèmes de mixed workload apportent une réponse aux deux besoins. Un avantage significatif du mixed workload est qu’il supprime la latence entre l’environnement transactionnel dans lequel les données sont créées et l’environnement analytique qui permet leur exploration. Par conséquent, vous pouvez exécuter des requêtes en une fraction de seconde sur des données actualisées à la volée.

 

Ce qui précède n’est en aucun cas une liste exhaustive de questions d’évaluation. Avant de choisir un système multidimensionnel ou relationnel, vous devez approfondir la cartographie et la hiérarchisation de vos besoins.

ENTRER EN CONTACT

Questions? Vous voulez en savoir plus sur nos solutions?




Follow us: linkedin twitter