#Azure et #Snowflake votre PaaS vers la modernisation BI – #1 ingestion des données

Snowflake est la seule solution de Data Warehousing entièrement pensée et conçue pour le cloud :

  • Plus performante qu’un Amazon Redshift ou un Azure SQL Datawarehouse, de performances équivalentes à Google Big Query mais avec un véritable respect de la norme SQL ANSI 2016
  • D’une grande simplicité de gestion ; pas besoin de jouer au plombier et de mettre en œuvre des usines à gaz pour effectuer des opérations de scale up/down, scale in/out, suspend/ resume
  • Permet de manipuler toutes vos données CSV | JSON | AVRO | ORC | PARQUET | XML avec un seul langage : le SQL. Et ce qu’elle que soit la volumétrie et la vélocité des données
  • Cela reste un entrepôt de données et non un moteur OLTP, les bonnes pratiques à adopter sont donc une modélisation en ETOILE| FLOCON | DATAVAULT et d’opter pour des traitement ELT et non ETL pour profiter de l’élasticité de calcul de la plateforme. N.B: pour éviter les goulets d’étranglement des ETL traditionnels, il est aussi possible de faire du Data Engineering At Scale avec Azure Databricks (ce dernier possède un connecteur natif Snowflake), mais cela fera l’objet d’un autre article.

Il y a un de cela un peu plus d’un an, nous (Infeeny) étions en compétition face à GCP et Snowflake chez un client voulant moderniser son DWH on-premises tout en conservant son ETL Talend. Lire la suite