Snowflake Data Warehouse

Snowflake es un data warehouse analítico en la nube (SaaS) que permite elegir con qué proveedor de servicios trabajar por debajo y que incluye su propio motor SQL pensado para la nube. Por buscar similitudes con otras herramientas existentes en las diferentes plataformas, Snowflake se asemejaría a: BigQuery en Google Cloud Platform, Redshift en AWS y Synapse en Azure.

Snowflake está construido completamente sobre infraestructura en cloud y, por ello, todos sus componentes se ejecutan sobre una infraestructura de nube pública (a excepción de SnowSQL, su cliente de línea de comandos, el cual es opcional), lo que hace que no exista ningún software que instalar, configurar y/o administrar.

SnowFlake Graph

Snowflake utiliza un repositorio de datos centralizado para datos persistentes que es accesible desde todos los nodos del DWH, pero a la hora de procesar las consultas cada nodo o cluster guarda una parte de esos datos localmente para su procesamiento en paralelo.

Incluye tres capas principales: Database storage, Query processing y Cloud services.

  • Database storage: La capa en la que se encuentran los datos. Una vez que estos suben a la nube, Snowflake se encarga de reorganizarlos en su propio formato. Con esto consigue gestionar la organización, tamaño de fichero, estructura, compresión, metadatos, etc. para mejorar el rendimiento. Como contrapartida, estos datos solamente pueden ser consultados mediante consultas SQL a través de Snowflake.
  • Query processing: Las consultas son realizadas por esta capa utilizando “almacenes virtuales”. Cada “almacén” es un cluster compuesto de múltiples nodos para el trabajo en paralelo, los cuales Snowflake se encarga de gestionar en el proveedor de servicios que hayamos elegido.
  • Cloud services: Es un conjunto de servicios que se encargan de coordinar las actividades de Snowflake, desde el login hasta organizar las consultas de los usuarios. Estos servicios también corren sobre instancias en el proveedor de servicios elegido, y también están gestionadas por Snowflake.

Los proveedores actualmente soportados por Snowflake son: AWS, Microsoft Azure, Google Cloud.

Snowflake UI es una interfaz de usuario basada en web desde la que se puede acceder a todos los aspectos de gestión y uso de Snowflake.

Snowflake proporciona a las organizaciones la posibilidad de crear sus propios intercambios de datos para mejorar la colaboración a través de Data-Sharing; funcionalidad que permite intercambiar datos de forma segura, y a la cual puede accederse desde la pestaña Shares del menú.

Tags: Snowflake Data Warehouse Cloud Nube AWS Microsoft Azure Google SQL Query Storage Cloud Services Data-Sharing

Utilizamos cookies propias y de terceros para mejorar nuestros servicios y elaborar información estadística. Al clicar en "Aceptar" o si continúa navegando, acepta su uso. más información