La autogestión de las soluciones de almacenamiento de datos requiere tiempo y recursos significativos para su administración, especialmente para los conjuntos de datos extensos. Carga, monitoreo, puesta a punto, elaboración de respaldos y recuperación de fallas que consumen mucho tiempo y costos asociados a la construcción, mantenimiento y crecimiento de almacenes de datos tradicionales; lo que es caro.
Las compañías más grandes se han resignado a pagar altos costos por su almacenamiento de datos, mientras que las más pequeñas comúnmente encuentran hardware y software de costos muy elevados, dejando a la mayoría de estas organizaciones sin capacidad para almacenamiento de datos.
Amazon Redshift pretende solucionar este problema y administrar todo el trabajo necesario para configurar, operar y escalar el almacenamiento de datos, desde la capacidad hasta la supervisión y respaldo del clúster, así como la aplicación de parches y actualizaciones. Escalar todo un clúster para mejorar el desempeño o incrementar la capacidad de Amazon Redshift es simple y no compromete tiempo de inactividad, mientras que el servicio supervisa continuamente el estado de dicho clúster y reemplaza automáticamente cualquier componente necesario.
Amazon Redshift también está disponible a un precio bastante económico (a una fracción de almacenes de datos) para permitir que las compañías grandes reduzcan de manera significativa sus costos y las pequeñas puedan aprovechar los servicios de análisis que vienen junto con el almacenamiento de datos de gran alcance.
“En los últimos años, una de las solicitudes más recurrentes de los clientes es que AWS construya un servicio de almacenamiento de datos”, menciona Raju Gulabani, vicepresidente de Servicios de Bases de Datos de AWS. “Las compañías están cansadas de pagar precios tan altos para su almacenamiento de información y las pequeñas empresas no pueden costear el análisis de la vasta cantidad de datos que reúnen (a menudo descartan el 95 por ciento de sus datos). Esto frustra a los clientes, ya que saben que la nube ha hecho más fácil que nunca y menos costoso recolectar, almacenar y analizar datos. Amazon Redshift no solo significa precios más bajos de almacenamiento, sino que también hace más fácil la tarea de analizar grandes cantidades de datos de manera rápida, mientras que el desempeño actual varía basado en cada requerimiento específico del cliente. Nuestras pruebas internas han mostrado una mejora en el desempeño 10 veces mejor comparadas con las bases relacionales estándar de almacenamiento de información, teniendo la habilidad de analizar rápidamente petabytes de datos a costos bajos que cambian completamente el juego para nuestros clientes”.
Amazon Redshift utiliza varias técnicas, incluyendo columnas de datos, compresión avanzada y niveles de desempeño altos en IO y redes para alcanzar significativamente un mejor desempeño que las bases tradicionales para almacenamiento y análisis en cargas de trabajo.
Al distribuir y paralelizar consultas a través de un grupo de nodos, Amazon Redshift facilita la obtención de alto rendimiento sin necesidad de que los clientes realicen consultas manuales, mantengan índices o pre-ingresen resultados. Amazon Redshift está certificado por herramientas de inteligencia populares que incluyen Jaspersoft y MicroStrategy.
Desde su lanzamiento global en 2013, los clientes de Amazon Redshift han creado decenas de miles de pruebas y producciones de almacenamiento de datos y el servicio ha sido adoptado por clientes de todas las industrias incluyendo publicidad, servicios financieros, manufactura, medios, salud, redes sociales, aplicaciones móviles y juegos. Hoy los clientes como Financial Times, Nasdaq, OMX, Nokia, y Pinterest están utilizando Amazon Redshift para una variedad de casos de análisis, incluyendo almacenamiento de datos de su empresa, valor de la vida de los clientes, trafico, nivel de compromiso del usuario, y publicidad en línea.
Los clientes de Amazon Redshift tienen dos opciones de nodos: Nodos de Cómputo Denso y Nodos de Almacenamiento Denso. Los Nodos de Almacenamiento Denso para Amazon Redshift son ideales para los clientes que tienen menos de 500 GB en su almacenamiento de datos o para clientes con más de 500 GB de información que se centran primordialmente en el desempeño.
Con los Nodos de Cómputo Denso, los clientes pueden escalar a cientos de terabytes, dándoles el mayor ratio de memoria en CPU e I/O para almacenamiento. Si el desempeño no es crítico para el uso de un cliente, o si ellos desean priorizar la reducción de costos a otro nivel, puede utilizar Nodos de Almacenamiento Denso y escalar arriba de un petabyte o más capacidad para comprimir los datos de usuario. Escalando los grupos, activando y desactivando entre los tipos de nodos que se requieran con una simple API o dando algunos clics en el panel de control de AWS.
“La compañía de Almacenamiento de datos de Amazon gestiona petabytes de datos para cada grupo en Amazon. Estamos viendo mejoras significativas de rendimiento aprovechando Amazon Redshift sobre nuestro actual almacenamiento de información de varios millones de dólares”, dijo Erik Seberg, Gerente del Equipo de Almacenamiento de Datos en Amazon.com.
“Algunas consultas de múltiples horas terminan en menos de una hora, y algunas consultas que se tomaban de 5 a 10 minutos en nuestro almacén de datos actual ahora están realizándose en segundos con el cambio a Amazon Redshift. Las primeras estimaciones del costo de Amazon Redshift arrojan que estará por debajo de una décima parte del costo de nuestra solución actual. Amazon Redshift provee una manera rentable de escalar de acuerdo a las necesidades de análisis de datos”.
Amazon Redshift incluye tecnología bajo licencia de ParAccel y está disponible con dos tipos de nodos subyacentes, que incluyen de 2 a 16 terabytes de datos comprimidos del cliente por nodo. Un clúster que puede escalar a 100 nodos en un precio bajo demanda que comienza en solo 1.36 dólares por hora por un almacenamiento con capacidad de 2 terabytes, escalando linealmente hasta petabytes o más. Una instancia reservada baja el precio efectivo a 0.509 dólares por hora, que es menos de una décima parte del precio de la tecnología comparable para los clientes actualmente.
En 2015, el GFG (Global Fashion Group), minorista en línea propietario de las marcas Dafiti, Kanui y Tricae ha consolidado sus servicios de TI. La compañía necesitaba herramientas de inteligencia de negocios más ágiles y una solución que pudiera procesar grandes volúmenes de datos en tiempo real. “Con Redshift ahora podemos analizar cientos de miles de millones de datos, con su agilidad podemos entender mejor y más rápido el comportamiento del consumidor, haciendo posible la búsqueda de mejoras para la experiencia del usuario. Ahora somos más elásticos, rápidos, creativos y enfocados en nuestro negocio”, mencionó el Director de TI de la compañía, Caio Motta.
Lo clientes pueden activar los grupos de Amazon Redshift utilizando el panel de control de AWS o su Comando de Línea de Interface (CLI). Los usuarios que nunca han manejado Redshift pueden adquirir una prueba gratuita de dos meses.