Desplazamiento al rojo del Amazonas es un servicio de almacenamiento de datos en la cúmulo, totalmente ventilado y a escalera de petabytes. Puede utilizar Amazon Redshift para ejecutar consultas complejas en petabytes de datos estructurados y semiestructurados de forma rápida y efectivo, integrándose perfectamente con otros servicios de AWS.
Amazon Redshift sin servidor le ayuda a ejecutar y progresar prospección en segundos sin tener que configurar, ordenar o progresar la infraestructura del almacén de datos. Aprovisiona automáticamente capacidad de almacenamiento de datos y escalera de forma inteligente los capital subyacentes para ofrecer un rendimiento rápido para cargas de trabajo exigentes y usted paga solo por la capacidad informática que utiliza. Por otra parte, con Almacenamiento administrado por Amazon Redshiftpuede optimizar aún más su almacén de datos ampliando el almacenamiento y la computación de forma independiente y pagando solo por el almacenamiento que utiliza.
Aggiornamento de su almacén de datos desde instancias de computación densa (DC2) de Amazon Redshift a Amazon Redshift sin servidor desbloquea estas ventajas y proporciona una experiencia de legatario mejorada y operaciones simplificadas, ofreciendo una posibilidad más efectivo y escalable para el prospección de datos.
En esta publicación, le mostramos el proceso de modernización de instancias DC2 a Amazon Redshift Serverless. Cubriremos:
- Evaluar su configuración flagrante y determinar si una modernización es adecuada para usted
- Planificación y preparación para la modernización
- Instrucciones paso a paso para el proceso de modernización
- Optimización posterior a la modernización y mejores prácticas
¿Por qué poner al día a Amazon Redshift Serverless?
Al utilizar Amazon Redshift Serverless, puede ejecutar y progresar prospección sin ordenar la infraestructura de almacenamiento de datos. Cuando actualiza de instancias DC2 a Amazon Redshift Serverless, obtiene los siguientes beneficios:
- Operaciones simplificadas: Acceda y analice datos sin menester de configurar, ajustar y ordenar clústeres de computación.
- Optimización cibernética del rendimiento: Ofrezca un detención rendimiento constante y operaciones simplificadas para cargas de trabajo exigentes y volátiles con escalado obligatorio y Escalado y optimización impulsados por IA.
- Precios de cuota por uso: La estructura de precios flexible le cobra sólo durante el uso activo; pagas sólo por lo que usas.
- Mantenimiento en estría: Amazon Redshift Serverless administra automáticamente las actualizaciones y parches del sistema sin menester de períodos de mantenimiento, lo que ayuda a simplificar el funcionamiento consumado de su almacén de datos.
- Almacenamiento y computación desacoplados: Controle los costos escalando y pagando por la computación y el almacenamiento por separado con el almacenamiento administrado de Amazon Redshift.
- Ataque a nuevas capacidades: Utilice funciones avanzadas que incluyen escrituras de intercambio de datos, Ingestión de transmisión de desplazamiento al rojo, ETL ceroy otras capacidades.
Itinerario de tallas
Para poner al día de DC2 a Amazon Redshift Serverless, debe comprender la equivalencia de tamaño. La sucesivo tabla muestra las configuraciones de tamaño sugeridas al poner al día desde el tipo de nodo DC2.
Tenga en cuenta que la disponibilidad de las configuraciones de la Dispositivo de procesamiento Redshift (RPU) varía según Región de AWS.
| Tipo de nodo existente | Número existente de nodos | Aggiornamento sin servidor de Amazon Redshift |
| DC2.alto | 1–4 | Comience con 4 RPU |
| DC2.alto | 5–7 | Comience con 8 RPU |
| DC2.alto | 8–32 | Agregue 8 RPU por cada 8 nodos de DC2.large |
| DC2.8xgrande | 2–32 | Agregue 16 RPU por nodo (hasta un mayor de 1024 RPU) |
Estas estimaciones de tamaño proporcionan un punto de partida flexible diseñado para ayudarle a emplear al mayor Amazon Redshift Serverless. La configuración ideal para sus deposición dependerá de factores como el estabilidad deseado entre costo y rendimiento y los requisitos específicos de latencia y rendimiento de su carga de trabajo. Para optimizar aún más el tamaño según sus requisitos específicos, puede utilizar uno o más de los siguientes enfoques:
- Pruebe su carga de trabajo de antemano: Antaño de portar a Amazon Redshift Serverless, evalúe los requisitos de rendimiento de su carga de trabajo en un entorno que no sea de producción. El Utilidad de prueba de manejo de Amazon Redshift simplifica este proceso simulando sus cargas de trabajo de producción en diferentes configuraciones sin servidor. Puede utilizar los resultados para ayudar a identificar el estabilidad perfecto entre rendimiento y costo y tomar decisiones informadas sobre su configuración. Para obtener orientación paso a paso sobre el uso de la utilidad Test Drive para actualizaciones de DC2 a Serverless, consulte la Taller de migración al Redshift de Amazon. La ejecución de estas pruebas de rendimiento antiguamente de la migración le ayuda a identificar los ajustes necesarios en su configuración antiguamente de implementarla en producción.
- Monitorear en producción: Posteriormente de poseer implementado su carga de trabajo, supervise de cerca el rendimiento y la utilización de capital durante un período de tiempo que represente sus cargas de trabajo típicas. Basado en el métricas observadasluego puede aumentar o aminorar los capital según sea necesario para conseguir el mejor estabilidad entre rendimiento y costo.
- Escalado y optimización impulsados por IA: Considere la posibilidad de utilizar Amazon Redshift Serverless con Escalado y optimización impulsados por IA para dimensionar automáticamente Amazon Redshift Serverless para sus deposición de carga de trabajo.
Un enfoque metódico para la garra del tamaño, que combina pruebas de preproducción y monitoreo continuo de la producción, ayuda a avalar que su configuración sin servidor de Amazon Redshift se alinee con su carga de trabajo.
Actualice a Amazon Redshift sin servidor
Para poner al día a Amazon Redshift Serverless, puede utilizar una restauración instantánea para tener lugar directamente de Amazon Redshift a Amazon Redshift Serverless, como se muestra en la sucesivo figura. Una restauración de instantáneas restaura datos y objetos por otra parte de los usuarios y sus permisos, configuraciones y estructuras de esquema asociados. Al utilizar la restauración de instantáneas para la migración, puede validar los almacenes sin servidor de Amazon Redshift de destino sin afectar su clúster de producción de Amazon Redshift DC2. Incluso puede utilizar la restauración de instantáneas para portar sus cargas de trabajo de Amazon Redshift DC2 a diferentes regiones o zonas de disponibilidad.

Requisitos previos para portar mediante una restauración de instantánea
- Cree un reunión de trabajo de Amazon Redshift Serverless con un espacio de nombres. Para obtener más información, consulte creando un reunión de trabajo con un espacio de nombres.
- Amazon Redshift Serverless está enigmático de forma predeterminada. Amazon Redshift Serverless todavía es compatible cambiar la secreto AWS KMS para el espacio de nombres para que pueda cumplir con las políticas de seguridad de su estructura.
- Verifique que el espacio de nombres de Amazon Redshift Serverless que está intentando restaurar esté asociado a un reunión de trabajo de Amazon Redshift Serverless.
- Para restaurar desde un clúster de Amazon Redshift aprovisionado a Amazon Redshift Serverless, el Administración de camino e identidad de AWS (IAM) El legatario o rol debe tener los siguientes permisos:
redshift-serverless:RestoreFromSnapshot,CreateNamespaceyCreateWorkgroup. Para obtener más información, consulte Restauración sin servidor de Amazon Redshift.
Refrescar usando la consola
Utilice los siguientes pasos en la Consola de empresa de AWS para Amazon Redshift para poner al día su clúster DC2 a Amazon Redshift Serverless mediante el método de restauración de instantáneas.
- En la consola Redshift, elija Clústeres en el panel de navegación. Seleccione su clúster y luego elija Mantenimiento.

- Nominar Crear instantánea para crear una instantánea manual del clúster aprovisionado de Amazon Redshift existente.

- Ingrese un identificador de instantánea, seleccione el período de retención de la instantánea y luego elija Crear instantánea.

- Seleccione la instantánea que desea restaurar en Amazon Redshift Serverless de la relación y luego elija Restaurar instantánea y seleccione Restaurar al espacio de nombres sin servidor.

- Bajo Escoger espacio de nombresseleccione su espacio de nombres sin servidor de destino en la relación desplegable y luego elija Restaurar.

- El tiempo de restauración variará según su bulto de datos.

- Una vez completada la restauración, verifique la migración de datos conectándose a su espacio de trabajo sin servidor de Amazon Redshift mediante el Editor de consultas de Amazon Redshift v2 o su cliente SQL preferido.
Para obtener más información, consulte Crear una instantánea de su clúster aprovisionado.
Actualice mediante la CLI de AWS
Utilice los siguientes pasos en el Interfaz de estría de comandos de AWS (AWS CLI) para poner al día su clúster DC2 a Amazon Redshift Serverless mediante el método de restauración de instantáneas.
- Cree una instantánea del clúster de origen:
- Verifique que la instantánea exista:
- Restaure la instantánea en su espacio de nombres de Amazon Redshift Serverless:
Para obtener más información, consulte Restaurar desde una instantánea del clúster mediante AWS CLI.
Mejores prácticas para poner al día a Amazon Redshift Serverless
Las siguientes son las mejores prácticas recomendadas al poner al día de Amazon Redshift a Amazon Redshift Serverless.
- Preactualización:
- Post-actualización:
- Refrescar conexiones existentes: Cuando migre a Amazon Redshift Serverless, se creará un nuevo punto de enlace. Actualice cualquier conexión existente con inteligencia empresarial y otras herramientas de gestación de informes.
- Observabilidad y seguimiento: Si tiene alguna aparejo de monitoreo de datos que utiliza vistas de sistemas, verifique que no haya transacciones abiertas o vacías. Es importante como mejor experiencia finalizar las transacciones. Si no finaliza ni revierte las transacciones abiertas, Amazon Redshift Serverless seguirá utilizando RPU para esas transacciones.
- Ataque: Cuando se utiliza la autenticación IAM con
dbUserydbGroupssus aplicaciones pueden penetrar a la cojín de datos utilizando el ObtenerCredenciales API. Para obtener más información, consulte Conexión mediante IAM. - Vistas del sistema: Revisa la relación de vistas del sistema unificado habitable en Amazon Redshift sin servidor.
Si sus cargas de trabajo no son adecuadas para Amazon Redshift Serverless adecuado a su naturaleza o cualquiera de las consideraciones enumeradas en Consideraciones al utilizar Amazon Redshift Serverlesspuede poner al día a instancias de Amazon Redshift RA3 siguiendo las instrucciones Itinerario de tallas RA3.
Consideraciones de costos
En esta sección, proporcionamos información para ayudarle a comprender y ordenar sus costos de Amazon Redshift Serverless.
- Puede aminorar sus costos de computación sin servidor al capacidad de reserva de antemano cuando tenga patrones de uso predecibles.
- Amazon Redshift Serverless ajusta automáticamente la capacidad según la carga de trabajo. Al establecer un conclusión mayor de RPUpuede controlar los costos limitando la ampliación del sistema.
- Amazon Redshift Serverless utiliza RPU como dispositivo informática. Si aceptablemente comienza con un valencia predeterminado de 128 RPU, puede ajustar la RPU cojín entre 4 y 1024 RPU para satisfacer sus deposición específicas de carga de trabajo y requisitos de SLA. Para obtener más información, consulte Facturación de Amazon Redshift sin servidor.
- Amazon Redshift Serverless crea automáticamente puntos de recuperación cada 30 minutos o cada vez que se producen cambios de 5 GB de datos por nodo, lo que ocurra primero. El intervalo intrascendente entre puntos de recuperación es de 15 minutos. Todos los puntos de recuperación se conservan durante 24 horas de forma predeterminada.
Si necesita conservar las copias de seguridad durante un período más dispendioso, puede crear copias de seguridad manuales. Las copias de seguridad manuales generarán gastos adicionales. costos de almacenamiento.
Escobillar
Para evitar incurrir en cargos futuros, elimine la instancia sin servidor de Amazon Redshift o el clúster de almacén de datos aprovisionado creado como parte de los pasos de requisitos previos. Para obtener más información, consulte Eliminar un reunión de trabajo y Cerrar y eliminar un clúster.
Conclusión
En esta publicación, analizamos los beneficios de poner al día instancias de Amazon Redshift DC2 a Amazon Redshift Serverless, por otra parte de las diversas opciones de modernización y algunas prácticas recomendadas. Es esencial determinar la configuración de destino de Amazon Redshift Serverless y validarla utilizando Utilidad de prueba de manejo de Amazon Redshift en entornos de prueba y explicación antiguamente de poner al día.
Comience a poner al día a Amazon Redshift sin servidor hoy implementando la práctico en esta publicación. Si tiene preguntas o necesita ayuda, comuníquese con AWS Support para obtener orientación sobre casa y diseño, por otra parte de soporte para pruebas de concepto e implementación.
Sobre los autores