Athrun Data Intelligence


En la era de la transformación digital y la toma de decisiones basada en datos, las organizaciones deben beneficiarse rápidamente los conocimientos que ofrecen para ofrecer experiencias excepcionales a los clientes y obtener una superioridad competitiva. Salesforce y Amazon han colaborado para ayudar a los clientes a descubrir el valía de los datos unificados y acelerar el tiempo de producción de conocimientos con la colaboración bidireccional. Copia cero intercambio de datos entre Nimbo de datos de Salesforce y Amazon Redshift.

En el Parte 1 En esta serie, analizamos cómo configurar el uso compartido de datos entre Salesforce Data Cloud y las cuentas de AWS de los clientes en la misma región de AWS. En esta publicación, analizamos la obra y los detalles de implementación del uso compartido de datos entre regiones entre Salesforce Data Cloud y las cuentas de AWS de los clientes.

Descripción caudillo de la alternativa

Salesforce Data Cloud ofrece una experiencia de apuntar y hacer clic para compartir datos con la cuenta de AWS de un cliente. Formación de lagos en AWS consola, puede aceptar el uso compartido de datos, crear el vínculo de posibles, valer objetos de Salesforce Data Cloud como vistas del catálogo de datos y otorgar permisos para consultar datos en vivo y unificados en Amazon RedshiftEl uso compartido de datos entre regiones entre Salesforce Data Cloud y las cuentas de AWS de un cliente es compatible con dos escenarios de implementación: Sin servidor de Amazon Redshift y clústeres aprovisionados por Redshift (RA3).

Intercambio de datos entre regiones con Redshift Serverless

El próximo diagrama de obra muestra los pasos para configurar un intercambio de datos entre regiones entre una instancia de Data Cloud en US-WEST-2 con Redshift Serverless en US-EAST-1.

La configuración del intercambio de datos entre regiones consta de los siguientes pasos:

  1. El administrador de Data Cloud identifica los objetos que se compartirán y crea un petición compartido de datos en la estrato de datos proporcionada en el US-WEST-2
  2. El administrador de Data Cloud vincula el petición compartido de datos con el destino de Amazon Redshift Data Share. Esto crea un Pegamento AWS Traza del catálogo de datos y uso compartido de posibles de Lake Formation entre cuentas mediante AWS Resource Access Manager (RAM) con la cuenta de AWS del cliente en US-WEST-2.
  3. El administrador de Lake Formation del cliente acepta la invitación para compartir datos en US-WEST-2 desde la consola de Lake Formation y otorga permisos predeterminados (preferir y describir) a un Gobierno de identidad y acercamiento de AWS (IAM) director.
  4. El administrador de Lake Formation cambia a US-EAST-1 y crea un enlace de petición que apunta a la almohadilla de datos compartida en el US-WEST-2 Región.
  5. El principal de IAM puede iniciar sesión en el editor de consultas de Amazon Redshift en US-EAST-1 y crea un esquema extranjero que hace remisión al vínculo de posibles de Datashare. Los datos se pueden consultar a través de estas tablas externas.

Intercambio de datos entre regiones con un clúster provisto por Redshift

El uso compartido de datos entre regiones en Salesforce Data Cloud y un clúster provisto por Redshift requiere pasos adicionales adicionalmente de la configuración sin servidor. Consideraciones sobre Amazon Redshift Spectrumel clúster aprovisionado y el Servicio de almacenamiento simple de Amazon El depósito (Amazon S3) debe estar en la misma región que las tablas externas de Redshift. La próximo obra muestra un patrón de diseño y los pasos para compartir datos con clústeres aprovisionados por Redshift.

Los pasos 1 a 5 de la configuración siguen siendo los mismos en el uso compartido entre regiones de Redshift Serverless y de clústeres aprovisionados. El criptográfico debe estar capacitado tanto en Redshift Serverless como en el clúster aprovisionado. A continuación, se enumeran los pasos adicionales:

  1. Cree una tabla a partir de datos compartidos con el CREATE TABLE AS SELECT Cree un petición compartido de datos en Redshift sin servidor y otorgue acercamiento al clúster aprovisionado de Redshift.
  2. Cree una almohadilla de datos en el clúster aprovisionado de Redshift y otorgue acercamiento a los principales de IAM de destino. El petición compartido de datos está dispuesto para la consulta.

La nueva tabla debe actualizarse periódicamente para obtener los datos más recientes de los objetos de Data Cloud compartidos con esta alternativa.

Consideraciones al utilizar el uso compartido de datos en Amazon Redshift

Para obtener una repertorio completa de consideraciones y limitaciones del intercambio de datos, consulte Consideraciones al utilizar el uso compartido de datos en Amazon RedshiftAlgunos de los más importantes para compartir datos con Zero Copy incluyen:

  • El intercambio de datos es compatible con todos aprovisionado Tipos de instancia RA3 (ra3.16xlarge, ra3.4xlarge y ra3.xlplus) y Redshift Serverless. No es compatible con clústeres con tipos de nodos DC y DS.
  • Para compartir datos entre cuentas y regiones, tanto los clústeres de productores y consumidores como los espacios de nombres sin servidor deben estar cifrados. Sin secuestro, no es necesario que compartan la misma esencia de criptográfico.
  • Las vistas multimotor del Catálogo de datos generalmente están disponibles en regiones comerciales donde Lake Formation, el Catálogo de datos, Amazon Redshift y Amazona Atenea están disponibles.
  • El uso compartido entre regiones está adecuado en todas Formación del pantano regiones soportadas

Prerrequisitos

El Prerrequisitos permanecen iguales en el intercambio de datos internamente de la misma región y entre regiones, lo cual es necesario antaño de continuar con la configuración.

Configurar el uso compartido de datos entre regiones

Los pasos para crear un petición compartido de datos, crear un destino de petición compartido de datos, vincular el destino de petición compartido de datos al petición compartido de datos y aceptar el petición compartido de datos en Lake Formation siguen siendo los mismos en el uso compartido de datos internamente de la misma región y entre regiones. Consulte Parte 1 de esta serie para completar la configuración.

Intercambio de datos entre regiones con Redshift Serverless

Si está utilizando Redshift Serverless, complete los siguientes pasos:

  1. En la consola Lake Formation, seleccione Bases de datos en el panel de navegación.
  2. Designar Crear almohadilla de datos.
  3. Bajo Detalles de la almohadilla de datospreferir Enlace de posibles.
  4. Para Nombre del enlace del peticióningrese un nombre para el enlace del petición.
  5. Para Región de la almohadilla de datos compartidaseleccione la región de origen de la paisaje del Catálogo de datos.
  6. El Colchoneta de datos compartida y ID del propietario de la almohadilla de datos compartida Los campos se rellenan manualmente a partir de los metadatos de la almohadilla de datos.
  7. Designar Crear para completar la configuración.

El enlace del petición aparece en la Bases de datos página en la consola de Lake Formation, como se muestra en la próximo captura de pantalla.

  1. Inicie Redshift Query Editor v2 para el espacio de trabajo Redshift Serverless Las tablas de uso compartido de datos entre regiones se montan automáticamente y aparecen en awsdatacatalogPara realizar una consulta, ejecute el próximo comando y cree un esquema extranjero. Especifique el vínculo de posibles como la almohadilla de datos del catálogo de datos, la región sin servidor de Redshift y el ID de la cuenta de AWS.
    CREATE external SCHEMA cross_region_data_share --<>
    FROM DATA CATALOG DATABASE 'cross-region-data-share' --<>
    REGION 'us-east-1' --
    IAM_ROLE 'SESSION' CATALOG_ID '<>'; --<>

  2. Actualice los esquemas para ver el esquema extranjero creado en el dev almohadilla de datos
  3. Ejecutar el show tables Comando para efectuar los objetos compartidos en la almohadilla de datos externa:
    SHOW TABLES FROM SCHEMA dev.cross_region_data_share --<>

  4. Consulte el petición compartido de datos como se muestra en la próximo captura de pantalla.
    SELECT * FROM dev.cross_region_data_share.churn_modellingcsv_tableaus3_dlm; --<>

Uso compartido de datos entre regiones con un clúster provisto por Redshift

Esta sección es una continuación de la sección mencionado con pasos adicionales necesarios para que el uso compartido de datos funcione cuando el consumidor es un clúster de Redshift aprovisionado. Consulte Compartir datos en Amazon Redshift y Compartir datos compartidos para una comprensión más profunda de los conceptos y los pasos de implementación.

  1. Cree un nuevo esquema y tabla en Redshift Serverless en la región del consumidor:
    CREATE SCHEMA customer360_data_share;
    CREATE TABLE customer360_data_share. customer_churn as
    SELECT * from dev.cross_region_data_share.churn_modellingcsv_tableaus3__dlm;

  2. Obtenga el espacio de nombres para el clúster aprovisionado Redshift Serverless (productor) y Redshift (consumidor) ejecutando la próximo consulta en cada clúster:

  3. Cree un petición compartido de datos en Redshift Serverless (productor) y otorgue el uso al clúster aprovisionado por Redshift (consumidor). Establezca los nombres de los posibles compartidos de datos, el esquema y la tabla con los títulos adecuados, y establezca el espacio de nombres con el espacio de nombres del consumidor.
    CREATE DATASHARE customer360_redshift_data_share;
    ALTER DATASHARE customer360_redshift_data_share ADD SCHEMA customer360_data_share;
    ALTER DATASHARE customer360_redshift_data_share ADD TABLE customer360_data_share.customer_churn; 
    GRANT USAGE ON DATASHARE customer360_redshift_data_share 
    TO NAMESPACE '5709a006-6ac3-4a0c-a609-d740640d3080'; --<>

  4. Inicie sesión como superusuario en el clúster provisto por Redshift, cree una almohadilla de datos desde el petición compartido de datos y otorgue permisos. Consulte Dependencia de permisos para el uso compartido de datos de Amazon Redshift para obtener orientación detallada.

El intercambio de datos ahora está dispuesto para consulta.

Puede modernizar periódicamente la tabla que creó para obtener los datos más recientes de la estrato de datos según los requisitos de su negocio.

Conclusión

El uso compartido de datos sin copia entre Salesforce Data Cloud y Amazon Redshift representa un avance significativo en la forma en que las organizaciones pueden utilizar los datos de 360 ​​grados de sus clientes. Al eliminar la condición de mover datos, este enfoque ofrece información en tiempo vivo, costos reducidos y anciano seguridad. A medida que las empresas continúan priorizando la toma de decisiones basada en datos, el uso compartido de datos sin copia desempeñará un papel crucial para liberar todo el potencial de los datos de los clientes en todas las plataformas.

Esta integración permite a las organizaciones eliminar los silos de datos, acelerar los examen e impulsar estrategias más ágiles centradas en el cliente. Para obtener más información, consulte los siguientes posibles:


Acerca de los autores

Rajkumar Irudayaraj es un director sénior de productos en Salesforce con más de 20 abriles de experiencia en plataformas y servicios de datos, con una pasión por cumplimentar experiencias impulsadas por datos a los clientes.

Sriram Sethuraman es regente sénior en papeleo de productos de Salesforce Data Cloud. Ha estado desarrollando productos durante más de 9 abriles utilizando tecnologías de big data. En su puesto flagrante en Salesforce, Sriram trabaja en la integración de Zero Copy con los principales socios de data lake y ayuda a los clientes a ofrecer valía con sus estrategias de datos.

Jason Berkowitz es regente sénior de productos en AWS Lake Formation. Tiene experiencia en educación automotriz y arquitecturas de lagos de datos. Ayuda a los clientes a orientarse con destino a los datos.

Ravi Bhattiprolu Ravi es arquitecto de soluciones para socios sénior en AWS. Trabaja con socios ISV estratégicos, Salesforce y Tableau, para ofrecer productos y soluciones innovadores y proporcionadamente diseñados que ayuden a los clientes conjuntos a obtener sus objetivos comerciales y técnicos.

Avijit Goswami Avijit es arquitecto de soluciones principal en AWS, especializado en datos y examen. Brinda apoyo a los clientes estratégicos de AWS para crear soluciones de lagos de datos escalables, seguras y de detención rendimiento en AWS mediante servicios administrados de AWS y soluciones de código hendido. Fuera de su trabajo, a Avijit le gusta desplazarse, hacer caminatas, ver deportes y escuchar música.

Ife Stewart Ife es arquitecta de soluciones principal en el segmento ISV táctico de AWS. Ha trabajado con Salesforce Data Cloud durante los últimos 2 abriles para ayudar a crear experiencias de cliente integradas en Salesforce y AWS. Ife tiene más de 10 abriles de experiencia en tecnología. Es una defensora de la multiplicidad y la inclusión en el campo de la tecnología.

Michael Ajedrez es regente técnico de productos en AWS Lake Formation. Se enfoca en mejorar los permisos de datos en todo el pantano de datos. Le apasiona permitir que los clientes creen y optimicen sus lagos de datos para cumplir con estrictos requisitos de seguridad.

Mike Patterson es regente sénior de soluciones para clientes en el segmento ISV táctico de AWS. Se ha asociado con Salesforce Data Cloud para alinear los objetivos comerciales con soluciones innovadoras de AWS para obtener experiencias de cliente impactantes. En su tiempo vacante, disfruta de ocurrir tiempo con su clan, hacer deportes y realizar actividades al canción vacante.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *