En AWS re: Invent 2024, nosotros anunciado la próxima gestación de Amazon Sagemakerel Centro de todos sus datos, exploración y IA. Amazon Sagemaker reúne las capacidades de AWS Machine Learning (ML) y Analytics ampliamente adoptada y aborda los desafíos de utilizar los datos organizacionales para el exploración y la IA a través del golpe unificado a las herramientas y los datos con la gobernanza incorporada. Permite a los equipos encontrar, preparar y colaborar de forma segura en activos de datos y construir exploración de exploración y aplicaciones de IA a través de una sola experiencia, acelerar el camino de los datos que valoran.
En el centro de la próxima gestación de Amazon Sagemaker es Estudio unificado de Amazon Sagemakerun solo entorno de avance de datos y IA donde puede encontrar y entrar a los datos de su ordenamiento y comportarse en consecuencia utilizando la mejor utensilio para el trabajo en prácticamente cualquier caso de uso. Nos complace anunciar la disponibilidad genérico de Sagemaker Unified Studio.

En esta publicación, exploramos los beneficios de Sagemaker Unified Studio y cómo comenzar.
Beneficios del estudio unificado de Sagemaker
Sagemaker Unified Studio reúne la funcionalidad y las herramientas de los servicios existentes de AWS Analytics y AI/ML, incluidos Amazon EMR, AWS Glue, Amazon Athena, Amazon Redshift, Roca mama de Amazony Amazon Sagemaker AI. Desde en el interior del estudio unificado, puede descubrir datos y activos de IA de toda su ordenamiento, luego trabajar juntos en proyectos para construir y compartir exploración de forma segura y artefactos de IA, incluidos datos, modelos y aplicaciones generativas de IA. Las características de gobernanza, incluido el control de golpe de brizna fino, están integradas en Sagemaker Unified Studio usando Catálogo de Amazon Sagemaker para ayudarlo a cumplir con los requisitos de seguridad empresarial en todo su patrimonio de datos.
El golpe unificado a sus datos es proporcionado por Amazon Sagemaker LakehouseUn Data Lakehouse unificado, despejado y seguro construido sobre los estándares abiertos de Apache Iceberg. Si sus datos se almacenan en Servicio de almacenamiento simple de Amazon (Amazon S3) Lagos de datos, almacenes de datos de desplazamiento rojo o fuentes de datos de terceros y federadas, puede entrar a él desde un motivo y usarlo con motores y herramientas compatibles con iceberg. Encima, Sagemaker Lakehouse ahora se integra con Tablas de Amazon S3La primera tienda de objetos en la nubarrón con soporte nativo de Apache Iceberg, para que pueda usar Sagemaker Lakehouse para crear, consultar y procesar tablas S3 de guisa valioso utilizando varios motores de exploración en Sagemaker Unified Studio, así como motores compatibles con el iceberg como Apache Spark y Pyiceberg.
Las capacidades de Amazon Bedrock ahora están generalmente disponibles en Sagemaker Unified Studio, lo que le permite prototipos, personalizar y compartir aplicaciones generativas de IA en un entorno gobernado. Los usuarios tienen una interfaz intuitiva para entrar a los modelos de almohadilla de parada rendimiento (FMS) en Amazon Bedrock, incluido el Amazon Nova Serie de modelos y la capacidad de crear agentes, flujos, bases de conocimiento y barandas con unos pocos clics.
Desarrollador de Amazon Qel asistente de IA generativo más capaz para el avance de software, se puede utilizar en el interior de SageMaker Unified Studio para optimizar las tareas en los datos y el ciclo de vida del avance de IA, incluida la autorización de código, la gestación SQL, el descubrimiento de datos y la alternativa de problemas.
Una nueva forma integrada de trabajar
La disponibilidad genérico de Sagemaker Unified Studio representa otro paso significativo en nuestro alucinación para ofrecer a nuestros clientes una forma simplificada de trabajar con sus datos, ya sea para exploración o IA. Muchos de nuestros clientes nos han dicho que está creando aplicaciones basadas en datos para adiestrar las decisiones comerciales, mejorar la agilidad e impulsar la innovación, pero que estas aplicaciones son complejas de construir porque requieren colaboración entre los equipos y la integración de datos y herramientas. No solo lleva mucho tiempo para los usuarios asimilar múltiples experiencias de avance, sino conveniente a que los datos, el código y otros artefactos de avance se almacenan por separado, es un desafío que los usuarios comprendan cómo interactúan entre sí y los usan de guisa cohesiva. Configurar y mandar el golpe además es un proceso manual engorroso. Para pasar estos obstáculos, muchas organizaciones están construyendo integraciones a medida entre servicios, herramientas y sistemas de papeleo de golpe de cosecha propia. Sin incautación, lo que necesita es la flexibilidad para adoptar los mejores servicios para su caso de uso al tiempo que capacita a sus equipos de datos con una experiencia de avance unificado.
“Cuando creamos aplicaciones basadas en datos para nuestros clientes, queremos una plataforma unificada donde las tecnologías funcionen juntas de guisa integrada. Amazon Sagemaker Unified Studio optimiza nuestros procesos de entrega de soluciones a través de capacidades de exploración integrales, una experiencia de estudio unificada y un charca Lakehouse que integra la papeleo de datos en los almacenes de datos y lagos de datos. Amazon Sagemaker Unified Studio reduce el tiempo de valencia para los proyectos de datos de nuestros clientes hasta un 40%, ayudándonos con nuestra labor de acelerar el alucinación de transformación digital de nuestros clientes «.
—Akihiro Suzue, Patrón del Sector de las Soluciones, datos NTT; Yuji Shono, Regente Senior, Unidad de Tecnología de Aplicaciones y Datos, Datos NTT; Yuki Saito, apoderado, división de soluciones de éxito digital, datos NTT
Millones de organizaciones confían en AWS y utilizan nuestro conjunto integral de exploración especialmente diseñados, AI/ML y capacidades generativas de IA para proporcionar aplicaciones basadas en datos sin comprometer el rendimiento, la escalera o el costo. Nuestro objetivo para la próxima gestación de Amazon Sagemaker, incluido Sagemaker Unified Studio, es hacer que los datos y los trabajadores de IA sean más productivos al proporcionar golpe a todos sus datos y herramientas en un entorno de avance único.
Construir a partir de un solo entorno de avance de datos y IA
Exploremos un desafío comercial popular: aumentar los ingresos a través de una mejor gestación de leads. Considere una ordenamiento que implementa un asistente digital inteligente en su sitio web para interactuar con los clientes, un proceso que tradicionalmente requiere múltiples herramientas y fuentes de datos. Con Sagemaker Unified Studio, todo este proceso ahora se puede tolerar a término en el interior de un solo entorno de avance de datos y IA.

Primero, el equipo de datos utiliza el patio de recreo de IA generativo en el interior de Sagemaker Unified Studio para evaluar y clasificar rápidamente el mejor maniquí para las interacciones de sus clientes. Luego crean un esquema para abrigar las herramientas y los posibles necesarios para su caso de uso y usan Amazon Bedrock en el interior del esquema para construir e implementar un asistente posible sofisticado que rápidamente comienza a encuadrar con clientes potenciales a través de su sitio web.
Para identificar las oportunidades más prometedoras, el equipo desarrolla una organización de segmentación. El ingeniero de datos le pide al desarrollador de Amazon Q que identifique conjuntos de datos que contengan datos de plomo y utilicen integraciones de ETL cero para tolerar los datos a Sagemaker Lakehouse. El analista de datos lo descubre y crea una visión integral de su mercado. Utilizan el editor de consultas SQL para construir segmentos de marketing, que luego escriben a Sagemaker Lakehouse, donde están disponibles para otros miembros del equipo.
Finalmente, el investigador de datos accede al mismo conjunto de datos, que usan para entrenar e implementar un maniquí de puntuación de plomo automatizado utilizando herramientas disponibles en Sagemaker AI. Durante la etapa de avance del maniquí, utilizan las capacidades de autorización de código en límite del desarrollador de Amazon Q y capacidades de alternativa de problemas para escribir eficientemente el código vacuo de errores en su cuaderno JupyterLab. El maniquí final ofrece a los equipos de ventas las oportunidades de anciano valencia, que pueden visualizar en un tablero de inteligencia empresarial y tomar medidas de inmediato.
Achicar el tiempo de valencia en un entorno unificado
Lo trascendental de este ejemplo es que ocurre todo el proceso en un entorno integrado. Sin Sagemaker Unified Studio, el equipo habría tenido que trabajar con múltiples fuentes de datos, herramientas y servicios, acontecer tiempo aprendiendo múltiples entornos de avance, crear posibles compartidos y configurar manualmente los controles de golpe. El ingeniero de datos y el analista de datos habrían trabajado en varios almacenes de datos, lagos de datos y herramientas de exploración, el investigador de datos habría trabajado en un entorno de ML Studio y Notebook, y el constructor de aplicaciones en una utensilio de IA generativa. Ahora, pueden construir y colaborar con sus datos y herramientas disponibles en una experiencia, reduciendo drásticamente el tiempo de valencia.
Es por eso que estamos tan entusiasmados con la próxima gestación de Amazon Sagemaker y la disponibilidad genérico de Sagemaker Unified Studio. Creemos que al poner todo lo que necesita para exploración e IA en un solo motivo, puede resolver problemas complejos de extremo a extremo de guisa más valioso y entrar a resultados innovadores más rápido que nunca.
Comenzando con Sagemaker Unified Studio
Para obtener más información, consulte los siguientes posibles:
Sobre los autores
G2 Krishnamoorthy es vicepresidente de exploración, servicios de charca de datos de AWS, integración de datos, servicio de Amazon OpenSearch y Amazon Quicksight. Antiguamente de su rol contemporáneo, G2 construyó y ejecutó la plataforma Analytics y ML en Facebook/Meta, y construyó varias partes de la almohadilla de datos de SQL Server, Azure Analytics y Azure ML en Microsoft.
Rahul Pathak es vicepresidente de motores de bases de datos relacionales, Amazon Aurora líder, Amazon Redshift y Amazon QLDB. Antiguamente de su papel contemporáneo, fue vicepresidente de exploración en AWS, donde trabajó en toda la cartera de bases de datos de AWS. Ha cofundado dos compañías, una centrada en el exploración de medios digitales y el otro en la geolocación IP.