En el IA generativa En esta era, los agentes que simulan acciones y comportamientos humanos están surgiendo como una poderosa útil para que las empresas creen aplicaciones listas para producción. Los agentes pueden interactuar con los usuarios, realizar tareas y exhibir habilidades para tomar decisiones, imitando la inteligencia humana. Combinando agentes con modelos básicos (FM) de la Gigante amazónico en veta de roca amazónica tribu, los clientes pueden desarrollar aplicaciones multimodales y complejas que permitan al agente comprender y suscitar idioma natural o imágenes.
Por ejemplo, en la industria minorista de moda, un asistente impulsado por agentes y modelos multimodales puede congratular a los clientes una experiencia personalizada e inmersiva. El asistente puede entablar conversaciones en idioma natural y comprender las preferencias e intenciones del cliente. Luego puede utilizar las capacidades multimodales para analizar imágenes de prendas de vestir y hacer recomendaciones basadas en los comentarios del cliente. Por otra parte, el agente puede suscitar ayudas visuales, como sugerencias de vestimenta, mejorando la experiencia caudillo del cliente.
En esta publicación, implementamos un agente asistente de moda usando Agentes de Amazon Bedrock y los modelos de la tribu Amazon Titan. El asistente de moda proporciona una experiencia conversacional personalizada y multimodal. Entre otras, las capacidades de Magneto de imágenes de Amazon Titan Para pintar y pintar imágenes se puede utilizar para suscitar inspiraciones de moda y editar fotografías de usuarios. Incorporaciones multimodales de Amazon Titan Los modelos se pueden utilizar para averiguar un estilo en una pulvínulo de datos utilizando un texto emergente o una imagen de remisión proporcionada por el heredero para encontrar estilos similares. Soneto antrópico de Claude 3 Lo utiliza el agente para orquestar sus acciones, por ejemplo, averiguar el clima coetáneo para acoger recomendaciones de vestimenta apropiadas para el clima. Una interfaz de heredero web sencilla a través de iluminado proporciona al heredero la mejor experiencia para interactuar con el agente.
El agente asistente de moda se puede integrar sin problemas en plataformas de comercio electrónico o aplicaciones móviles existentes, brindando a los clientes una experiencia agradable y fluida. Los clientes pueden cargar sus propias imágenes, describir el estilo que desean o incluso proporcionar una imagen de remisión, y el agente generará recomendaciones personalizadas e inspiraciones visuales.
El código utilizado en esta opción está habitable en el repositorio de GitHub.
Descripción caudillo de la opción
El agente asistente de moda utiliza el poder de los modelos Amazon Titan y Amazon Bedrock Agents para congratular a los usuarios un conjunto integral de funcionalidades relacionadas con el estilo:
- Búsqueda de imagen a imagen o texto a imagen – Esta útil permite a los clientes encontrar productos similares a los estilos que les gustan del catálogo, mejorando su experiencia de heredero. Usamos el maniquí Titan Multimodal Embeddings para damasquinar cada imagen de producto y almacenarla en Amazon OpenSearch sin servidor para su futura recuperación.
- Gestación de texto a imagen – Si el estilo deseado no está habitable en la pulvínulo de datos, esta útil genera imágenes únicas y personalizadas en función de la consulta del heredero, permitiendo la creación de estilos personalizados.
- Conexión API meteorológica – Al obtener información meteorológica para una ubicación determinada mencionada en el mensaje del heredero, el agente puede sugerir estilos apropiados para la ocasión, asegurándose de que el cliente esté vestido según el clima.
- pintar – Los usuarios pueden cargar una imagen y solicitar cambiar el fondo, lo que les permite visualizar sus estilos preferidos en diferentes configuraciones.
- en pintura – Esta útil permite a los usuarios modificar prendas de vestir específicas en una imagen cargada, como cambiar el diseño o el color, manteniendo limpio el fondo.
El próximo diagrama de flujo ilustra el proceso de toma de decisiones:
Y el diagrama de edificio correspondiente:
Requisitos previos
Para configurar el agente asistente de moda, asegúrese de tener lo próximo:
- Una cuenta de AWS activa y Dirección de golpe e identidad de AWS (IAM) en Amazon Bedrock, AWS Lambday Almacenamiento sencillo de Amazon (Amazon S3) golpe
- Instalación de bibliotecas Python requeridas como Streamlit
- Modelos Anthropic Claude 3 Sonnet, Amazon Titan Image Generator y Amazon Titan Multimodal Embeddings habilitados en Amazon Bedrock. Puede confirmar que están habilitados en el Llegada al maniquí página de la consola Amazon Bedrock. Si estos modelos están habilitados, el estado de golpe se mostrará como Llegada concedidocomo se muestra en la próximo captura de pantalla.
Antaño de ejecutar el cuaderno proporcionado en el repositorio de GitHub para comenzar a construir la infraestructura, asegúrese de que su cuenta de AWS tenga permiso para:
- Cree roles y políticas de IAM administrados
- Crear e invocar funciones Lambda
- Crear, repasar y escribir en depósitos de S3
- Acceda y administre agentes y modelos de Amazon Bedrock
Si desea habilitar las capacidades de búsqueda de imagen a imagen o de texto a imagen, se requieren permisos adicionales para su cuenta de AWS:
- Cree una política de seguridad, una política de golpe, recopile, indexe y mapee el índice en OpenSearch Serverless
- Llame al
BatchGetCollection
en OpenSearch sin servidor
Configurar el agente asistente de moda
Para configurar el agente asistente de moda, siga estos pasos:
- Clonar el repositorio de GitHub usando el comando
- Complete los requisitos previos para otorgar permisos suficientes
- Siga los pasos de implementación descritos en el LÉAME.md
- (Opcional) Si desea utilizar el
image_lookup
característica, ejecute fragmentos de código enopensearch_ingest.ipynb
utilizar Amazon Titan Multimodal Embeddings para damasquinar y juntar imágenes de muestra - Ejecute la interfaz de heredero de Streamlit para interactuar con el agente usando el comando
Si sigue estos pasos, puede crear un agente asistente de moda potente y atractivo que combine las capacidades de los modelos Amazon Titan con las capacidades de automatización y toma de decisiones de los agentes Amazon Bedrock.
Pon a prueba al asistente de moda.
Una vez configurado el asistente de moda, puedes interactuar con él a través de la interfaz de heredero de Streamlit. Siga estos pasos:
- Navegue a su interfaz de heredero Streamlit, como se muestra en la próximo captura de pantalla
- Cargue una imagen o ingrese un mensaje de texto que describa el estilo deseado, de acuerdo con la entusiasmo deseada, por ejemplo, búsqueda de imágenes, engendramiento de imágenes, pintura foráneo o pintura interior. La próximo captura de pantalla muestra un mensaje de ejemplo.
- Presione Intro para expedir el mensaje al agente. Puede ver el proceso de prisión de pensamiento (CoT) del agente en la interfaz de heredero, como se muestra en la próximo captura de pantalla.
- Cuando la respuesta esté cinta, podrá ver la respuesta del agente en la interfaz de heredero, como se muestra en la próximo captura de pantalla. La respuesta puede incluir imágenes generadas, recomendaciones de estilo similares o imágenes modificadas según su solicitud. Puede descargar las imágenes generadas directamente desde la interfaz de heredero o repasar la imagen en su depósito S3.
Erradicar
Para evitar costos innecesarios, asegúrese de eliminar los posibles utilizados en esta opción. Puede hacer esto ejecutando el próximo comando.
Conclusión
El agente asistente de moda, impulsado por los modelos Amazon Titan y Amazon Bedrock Agents, es un ejemplo de cómo los minoristas pueden crear aplicaciones innovadoras que mejoren la experiencia del cliente e impulsen el crecimiento empresarial. Al utilizar esta opción, los minoristas pueden obtener una superioridad competitiva al ofrecer recomendaciones de estilo personalizadas, inspiraciones visuales y consejos de moda interactivos a sus clientes.
Le animamos a explorar el potencial de crear más agentes como este asistente de moda consultando los ejemplos disponibles en repositorio de aws-samples en GitHub.
Acerca de los autores
Akarsha Sehwag es sabio de datos e ingeniero de formación maquinal en AWS Professional Services con más de 5 primaveras de experiencia en la creación de soluciones basadas en formación maquinal. Aprovechando su experiencia en visión por computadora y formación profundo, capacita a los clientes para explotar el poder del formación maquinal en la abundancia de AWS de guisa competente. Con la venida de la IA generativa, trabajó con numerosos clientes para identificar buenos casos de uso y convertirlos en soluciones listas para producción.
Yanyan Zhang es científica senior de datos de IA generativa en Amazon Web Services, donde ha estado trabajando en tecnologías de IA/ML de vanguardia como diestro en IA generativa, ayudando a los clientes a explotar GenAI para conseguir los resultados deseados. Yanyan se graduó de la Universidad Texas A&M con un doctorado. Estudios en Ingeniería Eléctrica. Fuera del trabajo, le encanta delirar, hacer examen y explorar cosas nuevas.
Antonia Wiebeler es científica de datos en el Centro de innovación de IA generativa de AWS, donde le gusta crear pruebas de concepto para los clientes. Su pasión es explorar cómo la IA generativa puede resolver problemas del mundo vivo y crear valía para los clientes. Si acertadamente no codifica, le gusta valer y competir en triatlones.
Alex Newton es sabio de datos en el Centro de innovación de IA generativa de AWS y ayuda a los clientes a resolver problemas complejos con IA generativa y formación maquinal. Le gusta aplicar soluciones de formación maquinal de última engendramiento para resolver desafíos del mundo vivo. En su tiempo soberano encontrarás a Alex tocando en una cuadrilla o viendo música en vivo.
Chris Pecora es sabio de datos de IA generativa en Amazon Web Services. Le apasiona crear productos y soluciones innovadores y, al mismo tiempo, se centra en la ciencia obsesionada con el cliente. Cuando no realiza experimentos y se mantiene al día con los últimos avances en IA generativa, le encanta tener lugar tiempo con sus hijos.
Maira Ladeira Tanke es sabio senior de datos de IA generativa en AWS. Con experiencia en formación maquinal, tiene más de 10 primaveras de experiencia diseñando y creando aplicaciones de IA con clientes de todos los sectores. Como líder técnica, ayuda a los clientes a acelerar la consecución de valía empresarial a través de soluciones de IA generativa en Amazon Bedrock. En su tiempo soberano, Maira disfruta delirar, arriesgar con su micifuz y tener lugar tiempo con su tribu en un circunstancia cálido.