Athrun Data Intelligence


Agentic-AI se ha vuelto esencial para implementar aplicaciones de IA listas para producción, sin incautación, muchos desarrolladores luchan con la complejidad de configurar manualmente la infraestructura del agente en múltiples entornos. Infraestructura como código (IaC) facilita la infraestructura consistente, segura y escalable que requieren los sistemas autónomos de IA. Minimiza los errores de configuración manual a través de la trámite automatizada de capital y plantillas declarativas, lo que reduce el tiempo de implementación de horas a minutos y, al mismo tiempo, facilita la coherencia de la infraestructura en todos los entornos para ayudar a predisponer el comportamiento impredecible de los agentes. Proporciona control de versiones y capacidades de reversión para una recuperación rápida de problemas, esenciales para amparar la disponibilidad del sistema agente, y permite el escalado automatizado y la optimización de capital a través de plantillas parametrizadas que se adaptan desde el incremento inconstante hasta implementaciones de nivel de producción. Para aplicaciones agentes que funcionan con una mínima intervención humana, la confiabilidad de IaC, la energía automatizada de los estándares de seguridad y la perfecta integración en los flujos de trabajo de DevOps son esenciales para operaciones autónomas sólidas.

Para facilitar el despliegue y la trámite de capital, Amazon Bedrock AgentCore Los servicios ahora cuentan con el respaldo de varios marcos de IaC, como Kit de incremento de la montón de AWS (AWSCDK), Terraformar y Plantillas de AWS CloudFormation. Esta integración lleva el poder de IaC directamente a AgentCore para que los desarrolladores puedan aprovisionar, configurar y gobernar su infraestructura de agentes de IA. En esta publicación, utilizamos plantillas de CloudFormation para crear una aplicación de un extremo a otro para un planificador de actividades meteorológicas. Se pueden encontrar ejemplos de uso de CDK y Terraform en Biblioteca de muestra de GitHub.

Creación de un agente planificador de actividades basado en el clima

La muestra crea un planificador de actividades meteorológicas, lo que demuestra una aplicación habilidad que procesa datos meteorológicos en tiempo efectivo para proporcionar recomendaciones de actividades personalizadas basadas en una ubicación de interés. La aplicación consta de múltiples componentes integrados:

  • Sumario de datos meteorológicos en tiempo efectivo. – La aplicación recupera las condiciones climáticas actuales de fuentes meteorológicas autorizadas como Weather.gov, recopilando puntos de datos esenciales que incluyen lecturas de temperatura, pronósticos de probabilidad de precipitación, mediciones de la velocidad del singladura y otras condiciones atmosféricas relevantes que influyen en la idoneidad de las actividades al meteorismo redimido.
  • Motor de descomposición meteorológico. – La aplicación procesa datos meteorológicos sin procesar a través de una razonamiento personalizada para evaluar la idoneidad de un día para una actividad al meteorismo redimido en función de múltiples factores climáticos:
    • Puntuación de confort de temperatura – Las actividades reciben puntuaciones de idoneidad reducidas cuando las temperaturas caen por debajo de 50°F
    • Evaluación del peligro de precipitaciones – Las probabilidades de borrasca superiores al 30 % provocan ajustes en las recomendaciones de actividades al meteorismo redimido
    • Evaluación de impacto de la condición del singladura. – Las velocidades del singladura superiores a 15 mph afectan las calificaciones generales de comodidad y seguridad para diversas actividades.
  • Sistema de recomendación personalizado – La aplicación procesa los resultados del descomposición meteorológico con las preferencias del sucesor y el conocimiento basado en la ubicación para originar sugerencias de actividades personalizadas.

El posterior diagrama muestra este flujo.

Ahora veamos cómo se puede implementar esto utilizando los servicios de AgentCore:

  • Navegador AgentCore – Para la navegación automatizada de datos meteorológicos de fuentes como Weather.gov
  • Intérprete de código AgentCore – Para ejecutar código Python que procesa datos meteorológicos, realiza cálculos e implementa algoritmos de puntuación.
  • Tiempo de ejecución de AgentCore – Para encajar un agente que orqueste el flujo de aplicaciones, administre canales de procesamiento de datos y coordine entre diferentes componentes.
  • Memoria AgentCore – Para acumular las preferencias del sucesor como memoria a prolongado plazo.

El posterior diagrama muestra esta edificación.

Implementación de la plantilla de CloudFormation

  1. Descargue la plantilla de CloudFormation desde github para Agente meteorológico de extremo a extremo.yaml en su máquina almacén
  2. Caleta CloudFormation desde la consola de AWS
  3. Hacer clic Crear pilaCon nuevos capital (normalizado)
  4. Elija la fuente de la plantilla (cargue el archivo) y seleccione su plantilla
  5. Ingrese el nombre de la pila y cambie los parámetros requeridos si es necesario
  6. Revisar la configuración y recordar las capacidades de IAM
  7. Hacer clic Entregar y monitorear el progreso de la implementación en la pestaña Eventos

Estos son los pasos visuales para la implementación de la plantilla de CloudFomation

Ejecutando y probando la aplicación.

Ampliar observabilidad y monitoreo

AgentCore Observability proporciona ventajas secreto. Ofrece calidad y confianza a través de visualizaciones detalladas del flujo de trabajo y monitoreo del desempeño en tiempo efectivo. Puede acelerar el tiempo de comercialización utilizando Amazon CloudWatch Paneles de control potentes que reducen la integración manual de datos de múltiples fuentes, lo que permite tomar acciones correctivas basadas en conocimientos prácticos. La flexibilidad de integración con el formato compatible con OpenTelemetry admite herramientas existentes como Vigilancia de la montón, Perro de datos, Arize Fénix, LangSmithy LangFuse.

El servicio proporciona trazabilidad de un extremo a otro entre marcos y modelos de fundacion (FM), captura métricas críticas como el uso de tokens y los patrones de selección de herramientas, y admite tanto la instrumentación cibernética para los agentes alojados en AgentCore Runtime como el monitoreo configurable para los agentes implementados en otros servicios. Este enfoque integral de observabilidad ayuda a las organizaciones a ganar ciclos de incremento más rápidos, un comportamiento de los agentes más confiable y una visibilidad operativa mejorada, mientras crean agentes de IA confiables a escalera.

La posterior captura de pantalla muestra métricas en la interfaz de sucesor de AgentCore Runtime.

Personalización para su caso de uso

La plantilla de AWS CloudFormation del planificador de actividades meteorológicas está diseñada con componentes modulares que se pueden adaptar perfectamente a diversas aplicaciones. Por ejemplo, puede personalizar la útil AgentCore Browser para resumir información de diferentes aplicaciones web (como sitios web financieros para orientación de inversiones, fuentes de redes sociales para monitorear sentimientos o sitios de comercio electrónico para seguimiento de precios), modificar los algoritmos de AgentCore Code Interpreter para procesar su razonamiento comercial específica (como modelos predictivos para pronósticos de ventas, evaluación de riesgos para seguros o control de calidad para fabricación), ajustar el componente AgentCore Memory para acumular preferencias de sucesor relevantes o contexto comercial (como perfiles de clientes, niveles de inventario o requisitos de proyectos) y reconfigurar la Agentes de hebras tareas para orquestar flujos de trabajo específicos de su dominio (como optimización de la esclavitud de suministro, automatización del servicio al cliente o monitoreo del cumplimiento).

Mejores prácticas para implementaciones

Recomendamos las siguientes prácticas para sus implementaciones:

  • Edificio de componentes modulares – Diseñe plantillas de AWS CloudFormation con secciones separadas para cada servicio de AWS.
  • Diseño de plantilla parametrizada – Utilice los parámetros de AWS CloudFormation para los instrumentos configurables para solucionar las plantillas reutilizables en todos los entornos. Por ejemplo, esto puede ayudar a asociar el mismo contenedor pulvínulo con múltiples implementaciones de agentes, ayudar a señalar dos configuraciones de compilación diferentes o parametrizar el LLM de disyuntiva para potenciar sus agentes.
  • Papeleo de entrada e identidad de AWS (IAM) seguridad y privilegio insignificante – Implementar funciones de IAM detalladas para cada componente de AgentCore con capital específicos Nombres de capital de Amazon (ARN). Consulte nuestra documentación sobre Consideraciones de seguridad de AgentCore.
  • Monitoreo y observabilidad integral – Habilite el registro de CloudWatch, métricas personalizadas, Rayos X AWS seguimiento distribuido y alertas entre los componentes.
  • Control de versiones e integración continua y entrega continua (CI/CD) – Mantenga plantillas en GitHub con energía automatizada, pruebas integrales y AWS CloudFormation StackSets para implementaciones consistentes en varias regiones.

Puede encontrar un conjunto más completo de mejores prácticas en Mejores prácticas de CloudFormation

Erradicar capital

Para evitar incurrir en cargos futuros, elimine los capital utilizados en esta alternativa:

  1. en el Consola Amazon S3elimine manualmente el contenido internamente del depósito que creó para la implementación de la plantilla y luego elimine el depósito.
  2. en el Consola de CloudFormationnominar pilas en el panel de navegación, seleccione la pila principal y elija Borrar.

Conclusión

En esta publicación, presentamos una alternativa automatizada para implementar servicios AgentCore mediante AWS CloudFormation. Estas plantillas preconfiguradas permiten una implementación rápida de potentes sistemas de IA agentes sin la complejidad de la configuración manual de componentes. Este enfoque automatizado ayuda a atesorar tiempo y facilita implementaciones consistentes y reproducibles para que pueda concentrarse en crear flujos de trabajo de IA agentes que impulsen el crecimiento empresarial.

Pruebe algunos ejemplos más de nuestros repositorios de muestra de Infraestructura como código:


Sobre los autores

Chintan Patel es un arquitecto de soluciones senior en AWS con amplia experiencia en diseño y incremento de soluciones. Ayuda a organizaciones de diversas industrias a modernizar su infraestructura, desmitificar las tecnologías de IA generativa y optimizar sus inversiones en la montón. Fuera del trabajo, le gusta suceder tiempo con sus hijos, arriesgar pickleball y padecer con herramientas de inteligencia industrial.

Shreyas Subramanian es un investigador de datos principal y ayuda a los clientes mediante el uso de IA generativa y educación profundo para resolver sus desafíos comerciales utilizando servicios de AWS como Amazon Bedrock y AgentCore. El Dr. Subramanian contribuye a la investigación de vanguardia en educación profundo, IA agente, modelos básicos y técnicas de optimización con varios libros, artículos y patentes a su nombre. En su puesto contemporáneo en Amazon, el Dr. Subramanian trabaja con varios líderes científicos y equipos de investigación internamente y fuera de Amazon, ayudando a dirigir a los clientes a emplear mejor los algoritmos y técnicas de última gestación para resolver problemas críticos para el negocio. Fuera de AWS, el Dr. Subramanian es un revisor diestro de artículos sobre IA y financiación a través de organizaciones como Neurips, ICML, ICLR, NASA y NSF.

Kosti Vasilakakis es PM principal en AWS en el equipo de Agentic AI, donde ha dirigido el diseño y incremento de varios servicios Bedrock AgentCore desde cero, incluido Runtime. Anteriormente trabajó en Amazon SageMaker desde sus inicios, lanzando capacidades de IA/ML que ahora utilizan miles de empresas en todo el mundo. Al principio de su carrera, Kosti fue investigador de datos. Fuera del trabajo, construye automatizaciones de productividad personal, juega tenis y explora la naturaleza con su grupo.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *