Nuestros clientes dicen que su viejo desafío para sufrir la IA generativa del piloto a la producción es «problema de medición» Es difícil determinar y encargar en estos sistemas. Los proveedores de LLM comparten resultados de rendimiento en pruebas controladas, pero las empresas cambian los modelos y agregan sus propios datos. Esto dificulta la evaluación en el mundo auténtico.
En el estado presente de la IA, la mayoría de las organizaciones han pasado de simples aplicaciones LLM de una sola convocatoria a sistemas de inteligencia fabricado. Estos sistemas utilizan múltiples herramientas, estrategias de recuperación, pasos de razonamiento y reglas comerciales, adjunto con un LLM, para crear un resultado único a partir de un mensaje de favorecido. Están sucediendo muchas cosas bajo el capó.
En Databricks, estamos democratizando el llegada a disección y aplicaciones inteligentes al combinar los datos de los clientes con potentes modelos de IA adaptados a las características únicas de su negocio. Estamos liderando el camino en el cambio de la inteligencia caudillo a lo que llamamos Inteligencia de Datos. Como pueden atestiguar nuestros usuarios, incluso una pequeña prosperidad en la calidad y eficiencia de los datos puede tener un impacto enorme. Y con la arrebato de aplicaciones creadas en Databricks Mosaic AI este año, es fundamental que Databricks pueda ofrecer una evaluación escalable y líder en la industria para los sistemas compuestos de nuestros clientes.
Nos complace compartir que Databricks Ventures ha invertido en la ronda de financiación Serie B de galileouna startup centrada en la inteligencia de evaluación para equipos de IA de todo el mundo. Y con esta asociación más profunda, ahora todos los modelos de Databricks están disponibles de forma nativa para los usuarios de Galileo, brindando a nuestros clientes tanto inteligencia de datos como inteligencia de evaluación.
¿Por qué Galileo?
Galileo ofrece un nuevo tipo de inteligencia de evaluación con su Escaparate Evaluación Suite, un conjunto de métricas patentadas y modelos básicos de evaluación. Galileo reúne a Escaparate y sus flujos de trabajo obstinados para observar, monitorear y proteger en tiempo auténtico para capacitar a los equipos con evaluaciones que:
- Abarque todo el flujo de trabajo de incremento de IA
- Simplemente trabaje desde el primer momento sin obligación de datos reales
- Escale a millones de consultas de IA al mes sin afectar el costo o la latencia
- Son igualmente efectos para ingenieros, desarrolladores y usuarios empresariales.
- Mejore continuamente adaptándose automáticamente a los datos exclusivos de su caso de uso
Esto permite a los equipos despachar rápidamente aplicaciones confiables y, al mismo tiempo, respaldar resultados consistentes y experiencias de marca positivas para los usuarios internos y externos. Galileo tiene experiencia comprobada en toda la empresa, incluidas las relaciones existentes con clientes de Fortune 50 Databricks y un crecimiento empresarial de más del 800 % durante el postrer año.

¿Qué sigue para Galileo y Databricks?
Galileo ahora ofrece la última gestación de Databricks de modelos de cojín previamente entrenados y de incorporación calidad de su Unity Catalog, Databricks Marketplace y Mosaic AI Model Service. Ahora se puede consentir a todos los modelos listos para usar y optimizados disponibles para los usuarios en Databricks para realizar evaluaciones de potencia en Galileo a través de nuestra integración nativa, lo que requiere solo sus credenciales de OAuth Databricks. A través de esta integración, los usuarios ahora obtienen lo mejor de la inteligencia de datos y de la inteligencia de evaluación, todo ello como parte de un único ecosistema.

Este es solo el primer paso para avanzar alrededor de la inteligencia de datos con Databricks y Galileo. En el futuro, Galileo planea cerrar el ciclo de incremento completo integrándose con la capa de datos de Databricks, lo que permite un conjunto de pruebas algorítmico necesario de incorporación calidad y una curación de conjuntos de datos de ajuste fino para evaluaciones y RLHF valioso, todo de forma nativa internamente del ecosistema conjunto.

Estamos entusiasmados de implementar estas integraciones: comuníquese para registrar interés aquí para originarse hoy con la opción conjunta. Estén atentos a futuras actualizaciones y asegúrese de unirse al equipo de Databricks y Galileo el 29 de octubre en GenAI. Producir 2.0 Cumbre supuesto para instruirse más sobre el futuro de la evaluación de la IA.