Para muchas organizaciones, el veterano desafío con los agentes de IA construidos sobre datos no estructurados no es el maniquí, pero es el contexto. Si el agente no puede recuperar la información correcta, incluso el maniquí más renovador se perderá los detalles esencia y dará respuestas incompletas o incorrectas.
Estamos presentando Reranking en Mosaic AI Vector Search, ahora en la olfato previa pública. Con un solo parámetro, puede aumentar la precisión de la recuperación en un promedio de 15 puntos porcentuales en nuestro puntos de remisión empresariales. Esto significa respuestas de veterano calidad, mejor razonamiento y un rendimiento de agente más consistente, sin infraestructura adicional o configuración compleja.
¿Qué es Reranking?
Reranking es una técnica que mejoramiento la calidad del agente al respaldar que el agente obtenga los datos más relevantes para realizar su tarea. Mientras que las bases de datos de vectores se destacan al encontrar rápidamente documentos relevantes de millones de candidatos, el reverencia aplica una comprensión contextual más profunda para respaldar que los resultados más semánticamente relevantes aparezcan en la parte superior. Este enfoque de dos etapas, recuperación rápida seguida de reordenamiento inteligente, se ha vuelto esencial para los sistemas de agentes de trapo donde la calidad es importante.
Por qué agregamos Reranking
Es posible que esté construyendo agentes de chat internos para replicar preguntas sobre sus documentos. O podría estar construyendo agentes que generen informes para sus clientes. De cualquier modo, si desea construir agentes que puedan usar con precisión sus datos no estructurados, entonces la calidad está vinculada a la recuperación. Rer considerar es cómo los clientes de búsqueda de vectores aumentan la calidad de su recuperación y, por lo tanto, aumentan la calidad de sus agentes de rag.
De los comentarios de los clientes, hemos trillado dos problemas comunes:
- Los agentes pueden perder el contexto crítico enterrado en grandes conjuntos de documentos no estructurados. El pasaje «correcto» rara vez se encuentra en la parte superior de los resultados recuperados de una almohadilla de datos vectorial.
- Los sistemas de reverencia de cosecha propia aumentan significativamente la calidad del agente, pero tardan semanas en construirse y luego necesitan un mantenimiento significativo.
Al hacer de Reranking una función de búsqueda de vectores nativos, puede usar sus datos empresariales gobernados para producir la información más relevante sin ingeniería adicional.
La característica de Reranker ayudó a elevar a nuestro Lexi Chatbot de funcionar como un estudiante de secundaria a representar como un licenciado de la aprobación de derecho. Hemos trillado ganancias transformadoras en la forma en que nuestros sistemas comprenden, razonan y generan contenido a partir de conocimientos de documentos legales que no fueron enterrados en datos no estructurados. – David Brady, director senior, G3 Enterprises
Una mejoramiento sustancial de calidad sobre las líneas de almohadilla
Nuestro equipo de investigación logró un avance al construir un sistema de IA compuesto novedoso para cargas de trabajo de agentes. En nuestro puntos de remisión empresariales, El sistema recupera la respuesta correcta interiormente de sus 10 resultados principales el 89%del tiempo (recuperación@10), una mejoramiento de 15 puntos sobre nuestra cadena de almohadilla (74%) y 10 puntos más altas que las alternativas de nubes líderes (79%). De modo crucial, nuestro Reranker ofrece esta calidad con latencias tan bajas como 1.5 segundos, mientras que los sistemas contemporáneos a menudo tardan varios segundos, o incluso minutos, para devolver respuestas de incorporación calidad.

Recuperación obediente y de incorporación calidad
Habilite el rerenking de división empresarial en minutos, no semanas. Los equipos generalmente pasan semanas investigando modelos, implementando infraestructura y escribiendo dialéctica personalizada. Por el contrario, habilitar la remisión para la búsqueda de vectores requiere solo un parámetro adicional en su consulta de búsqueda de vectores para obtener instantáneamente una veterano recuperación de calidad para sus agentes. Ningún maniquí que sirva puntos finales para llevar la batuta, sin envoltorios personalizados para sostener, sin configuraciones complejas para sintonizar.
Al especificar múltiples columnas en columnas_to_rerank, está llevando la calidad del Reranker al subsiguiente nivel dándole llegada a metadatos más allá del texto principal. En este ejemplo, el Reranker utiliza resúmenes de contratos e información de categoría para comprender mejor el contexto y mejorar la relevancia de los resultados de búsqueda.
Optimizado para el rendimiento del agente
La velocidad cumple con la calidad para las aplicaciones de AI en tiempo efectivo. Nuestro equipo de investigación optimizó este sistema de IA compuesto para retornar a Rerank 50 resulta en tan solo 1.5 segundos. Esto lo hace en extremo efectivo para los sistemas de agentes que exigen precisión y capacidad de respuesta. Este rendimiento progresista permite estrategias de recuperación sofisticadas sin comprometer la experiencia del beneficiario.
¿Cuándo usar Reranking?
Recomendamos probar la reorganización de cualquier caso de uso de agente de RAG. Por lo caudillo, los clientes verán ganancias de calidad masivas cuando sus sistemas actuales encuentren la respuesta correcta en algún punto entre los 50 principales resultados de la recuperación, pero luchan por superficial de la superficie interiormente de los 10 principales. En términos técnicos, esto significa clientes con bajo retiro@10 pero parada retiro@50.
Experiencia de desarrollador mejorada
Más allá de las capacidades de relieve central, estamos haciendo que sea más obediente que nunca construir e implementar sistemas de recuperación de incorporación calidad.
Integración de Langchain: Reranker funciona sin problemas con VectorSearchrieCREOLnuestra integración oficial de Langchain para la búsqueda de vectores. Los equipos que construyen agentes de Rag con VectorSearchrieVerTool pueden beneficiarse de una recuperación de veterano calidad, no se requieren cambios en el código.
Métricas de rendimiento transparentes: La latencia de Reranker ahora está incluida en la información de depuración de consultas, lo que le brinda un desglose completo de extremo a extremo de su rendimiento de consulta.
Desglose de latencia de respuesta en milisegundos
Selección de columna flexible: Vuelva a ser basado en cualquier combinación de columnas de texto y metadatos, lo que le permite usar todo el contexto de dominio acondicionado, desde resúmenes de documentos hasta categorías y metadatos personalizados, para una incorporación relevancia.
Comienzo a construir hoy
Reranker en la búsqueda de vectores transforma la forma en que crea aplicaciones AI. Con cero sobrecarga de infraestructura e integración perfecta, finalmente puede ofrecer la calidad de recuperación que se merecen sus usuarios.
¿Avispado para comenzar?