Creación de la plataforma de atención domiciliaria más confiable
La representación de Thumbtack es simple pero ambiciosa: capacitar a las personas para que administren sus hogares con confianza y sin esfuerzo haciendo que cada servicio, reparación y restablecimiento sea confiable y seguro. Apoyamos las economías locales conectando a millones de propietarios de viviendas en todo el país con más de 300 000 profesionales capacitados, desde plomeros y electricistas hasta proveedores de bienestar y organizadores de eventos. La oportunidad es enorme, pero asimismo lo es la complejidad: nuestro objetivo es asegurar resultados consistentes y excepcionales para cada cliente, en todo momento.
Desbloqueando el valía de GenAI en Thumbtack
La rápida crecimiento de los servicios para el hogar y las crecientes expectativas de los clientes significan que estamos avanzando continuamente en nuestra plataforma: los volúmenes de datos, las deyección impredecibles de los clientes y profesionales y las categorías de servicios en expansión presentan desafíos técnicos y organizativos. Thumbtack enfrentó flujos de trabajo de ingeniería y ciencia de datos fragmentados, infraestructura aislada y un stop nivel de privacidad y seguridad.
Resolver estos desafíos requirió más que algoritmos inteligentes o una infraestructura más rápida. Se necesitaba una plataforma de formación automotriz y datos conectada y confiable que priorizara la seguridad, la privacidad y la colaboración. Nuestro enfoque: armonizar nuestro ecosistema GenAI sobre Databricks para suscitar un impacto auténtico y mensurable.
GenAI confiable, seguridad centralizada y ciencia de datos productiva
Elevando la confianza y la seguridad con LLMs perfeccionados
El proceso de revisión de mensajes semiautomático de Thumbtack es la columna vertebral de nuestra plataforma de confianza digital. Cada mensaje, entre un cliente y un profesional, es analizado tanto por un motor basado en reglas como por un maniquí de formación automotriz. Si acertadamente los casos típicos de demasía se pueden detectar con reglas simples, muchas violaciones de políticas matizadas no pueden serlo. Los primeros sistemas basados en redes neuronales convolucionales (CNN) luchaban por diferenciar entre sarcasmo, contexto o amenazas implícitas.
El ajuste de grandes modelos de jerga a partir de los propios datos etiquetados de Thumbtack marcó una gran diferencia. Con nuestro flujo de trabajo híbrido, un maniquí CNN filtra previamente mensajes obviamente buenos, lo que reduce la carga de trabajo de LLM en un 80 %. Luego, el LLM optimizado concentra su poder en el 20% más desafiante, aumentando la precisión de detección en 3,7 veces y la recuperación en 1,5 veces. Cada año se procesan decenas de millones de mensajes, lo que garantiza que las conversaciones permanezcan seguras, manteniendo interacciones honestas y evitando costos innecesarios.
Construir sobre Databricks: seguro, estandarizado y flexible
Todos los flujos de trabajo avanzados de IA y confianza en Thumbtack ahora se ejecutan a través de una plataforma de formación automotriz unificada construida sobre Databricks. Las inversiones y salvaguardias esencia incluyen:
- Diligencia centralizada de la carga de trabajo de LLM: Al ejecutar todas las cargas de trabajo de GenAI en Databricks, reducimos nuestra superficie de ataque y mantenemos un maniquí de gobernanza coherente.
- Aislamiento del espacio de trabajo: Las nubes privadas virtuales garantizan que los datos confidenciales permanezcan protegidos, con permisos granulares administrados a través de herramientas como Terraform. Usamos Unity Catalog para permitir que Databricks Genie y sin servidor accedan a BigQuery, como parte de cómo garantizamos una compañía segura de permisos.
- Protección de privacidad automatizada: Los depuradores de código hendido y desarrollados internamente eliminan la información de identificación personal (PII) y la información confidencial de los datos a medida que fluyen a través de cuadernos, modelos y canalizaciones.
- Observabilidad y seguimiento integral: Se realiza un seguimiento de cada maniquí, computadora portátil y ruta API para detectar deriva de datos y exposición de PII. Las herramientas de visualización confirman que los datos riesgosos no se filtran a los sistemas posteriores.
- Secretos centralizados y gobierno de artefactos: Con MLflow y los administradores de secretos, los equipos administran credenciales de forma segura, versionan todos los modelos y colaboran productivamente: no más copia y pegado de claves o bibliotecas descentralizado y frágil.
Mejores prácticas en operaciones GenAI
- Cargas de trabajo de IA híbrida: Los servicios de producción se ejecutan en AWS con descomposición en Google Cloud, pero todos los flujos de trabajo de GenAI están centralizados y estandarizados para su reproducibilidad.
- Reutilización y eficiencia: MLflow y el seguimiento de portátiles significan que los experimentos o soluciones se pueden compartir, comparar y ampliar en ingeniería, SRE y descomposición, todo con controles de privacidad consistentes.
- Salvaguardas de privacidad proactivas: Thumbtack personaliza los depuradores de PII de código hendido según sus deyección específicas y aplica la supervisión en cada capa. Las tendencias de la industria indican que las infracciones de modelos y portátiles relacionadas con PII han aumentado un 300% desde 2022, lo que hace que estas protecciones sean críticas para el negocio.
Más seguridad, más confianza, más innovación
- Escalera del mercado: Millones de usuarios estadounidenses y más de 300.000 empresas de servicios locales ahora interactúan interiormente de una plataforma que prioriza la seguridad y la confiabilidad.
- Filtrado de mensajes superior: Precisión hasta 3,7 veces, recuperación hasta 1,5 veces, costos controlados procesando solo el 20 % de los mensajes más riesgosos con LLM y al mismo tiempo salvaguardando la privacidad en cada paso.
- Colaboración y eficiencia: Los flujos de trabajo de ML centralizados y reproducibles eliminan las transferencias manuales y permiten una rápida innovación entre equipos, lo que permite a los científicos de datos, SRE e ingenieros de ML trabajar en sincronización.
- Confianza en la escalera: Con sólidos controles técnicos y de procesos, Thumbtack cumple su representación de ser el mercado más confiable y transparente para servicios para el hogar.
A medida que Thumbtack continúa su alucinación GenAI, cada equipo tiene la capacidad de intentar, colaborar y ofrecer experiencias de servicios para el hogar más seguras e inteligentes. La organización se fundamento en el impacto del mundo auténtico y demuestra cómo la inteligencia industrial, la privacidad y el pensamiento de plataforma se combinan para crear valía tanto para los profesionales como para los propietarios.
Mira la chincheta Impulsar la productividad de la ciencia de datos y la inteligencia industrial con los portátiles Databricks Presentación Cumbre Datos + IA 2025.