Los datos listos para AI son mucho más que el añoso adagio «basura, basura». Por supuesto, nadie quiere basura, pero como dice otro dicho: «La basura de un hombre es el riquezas de otro hombre». La esencia es asimilar lo que necesita para una iniciativa específica, pero incluso asimilar lo que tiene. Los datos deben ser evaluados, administrados y gobernados, incluido el etiquetado y la publicación detallada. Esos dos últimos son la esencia para reutilizar, el Santo Comunión de IA efectiva y valioso.
Para usar una parecido de cocción, hacer que los datos AI listos es más que simplemente originar una ensalada puyazo. En la cocina, los ingredientes crudos deben estar preparados para recetas específicas. Es posible que las papas necesiten ser cortadas, cortadas en cubitos o ralladas dependiendo de lo que esté haciendo. Pero ayer de arribar a ese paso, debe encontrar las papas. Todavía es probable que necesite limpiarlos. Y necesitará encontrar los otros ingredientes que los acompañen. Todavía se deben etiquetar los ingredientes: no le gustaría confundir el azúcar con la sal o el pimentón tintado con la pimienta picante de cayena.
Los datos listos para AI son como los ingredientes preparados, listos para hornear en el maniquí AI. En la flamante cumbre de Snowflake, anunciamos características de la cirro de datos de IA que abordarán las características esencia de los datos listos para AI. Aquí hay algunos:
- Calidad: No hace desatiendo sostener que los mejores chefs usan ingredientes de calidad. Snowflake permite a los clientes concretar los estándares de calidad (por ejemplo, frescura, duplicación y medidas personalizadas) y monitorearlos con Funciones métricas de datos. El monitoreo en tiempo positivo permite la feedback en tiempo positivo sobre el rendimiento de la consulta y los datos modificados, facilitando el monitoreo continuo de la calidad de los datos. Ahora Cortex de copo de cocaína ai Se puede usar para automatizar la ablución de datos, detectar anomalías, estandarizar conjuntos de datos e incluso sugerir títulos faltantes, dominar el esfuerzo manual y mejorar la consistencia.
- Diferencia: La despensa debe estar almacenada con una buena variedad. Similarmente, variedad de datos Ayuda a asegurar los resultados de IA de calidad. Snowflake permite a los clientes acumular, analizar y aplicar IA a diversos tipos de datos. El soporte para formatos de código campechano permite a los clientes alcanzar a una serie aún más amplia, incluidos los datos que se encuentran fuera de los entornos de copo de cocaína. Adicionalmente, la expansión de datos de capacitación para incluir datos de socios o datos adquiridos de proveedores externos garantiza aún más la variedad. Y la reproducción de datos sintéticos puede hacer que los datos confidenciales sean más accesibles o de seguridad de la representación donde se conocen los parámetros de los datos faltantes.
- Frescura: Por supuesto, quieres que tus ingredientes sean frescos. Cero peor que descubrir que un componente esencia de su plato ha perdido su sabor. Tener ataque a datos donde reside siempre ha sido una esforzado propuesta de valía de la plataforma de copo de cocaína, proporcionando a los modelos de IA ataque a la información más pertinente y oportuna. Y Pipa de cocaínaEl servicio continuo de ingestión de datos automatiza los procesos de carga de datos, asegurando que los datos estén disponibles para el investigación tan pronto como llegue, contribuyendo a la puntualidad.
- Gobernancia: Incluso los chefs pueden querer ciertos ingredientes bajo cerradura y válvula, como durante la temporada de trufas. Todo el nuevo copo de cocaína Características de gobierno Habitable a través de Snowflake Horizon permite que el ataque, y los derechos de uso se pueden concretar de gran guisa y estrictamente aplicada con características tales como controles de ataque basados en roles, enmascaramiento de datos, etiquetado de objetos y auditoría. La táctica de Snowflake es tolerar los modelos de IA a los datos en el interior de su entorno seguro, en ocasión de mover datos empresariales confidenciales. Esto reduce significativamente los riesgos de seguridad y gobernanza asociados con herramientas de IA externas. Es como cerciorarse de que la cocina esté realizada en su cocina en ocasión de tolerar sus ingredientes a la casa del vecino.
- Descubrimiento: Obviamente, los chefs deben poder encontrar sus ingredientes, idealmente en contenedores etiquetados. Y quieren conocer la composición y el origen, con la viejo cantidad de detalles posible. Piense en los hechos nutricionales como metadatos. Un catálogo de datos, como Catálogo de horizonte de copo de cocaínaproporciona un inventario de activos de datos con metadatos, contexto y detalles de accesibilidad, lo que hace que los datos sean más fáciles de encontrar y comprender. La interfaz de Snowflake’s Scowsight permite que el perfil de datos instintivo, visualizaciones y paneles de datos automáticos para la exploración de datos rápidos. Y Mercado de copos de cocaína Facilita el descubrimiento hacedero y el ataque a diversos conjuntos de datos y aplicaciones preconstruidas, tanto utilizando datos internos como de fuentes externas. Eso es una cocina sobrado impresionante para cualquier chef.
El resultado final: los datos listos para AI no son solo un buen de tener. Si desea una IA efectiva y valioso, tiene que estar aceptablemente entrenada. Datos relevantes y limpios significa que sus modelos de IA funcionan mejor. Cuando sus datos son fáciles de encontrar y hacedero de entender, pasa menos tiempo preparándolo. Piense en la cocina aceptablemente organizada, con latas de harina, azúcar y sal; un estante de especias con frascos etiquetados y fechados; y un refrigerador abastecido con ingredientes frescos. Con datos como ese, puede construir, editar y avanzar iniciativas de IA mucho más rápido e impulsar la reutilización de datos en múltiples proyectos.
Los datos listos para AI rara vez salen «fuera del estante»
Los datos listos para AI no solo suceden. Raramente hay una interpretación preempaquetada y toldo. Puede tener suerte y encontrar algunos. Pero si desarrolla buenas prácticas de datos, puede crear su propio mercado interno donde los equipos pueden encontrar los ingredientes que necesitan.
La responsabilidad de los datos listos para AI no se encuentra en el interior de un solo individuo o área; Es un esfuerzo compartido y interfuncional con múltiples partes interesadas en una ordenamiento, desde liderazgo hasta equipos técnicos, propietarios de datos y aquellos que lo usarán. En el idioma de la cocina, se necesita una regimientos, del chef cerca de debajo.
En ocasión de centrarse en los nuevos roles, concéntrese en las responsabilidades, es sostener, lo que necesita conquistar contra a quién necesita contratar. Aquí hay una descripción común de lo que podría precisar:
- Ejecutivos de apoyo son críticos para el éxito de las iniciativas de IA, ya que se escalera en una ordenamiento. Los ejecutivos definen los objetivos comerciales generales a los que debe alinearse una táctica de IA y datos. Asignan el presupuesto necesario, el personal y la infraestructura tecnológica para apoyar la búsqueda de estos objetivos y defender una civilización que promueva el uso efectivo y responsable de los datos y la IA. En última instancia, los ejecutivos son responsables de lo que sucede en sus organizaciones, ya sea que se trate de ganancias reportadas al final del trimestre o la violación de datos que ocurrió durante el fin de semana. Un Comité Directivo Ejecutor para AI debe asegurar que el liderazgo esté informado e involucrado.
- Liderazgo de datos (el CDO o el líder de datos más senior)mientras que parte del Comité Directivo Ejecutor es responsable de concretar e implementar la táctica de datos, las políticas y los procedimientos para asegurar la calidad, la seguridad y la accesibilidad de los datos. El CDO o equivalente trabaja con otras unidades de negocios para establecer roles y responsabilidades claras para la propiedad y compañía de datos y para desarrollar las pautas para regir el ciclo de vida de datos, desde la cosecha hasta el almacenamiento, el procesamiento y el uso. El rol de CDO varía entre las empresas pero debe servir como chef ejecutante (retornar a la parecido de la cocina), incluso si las tareas se distribuyen a las unidades de negocios. El CDO encabezará un Consejo de Datos para coordinar la política, los requisitos y el uso.
- Propiedad de datos y compañía existe en el interior de unidades de negocios específicas más familiarizadas con un conjunto de datos en particular. La propiedad implica responsabilidad. La compañía es responsabilidad de la precisión, integridad y consistencia de sus datos. Aquellos con estas tareas aseguran que los datos se seleccionen correctamente, recopilados, documentados y mantenidos de acuerdo con las políticas de gobierno establecidas, y que los datos de su dominio cumplan con las regulaciones relevantes y las políticas internas. Estos son los cocineros de bisectriz. Las organizaciones más pequeñas o más centralizadas mantienen la propiedad y la compañía de datos en el interior de un solo equipo de datos, pero a escalera los equipos centrales se convierten en un cuello de botella. Sin confiscación, las tareas no necesitan distribuirse por igual para todas las unidades de negocios. La propiedad y la compañía híbrida sigue siendo global.
- Tareas de ingeniería de plataforma e datos – Construir y sostener la infraestructura de datos, las tuberías y las plataformas que recopilan, almacenan, procesan y hacen que los datos sean accesibles para los modelos de IA, a menudo permanecen en el interior de él. Sin confiscación, aquellos con estos roles colaboran para integrar datos de fuentes dispares, asegurar la consistencia e interoperabilidad e implementar controles para la seguridad de los datos, la dirección de ataque y la privacidad. El trabajo de ingeniería de datos incluso se puede distribuir.
- Revisiones de cumplimiento, lícito y ética Típicamente son realizados por equipos de expertos específicos. Serven un papel consultivo para asegurar que todas las prácticas de datos, especialmente en relación con la información confidencial o personal, cumplan con las regulaciones de privacidad de datos relevantes (como GDPR o CCPA) y las regulaciones emergentes de IA (como la Ley de AI de la UE). Algunas empresas, como Salesforcetenga una oficina de ética que supervisa el uso de IA en los equipos de productos y clientes. Desarrollan marcos para identificar y mitigar el sesgo en los datos y los modelos de IA y monitorean el uso de la equidad, la transparencia y la responsabilidad.
- Científicos de datos e ingenieros de IA/ML son roles, no tareas, y merecen ser llamados como tales. Como los principales consumidores de datos listos para AI, son responsables de articular las micción de datos específicas de sus modelos de IA (por ejemplo, pandeo, variedad, relevancia y requisitos de etiquetado). Analizan datos de problemas de calidad, prejuicios e idoneidad para la capacitación de IA y proporcionan comentarios a los propietarios de datos y equipos de gobernanza sobre calidad de datos, accesibilidad y brechas que deben abordarse para mejorar el rendimiento del maniquí.