Athrun Data Intelligence


marca_hora_col es el nombre de una columna de marca de tiempo que se utiliza para unirse a una tabla que contiene las claves de entidad necesarias para el entrenamiento para recuperar títulos de características correctos en un momento determinado.

Un beneficio secreto de Snowflake Feature Store es el uso de tablas dinámicas para automatizar y generalizar la complejidad de los datos y la encargo de reabastecimiento y canalización de ingeniería de funciones. En muchas soluciones de almacenamiento de características, el afortunado es responsable de crear todos los datos y la dialéctica de ingeniería de características para realizar el llenado original y la posterior «modernización» de los títulos de las características. Luego, estos pasos deben programarse y administrarse manualmente fuera del almacén de funciones.

En una pinta de funciones administrada por Snowflake, todo esto se maneja de forma declarativa. Usted define la dialéctica para calcular características a lo extenso de todo el historial, utilizando Dataframe/SQL. Snowflake maneja la incrementalización de esa dialéctica declarativa. Para utilizar estas vistas de funciones administradas, simplemente especifique el frecuencia_actualizaciónque define la frecuencia de modernización de las funciones y qué tan actualizadas necesita que estén sus funciones desde sus tablas de origen. Las vistas de funciones administradas por Snowflake se pueden monitorear desde la interfaz de afortunado de Snowsight a través del nuevo soporte de la tienda de funciones.

Si acertadamente en la mayoría de los casos querrá utilizar dichas vistas de funciones administradas, puede suceder escenarios en los que desee utilizar canales de funciones, mantenidos por usted, que se ejecutan mediante herramientas externas. En este caso, cree una pinta de funciones omitiendo la frecuencia_actualización. Esto crea vistas de funciones mantenidas por el afortunado que se calculan en el momento de la recuperación.

Generando datos de entrenamiento

Un propósito secreto de los almacenes de características es simplificar la coexistentes de conjuntos de datos de entrenamiento consistentes. Feature Store proporciona API para suscitar datos de entrenamiento en dos formatos según su flujo de trabajo. En cualquier caso, Snowflake Feature Store maneja la recuperación de títulos correctos de un momento determinado utilizando la marca de tiempo y ASOF ÚNETE funcionan para unir de guisa válido y escalable características desde múltiples vistas, generando resultados consistentes en el tiempo.

Conjunto de datos de copo de cocaína es un nuevo objeto a nivel de esquema especialmente diseñado para flujos de trabajo de formación obligatorio. Los conjuntos de datos de Snowflake contienen colecciones de datos organizados en versiones, donde cada una contiene una instantánea materializada de sus datos con inmutabilidad garantizada, acercamiento válido a los datos e interoperabilidad con marcos de formación profundo populares, como PyTorch y TensorFlow. Los conjuntos de datos se pueden crear cómodamente desde Feature Store como se muestra a continuación:


Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *