Athrun Data Intelligence


Encontrar los activos de datos adecuados en grandes catálogos empresariales puede resultar complicado, especialmente cuando miles de conjuntos de datos están catalogados con metadatos específicos de la estructura. Estudio unificado de Amazon SageMaker ahora admite filtros de búsqueda de metadatos personalizados. Puede filtrar los activos del catálogo utilizando sus propios campos de formulario de metadatos, como radio terapéutica, sensibilidad de los datos o región geográfica, en circunscripción de reconocer nada más de la búsqueda de texto librado. Los formularios de metadatos personalizados son plantillas estructuradas que definen atributos adicionales que se pueden adjuntar a los activos del catálogo.

En esta publicación, aprenderá cómo crear formularios de metadatos personalizados, informar activos con títulos de metadatos y utilizar filtros estructurados para descubrir esos activos. Exploramos un caso de uso de atención médica y ciencias biológicas. Una estructura de investigación cataloga métricas en el catálogo de Amazon SageMaker mediante formularios de metadatos personalizados con campos como Dominio terapéutica y Tamaño de muestra. Los investigadores que crean modelos de estudios necesario ahora pueden inquirir conjuntos de datos basados ​​en filtros personalizados en cientos de activos catalogados para identificar los mejores conjuntos de datos para entrenar sus modelos.

Capacidades esencia

Los filtros de búsqueda de metadatos personalizados en SageMaker Unified Studio ofrecen las siguientes capacidades esencia:

  • Filtros de formulario de metadatos personalizados: puede filtrar los resultados de búsqueda utilizando cualquier campo de formulario de metadatos personalizado definido en su catálogo. Por ejemplo, un investigador puede filtrar por Dominio terapéutica = Oncología y Sensibilidad de datos = Confidencial para circunscribir conjuntos de datos específicos.
  • Filtros de nombre y descripción: puede sumar filtros que se dirijan a nombres o descripciones de activos utilizando un cirujano de búsqueda de texto, lo que permite el descubrimiento específico sin escanear los resultados de búsqueda completos.
  • Filtros de rango de fechas: puede filtrar activos por aniversario usando en, antiguamente, posteriormente y entre operadores, lo que facilita la emplazamiento de activos actualizados recientemente o históricamente relevantes.
  • Filtros combinables: puede combinar varios filtros para crear consultas precisas. Por ejemplo, filtrar por Región de AWS = EE. UU. Y Clasificación = PII Y Actualizado posteriormente del 1 de enero de 2026 devuelve solo activos que coinciden con los tres criterios.
  • Selecciones de filtros persistentes: puede filtrar las configuraciones almacenadas en su navegador y no se comparten entre dispositivos ni con otros usuarios. Seguidamente podrás regresar al catálogo y encontrar tus filtros previamente definidos.

Descripción común de la decisión

En las siguientes secciones, demostramos cómo configurar formularios de metadatos personalizados, informar activos con títulos de metadatos y utilizar filtros de búsqueda de metadatos personalizados para descubrir esos activos. Completamos los siguientes tres pasos para la demostración.

  1. Crear un formulario de metadatos personalizado
  2. Crear y informar posibles con metadatos
  3. Utilice filtros de búsqueda de metadatos personalizados

Requisitos previos

Para seguir esta publicación, debes tener:

Para obtener instrucciones sobre cómo configurar un dominio y un esquema, consulte la Empezando vademécum.

Para crear un formulario de metadatos personalizado

Complete los siguientes pasos para crear un formulario de metadatos personalizado con campos filtrables:

  1. En SageMaker Unified Studio, elija Sumario del esquema desde el panel de navegación.
  2. Bajo Catálogo de proyectosnominar Entidades de metadatos.

  3. Designar Crear formulario de metadatos.

  4. Para crear un nuevo formulario de metadatos ‘research_metadata’ utilice los siguientes detalles y luego elija Crear formulario de metadatos.

  5. Aclarar los campos del formulario. Para esta demostración, agregamos los siguientes campos:

    Crear el primer campo Dominio terapéutica (cautiverio): marcar como buscable



    Crear un segundo campo Recuento de sujetos (inalterable): marcar como filtrable por rango

  6. Marque el formulario como ‘Competente’ para que sea visible y pueda estar de moda.

Crear y informar con metadatos

En esta sección, crea un activo personalizado y adjunta el formulario research_metadata creado en el paso antedicho.

  1. En Catálogo de proyectos en el panel de navegación, elija Entidades de metadatos. Elija la pestaña ‘TIPOS DE ACTIVOS’ y seleccione «CREAR TIPO DE ACTIVOS».

  2. Cree un nuevo tipo de activo y adjunte el formulario de metadatos que creamos en el paso antedicho.



    Se crea una nueva ‘métrica’ de tipo de activo.

  3. A continuación, crearemos dos métricas. Bajo Catálogo de proyectos en el panel de navegación, elija Activos. En la página Activo, elija CREAR, y luego nominar Crear activo desde el menú.

  4. En esta demostración, creará dos métricas.

Para la primera métrica ‘drug_1_treatment’, proporcione el próximo nombre y descripción del activo.

Agregue los siguientes títulos para el formulario de metadatos.

Valida todos los campos y elige CREAR.

Divulgar el procedimiento en el catálogo.

A continuación, crearemos la segunda métrica ‘drug_1_treatment’. Repita los pasos del procedimiento antedicho e ingrese los títulos mostrados.

  • Recuento de sujetos = 450
  • Dominio Terapéutica = Oncología

Utilice filtros de búsqueda de metadatos personalizados

Luego de informar posibles con metadatos personalizados, vaya a la Explorar activos página para utilizar los filtros.

Para explorar posibles y ver filtros

  1. En SageMaker Unified Studio, elija Descubrir en la mostrador de navegación y luego seleccione Catalogar, Explorar activos.
  2. La página de búsqueda se muestra con la mostrador anexo de filtro a la izquierda. Puede ver los filtros del sistema existentes (tipo de datos, términos del lexicón, tipo de activo, esquema propietario, región de origen, cuenta de origen, dispositivo de dominio) adyacente con las nuevas secciones Rango de fechas y Adicionar filtro.

Adicionar un filtro personalizado

  1. Designar + Adicionar filtro en la parte inferior de la mostrador anexo del filtro. Para Tipo de filtrodecidir Formulario de metadatos. Para Formulario de metadatosdecidir metadatos_de_investigación y agregue un filtro como se muestra en la próximo imagen. Designar Aplicar cuando hayas terminado.



    Los resultados de la búsqueda se actualizan para mostrar solo los activos donde ‘subject_count’ es veterano que 50.

Para combinar múltiples filtros

  1. Designar + Adicionar filtro de nuevo. Para Tipo de filtrodecidir Formulario de metadatos. Para Formulario de metadatosdecidir metadatos_de_investigación y agregue un filtro como se muestra en la próximo imagen. Designar Aplicar cuando hayas terminado.

Tener la llave de la despensa filtros personalizados

Las configuraciones de filtro se almacenan en el navegador del usufructuario y no se comparten entre dispositivos o usuarios.

Para personalizar la búsqueda, puede:

  • Rotar filtros: utilice las casillas de comprobación adyacente a cada filtro personalizado para habilitarlos o deshabilitarlos sin eliminarlos.
  • Editar o eliminar: elija el menú de kebab (⋮) adyacente a cualquier filtro personalizado para editar sus títulos o eliminarlo.
  • Borrar todo: elija BORRAR adyacente al encabezado Filtros personalizados para anular la selección de todos los filtros personalizados a la vez.
  • Persistencia: sus filtros personalizados persisten en todas las sesiones del navegador. Cuando regresa a la página Explorar posibles, los filtros definidos previamente todavía aparecen en la mostrador anexo, listos para activarse.

Usando la API de SearchListings

Para inquirir activos del catálogo mediante programación, puede utilizar la API SearchListings en Zona de datos de Amazonque admite las mismas capacidades de filtrado que la interfaz de usufructuario de SageMaker Unified Studio. El próximo ejemplo filtra activos donde un campo de cautiverio personalizado contiene un valencia específico y un campo aritmético está interiormente de un rango:

aws datazone search-listings 
    --domain-identifier "dzd_your_domain_id" 
    --filters '{ "and": (
        { "filter": { "attribute": "research_metadata.TherapeuticArea", "value": "Oncology", "operator": "TEXT_SEARCH" } },
        { "filter": { "attribute": "research_metadata.SubjectCount", "intValue": 100, "operator": "GT" } }
    ) }'

Para más detalles, consulte el Documentación de la API de SearchListings en la Narración de la API de Amazon DataZone.

Mejores prácticas

Considere las siguientes mejores prácticas al utilizar filtros de búsqueda de metadatos personalizados:

  • Defina sus formularios de metadatos antiguamente de informar activos a escalera. Si publica posibles antiguamente de finalizar los formularios, es posible que deba retornar a etiquetar los activos existentes, lo cual es un proceso que requiere mucho tiempo en catálogos grandes.
  • Defina formularios de metadatos alineados con las deyección de descubrimiento de su estructura (áreas terapéuticas, clasificaciones de datos, regiones geográficas) antiguamente de informar activos a escalera.
  • Utilice títulos específicos y coherentes en los campos de metadatos para obtener resultados de filtrado precisos. Por ejemplo, utilice títulos estandarizados (por ejemplo, utilice «Oncología» de forma coherente en circunscripción de «oncología» u «Onc») en todos los activos.
  • Combine múltiples filtros para localizar los resultados de forma válido en circunscripción de escanear conjuntos de resultados amplios.
  • Utilice el filtro de rango de fechas adyacente con filtros de metadatos personalizados para ubicar activos interiormente de períodos de tiempo específicos.

Acicalar posibles

Para obtener instrucciones sobre cómo eliminar los activos agregados, consulte Eliminar un procedimiento de Amazon SageMaker Unified Studio.

Para obtener instrucciones sobre cómo eliminar los formularios de metadatos, consulte Eliminar un formulario de metadatos en Amazon SageMaker Unified Studio.

Conclusión

Los filtros de búsqueda de metadatos personalizados en Amazon SageMaker Unified Studio brindan a los consumidores de datos la capacidad de encontrar activos exactos mediante filtros estructurados basados ​​en los campos de metadatos propios de su estructura. Al combinar múltiples filtros en formularios de metadatos personalizados, nombres de activos, descripciones y rangos de fechas, los consumidores de datos pueden crear consultas precisas que muestren los conjuntos de datos correctos sin escanear resultados de búsqueda amplios. La persistencia del filtro entre sesiones del navegador agiliza aún más los flujos de trabajo de descubrimiento repetidos.

Los filtros de búsqueda de metadatos personalizados ahora están disponibles en las regiones de AWS donde se admite Amazon SageMaker.

Para obtener más información sobre Amazon SageMaker, consulte la Documentación de Amazon SageMaker. Para comenzar con esta capacidad, consulte la Breviario del usufructuario de Amazon SageMaker Unified Studio.


Sobre los autores

Ramesh Singh

Ramesh Singh

Ramesh es apoderado técnico senior de productos (servicios externos) en AWS en Seattle, Washington, y actualmente forma parte del equipo de Amazon SageMaker. Le apasiona crear productos de descomposición y estudios necesario de stop rendimiento que ayuden a los clientes empresariales a alcanzar sus objetivos críticos utilizando tecnología de vanguardia.

Pradeep Misra

Pradeep Misra

Pradeep es arquitecto principal de soluciones de inteligencia químico aplicada y descomposición en AWS. Le apasiona resolver los desafíos de los clientes utilizando datos, descomposición e inteligencia químico aplicada. Fuera del trabajo, le gusta explorar nuevos lugares y desafiar bádminton con su tribu. Incluso le gusta hacer experimentos científicos, construir LEGO y ver anime con sus hijas.

Alexandra von der Goltz

Alexandra von der Goltz

alejandra es ingeniero de avance de software (SDE) en AWS con sede en la ciudad de Nueva York y forma parte del equipo de Amazon SageMaker. Trabaja en el catálogo y las experiencias de descubrimiento de datos interiormente de Unified Studio.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *