Snowflake AI Data Cloud ha democratizado los datos de miles de clientes, eliminando silos de datos e impulsando casos de uso de colaboración e intercambio de datos. Muchos clientes han podido desbloquear un enorme valía de sus datos con Snowflake, incluida la colaboración segura en datos confidenciales utilizando Snowflake. Salas limpias de datos y Gobernanza de datos características. Sin bloqueo, algunos datos mucho confidenciales han permanecido prohibidos adecuado a requisitos regulatorios y preocupaciones de privacidad, hasta ahora.
Para topar estos desafíos y democratizar verdaderamente incluso los datos mucho confidenciales, nos complace anunciar la disponibilidad común de políticas de privacidad diferenciales en Copo de cocaína. Estos se basan en una tecnología indicación privacidad diferencial, que se considera en la letras académica como el típico de oro para el examen de datos privados. La privacidad diferencial aporta rigor matemático a la protección de la privacidad, lo que permite a los clientes emplear datos que antiguamente eran inaccesibles. Con los datos desbloqueados, los clientes de Snowflake pueden usarlos para impulsar casos de uso de colaboración, como el intercambio de datos entre organizaciones y geografías, e incluso crear nuevas fuentes de ingresos con la monetización de datos.
¿Qué es la privacidad diferencial?
La privacidad diferencial es una tecnología que alivio la privacidad y ayuda a minimizar el peligro de fuga de información confidencial al proteger la identidad de entidades individuales en un conjunto de datos, como personas, organizaciones, ubicación, etc. Se ha implementado en muchos casos de uso de suspensión perfil con datos sensibles, incluidos los Publicación de datos del censo de EE. UU. de 2020 y Resumen de datos de usuarios de Appley está resaltado en el Orden ejecutiva de IA de 2023.
Con privacidad diferencial, los consumidores de datos pueden ejecutar consultas analíticas en el conjunto de datos completo, pero no pueden ver los datos a nivel de fila ni pueden aplicar ingeniería inversa a información confidencial. Complementa los métodos de privacidad de datos que protegen los datos en reposo, en movimiento y en uso.
Para hacer esto, las políticas de privacidad diferencial de Snowflake agregan ruido dinámicamente a los resultados de las consultas. La cantidad de ruido colaborador depende de cuán sensible sea la consulta, según lo determinado por las técnicas matemáticas de privacidad diferencial. Por ejemplo, si la consulta calcula agregados amplios, la cantidad de ruido será relativamente pequeña, potencialmente insignificante. Si la consulta se refiere a un liga pequeño o incluso a un individuo, el ruido será lo suficientemente ancho como para ocultar sus identidades y proteger sus datos más confidenciales contra ataques a la privacidad.
Normalmente, las implementaciones de sistemas diferencialmente privados requieren una inversión y experiencia significativas; Las bibliotecas de privacidad diferencial de código descubierto no sólo no son diferencialmente privadas de un extremo a otro, sino que asimismo pueden no implementar características que hagan que la privacidad diferencial sea útil para casos de uso del mundo efectivo. Sin bloqueo, las políticas de privacidad diferencial de Snowflake están listas para estar de moda de inmediato, sin estas desventajas.
La privacidad diferencial desbloquea los datos en oficio de devaluarlos
La privacidad diferencial es una alivio significativa en comparación con los enfoques existentes, que hacen mucho más por devaluar los datos. Para ilustrar esto, examinemos un caso de uso de la industria de la sanidad que utiliza un conjunto de datos de visitas de pacientes a proveedores de atención médica. En este ejemplo, el proveedor de datos debe proteger las identidades de los pacientes para cumplir con las normas de privacidad.
Para la traducción básica de este caso de uso, supongamos que tenemos un conjunto de datos donde cada fila representa una recepción entre un paciente y un proveedor de atención médica. Sin privacidad diferencial, el proveedor de datos normalmente enmascararía los campos que podrían estar de moda para identificar al paciente, como la vencimiento de la recepción. Campos como estos se enmascararían con un nivel de granularidad más gordo, como eliminar el mes y el día y dejar solo el año. Si aceptablemente este enfoque puede parecer tener sentido desde el punto de presencia de la privacidad, reduce drásticamente el valía de los datos. Por ejemplo, los consumidores de datos ya no pueden hacer preguntas como: «En promedio, ¿cuánto tiempo se toma el medicamento X para la condición Y?»
Con privacidad diferencial, el proveedor de datos no necesita disimular ni eliminar ningún campo, lo que permite a los consumidores de datos hacer este tipo de preguntas detalladas y cobrar respuestas aperos.
La diferencia entre los enfoques existentes y la privacidad diferencial se vuelve aún más marcada cuando analizamos una traducción más realista de este caso de uso. A menudo, en conjuntos de datos como las visitas al médico entre pacientes, la afección y el medicamento prescrito no están claramente disponibles en una columna. En cambio, los datos tienen un campo de texto no estructurado que contiene las notas del médico durante la recepción.
Es difícil redactar de forma segura datos confidenciales de campos como este y, en muchos casos, la redacción devaluará los datos. Por ejemplo, el campo de notas a menudo contiene información de identificación como el nombre del paciente porque incluye copiar y pegar todos los campos del sistema de admisión del proveedor.
En muchos casos, los enfoques para redactar esta información asimismo redactan información de sanidad personal, como la afección diagnosticada o el medicamento recetado, que, si aceptablemente es sensible por recepción o por paciente, asimismo contiene el principal valía analítico de los datos. Adecuado a la devaluación, este tipo de casos de uso a menudo no son posibles con las técnicas de privacidad comúnmente utilizadas en la hogaño.
La privacidad diferencial desbloquea estos casos de uso y permite a los consumidores de datos realizar consultas en campos de texto no estructurados en conjunto. Los analistas e investigadores ahora pueden hacer y obtener respuestas a preguntas como: «Según las notas del médico sobre el medicamento Y, ¿qué porcentaje de pacientes experimentan bienes secundarios?»
Los casos de uso para la privacidad diferencial abarcan todas las industrias
Si aceptablemente el ejemplo antedicho involucra un caso de uso en la atención médica, hemos gastado la misma historia una y otra vez en todas las industrias. Aquí hay una pequeña muestra de casos de uso:
-
Publicidad, medios y entretenimiento: Proteja a las personas en datos a nivel de evento sobre resultados publicitarios para la orientación, optimización y medición de anuncios.
-
Servicios financieros: Monetización de datos de banca de consumo; aprovisionamiento de datos sobre mercados de capitales, incluido el Texto Central de Riesgos; corretaje de primera calidad; administración de activos
-
Salubridad y ciencias de la vida: Desbloquee conjuntos de datos como registros médicos electrónicos, determinantes sociales de la sanidad, datos genómicos, afirmaciones médicas y farmacéuticas y ensayos clínicos para aplicaciones en investigación, monetización de datos y expansión de fármacos.
-
Fabricación: Telemetría de producto en equipos para mantenimiento predictivo
-
Sector divulgado: Intercambio de datos entre agencias y oficinas; propagar estadísticas fuera de las zonas de clasificación o al divulgado; ampliar el paso a PII y PHI para investigación
-
Comercio minorista y haberes de consumo: Customer 360 entre organizaciones, monetización de datos sobre el comportamiento del consumidor en todos los puntos de cesión y evaluación comparativa de la sujeción de suministro
-
Tecnología: Intercambio de datos externos para investigadores y responsables políticos; examen de telemetría de productos
-
Telecomunicaciones: Monetización de datos de movimiento del dispositivo del legatario
Si aceptablemente algunos de estos casos de uso son posibles hoy en día, no están alcanzando su mayor potencial porque la información se elimina de los datos en un intento de proteger la privacidad. Con la privacidad diferencial, estos casos de uso se desbloquean por completo y los datos permanecen protegidos contra filtraciones de privacidad y ataques dirigidos a la privacidad.
Obtenga el valía total de sus datos confidenciales
Las políticas de privacidad diferenciales ahora están disponibles para todos los clientes de Snowflake con cuentas de la impresión Enterprise o superior. Para comenzar y obtener más información sobre la privacidad diferencial en Snowflake, consulte esto vídeo de demostración y deletrear el Documentación del copo de cocaína. Y no te pierdas nuestro seminario web bajo demanda sobre tecnologías que mejoran la privacidad y que pueden ayudarle a equilibrar las compensaciones entre la privacidad y la utilidad de los datos.