Athrun Data Intelligence



¿Deberías agarrar tu paraguas ayer de salir por la puerta? Comprobar el pronóstico del tiempo de antemano solo será útil si ese pronóstico es preciso.

Los problemas de predicción espacial, como el pronóstico meteorológico o la estimación de la contaminación del céfiro, implican predecir el valencia de una variable en una nueva ubicación basada en títulos conocidos en otras ubicaciones. Los científicos generalmente usan métodos de acometividad probados para determinar cuánto fiarse en estas predicciones.

Pero los investigadores del MIT han demostrado que estos métodos de acometividad populares pueden estropearse mucho para las tareas de predicción espacial. Esto podría transigir a determinado a creer que un pronóstico es preciso o que un nuevo método de predicción es efectivo, cuando en sinceridad ese no es el caso.

Los investigadores desarrollaron una técnica para evaluar los métodos de acometividad de predicción y lo usaron para demostrar que dos métodos clásicos pueden ser sustancialmente incorrectos en los problemas espaciales. Luego determinaron por qué estos métodos pueden estropearse y crear un nuevo método diseñado para manejar los tipos de datos utilizados para las predicciones espaciales.

En experimentos con datos reales y simulados, su nuevo método proporcionó validaciones más precisas que las dos técnicas más comunes. Los investigadores evaluaron cada método utilizando problemas espaciales realistas, incluida la predicción de la velocidad del derrota en el aeropuerto O-Hare de Chicago y pronosticando la temperatura del céfiro en cinco ubicaciones de Metropolitano US.

Su método de acometividad podría aplicarse a una variedad de problemas, desde ayudar a los científicos climáticos a predecir las temperaturas de la superficie del mar hasta ayudar a los epidemiólogos a estimar los mercadería de la contaminación del céfiro en ciertas enfermedades.

«Con suerte, esto conducirá a evaluaciones más confiables cuando las personas presenten nuevos métodos predictivos y una mejor comprensión de qué tan acertadamente están funcionando los métodos», dice Tamara Broderick, profesora asociada en el Unidad de Ingeniería Eléctrica e Informática del MIT (EECS) , miembro del Laboratorio de Sistemas de Información y Intrepidez y del Instituto de Datos, Sistemas y Sociedad, y un afiliado del Laboratorio de Informática e Inteligencia Químico (CSAIL).

Broderick se une en el papel por el autor principal y el postdoc de MIT David R. Burt y el estudiante reconocido de las CEE Yunyi Shen. La investigación se presentará en la Conferencia Internacional sobre Inteligencia Químico y Estadísticas.

Evaluación de validaciones

El orden de Broderick ha colaborado recientemente con oceanógrafos y científicos atmosféricos para desarrollar modelos de predicción de formación forzoso que puedan estar de moda para problemas con un componente espacial válido.

A través de este trabajo, notaron que los métodos de acometividad tradicionales pueden ser inexactos en entornos espaciales. Estos métodos mantienen una pequeña cantidad de datos de capacitación, llamados datos de acometividad, y los usan para evaluar la precisión del predictor.

Para encontrar la raíz del problema, realizaron un exploración pormenorizado y determinaron que los métodos tradicionales hacen suposiciones inapropiadas para los datos espaciales. Los métodos de evaluación se basan en suposiciones sobre cómo se relacionan los datos de acometividad y los datos que uno quiere predecir, llamados datos de prueba.

Los métodos tradicionales suponen que los datos de acometividad y los datos de prueba son independientes y distribuidos de modo idéntica, lo que implica que el valencia de cualquier punto de datos no depende de los otros puntos de datos. Pero en una aplicación espacial, este a menudo no es el caso.

Por ejemplo, un investigador puede estar utilizando datos de acometividad de sensores de contaminación del céfiro de la EPA para probar la precisión de un método que predice la contaminación del céfiro en las áreas de conservación. Sin secuestro, los sensores de la EPA no son independientes: se ubicaron en función de la ubicación de otros sensores.

Adicionalmente, quizás los datos de acometividad provienen de sensores de la EPA cerca de ciudades, mientras que los sitios de conservación se encuentran en las zonas rurales. Adecuado a que estos datos son de diferentes ubicaciones, es probable que tengan diferentes propiedades estadísticas, por lo que no se distribuyen de modo idéntica.

«Nuestros experimentos mostraron que obtienes algunas respuestas positivamente incorrectas en el caso espacial cuando estos supuestos hechos por el método de acometividad se descomponen», dice Broderick.

Los investigadores debían encontrar una nueva suposición.

Específicamente espacial

Pensando específicamente sobre un contexto espacial, donde los datos se recopilan de diferentes ubicaciones, diseñaron un método que asume los datos de acometividad y los datos de prueba varían sin problemas en el espacio.

Por ejemplo, es poco probable que los niveles de contaminación del céfiro cambien drásticamente entre dos casas vecinas.

“Esta suposición de regularidad es apropiada para muchos procesos espaciales, y nos permite crear una forma de evaluar predictores espaciales en el dominio espacial. Hasta donde sabemos, nadie ha realizado una evaluación teórica sistemática de lo que salió mal al encontrar un mejor enfoque «, dice Broderick.

Para usar su técnica de evaluación, uno ingresaría a su predictor, las ubicaciones que desean predecir y sus datos de acometividad, luego automáticamente hace el resto. Al final, estima cuán preciso será el pronóstico del predictor para la ubicación en cuestión. Sin secuestro, evaluar efectivamente su técnica de acometividad demostró ser un desafío.

“No estamos evaluando un método, sino que estamos evaluando una evaluación. Entonces, tuvimos que dar un paso a espaldas, pensar con cuidado y ser creativos sobre los experimentos apropiados que podríamos usar ”, explica Broderick.

Primero, diseñaron varias pruebas utilizando datos simulados, que tenían aspectos poco realistas, pero les permitieron controlar cuidadosamente los parámetros esencia. Luego, crearon datos más realistas y semi-simulados modificando datos reales. Finalmente, utilizaron datos reales para varios experimentos.

Uso de tres tipos de datos de problemas realistas, como predecir el precio de un carretera en Inglaterra en función de su ubicación y pronosticar la velocidad del derrota, les permitió realizar una evaluación integral. En la mayoría de los experimentos, su técnica fue más precisa que cualquier método tradicional con el que lo compararon.

En el futuro, los investigadores planean aplicar estas técnicas para mejorar la cuantificación de la incertidumbre en entornos espaciales. Todavía quieren encontrar otras áreas donde la suposición de regularidad podría mejorar el rendimiento de los predictores, como con los datos de la serie temporal.

Esta investigación es financiada, en parte, por la National Science Foundation y la Oficina de Investigación Naval.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *