Athrun Data Intelligence



El filósofo germano Fredrich Nietzsche dijo una vez que “los hilos invisibles son los lazos más fuertes”. Se podría pensar que los “hilos invisibles” unen objetos relacionados, como las casas en la ruta de un repartidor, o entidades más nebulosas, como transacciones en una red financiera o usuarios en una red social.

El informático Julian Shun estudia estos tipos de conexiones multifacéticas pero a menudo invisibles mediante gráficos, donde los objetos se representan como puntos o vértices, y las relaciones entre ellos se modelan mediante segmentos de bisectriz o aristas.

Shun, un profesor asociado recientemente titular en el Unidad de Ingeniería Eléctrica e Informática, diseña algoritmos gráficos que podrían estar de moda para encontrar el camino más corto entre hogares en la ruta del conductor de entrega o detectar transacciones fraudulentas realizadas por actores maliciosos en una red financiera.

Pero con el creciente tamaño de datos, dichas redes han crecido hasta incluir miles de millones o incluso billones de objetos y conexiones. Para encontrar soluciones eficientes, Shun crea algoritmos de suspensión rendimiento que aprovechan la computación paralela para analizar rápidamente incluso los gráficos más enormes. Como la programación paralela es notoriamente difícil, además desarrolla marcos de programación fáciles de usar que facilitan a otros escribir sus propios algoritmos gráficos eficientes.

“Si estás buscando poco en un motor de búsqueda o en una red social, querrás obtener resultados muy rápidamente. Si intenta identificar transacciones financieras fraudulentas en un parcialidad, debe hacerlo en tiempo efectivo para minimizar los daños. Los algoritmos paralelos pueden acelerar las cosas mediante el uso de más capital informáticos”, explica Shun, quien además es investigador principal en el Laboratorio de Ciencias de la Computación e Inteligencia Químico (CSAIL).

Estos algoritmos se utilizan con frecuencia en los sistemas de recomendación en bisectriz. Busque un producto en un sitio web de comercio electrónico y lo más probable es que vea rápidamente una tira de artículos relacionados que además puede añadir a su carrito. Esa tira se genera con la ayuda de algoritmos gráficos que aprovechan el paralelismo para encontrar rápidamente rudimentos relacionados en una red masiva de usuarios y productos disponibles.

Conexiones del campus

Cuando era adolescente, la única experiencia de Shun con las computadoras fue una clase de secundaria sobre creación de sitios web. Más interesado en las matemáticas y las ciencias naturales que en la tecnología, tenía la intención de especializarse en una de esas materias cuando se matriculó en la Universidad de California en Berkeley.

Pero durante su primer año, un amigo le recomendó tomar una clase de comienzo a la informática. Si perfectamente no estaba seguro de qué esperar, decidió inscribirse.

“Me enamoré de la programación y el diseño de algoritmos. Me cambié a la informática y nunca miré detrás”, recuerda.

Ese curso original de informática fue a su propio ritmo, por lo que Shun aprendió por sí mismo la longevo parte del material. Disfrutaba de los aspectos lógicos del avance de algoritmos y del breve circuito de feedback de los problemas informáticos. Shun podía introducir sus soluciones en la computadora y ver inmediatamente si tenía razón o no. Y los errores en las soluciones equivocadas lo guiarían en dirección a la respuesta correcta.

“Siempre pensé que era divertido crear cosas y, en programación, estás creando soluciones que hacen poco útil. Eso me atrajo”, añade.

Posteriormente de graduarse, Shun pasó algún tiempo en la industria pero pronto se dio cuenta de que quería seguir una carrera académica. En la universidad sabía que tendría la soltura de estudiar los problemas que le interesaran.

Entrar en gráficos

Se matriculó como estudiante de posgrado en la Universidad Carnegie Mellon, donde centró su investigación en algoritmos aplicados y computación paralela.

Como estudiante universitario, Shun había tomado clases de algoritmos teóricos y cursos prácticos de programación, pero los dos mundos no conectaban. Quería realizar una investigación que combinara teoría y aplicación. Los algoritmos paralelos encajaban perfectamente.

“En la computación paralela, hay que preocuparse por las aplicaciones prácticas. El objetivo de la computación paralela es acelerar las cosas en la vida efectivo, por lo que si sus algoritmos no son rápidos en la destreza, entonces no son tan aperos”, afirma.

En Carnegie Mellon, conoció los conjuntos de datos gráficos, donde los objetos de una red se modelan como vértices conectados por aristas. Se sintió atraído por las numerosas aplicaciones de este tipo de conjuntos de datos y por el desafiante problema de desarrollar algoritmos eficientes para manejarlos.

Posteriormente de completar una ayuda postdoctoral en Berkeley, Shun buscó un puesto docente y decidió unirse al MIT. Había estado colaborando con varios profesores del MIT en investigaciones sobre computación paralela y estaba entusiasmado de unirse a un instituto con tanta experiencia.

En uno de sus primeros proyectos luego de unirse al MIT, Shun unió fuerzas con el profesor del Unidad de Ingeniería Eléctrica y Ciencias de la Computación y miembro de CSAIL Saman Amarasinghe, un experimentado en lenguajes de programación y compiladores, para desarrollar un ámbito de programación para el procesamiento de gráficos conocido como Graficarlo. El ámbito acomodaticio de usar, que genera código competente a partir de especificaciones de suspensión nivel, funcionó aproximadamente cinco veces más rápido que el futuro mejor enfoque.

“Esa fue una colaboración muy fructífera. No podría acontecer creado una posibilidad tan potente si hubiera trabajado solo”, afirma.

Shun además amplió su enfoque de investigación para incluir algoritmos de aglutinamiento, que buscan agrupar puntos de datos relacionados. Él y sus estudiantes construyen algoritmos y marcos paralelos para resolver rápidamente problemas complejos de agrupación en clústeres, que pueden estar de moda para aplicaciones como la detección de anomalías y la detección de comunidades.

Problemas dinámicos

Recientemente, él y sus colaboradores se han centrado en problemas dinámicos en los que los datos de una red de gráficos cambian con el tiempo.

Cuando un conjunto de datos tiene miles de millones o billones de puntos de datos, ejecutar un operación desde cero para realizar un pequeño cambio podría resultar extremadamente costoso desde el punto de sagacidad computacional. Él y sus alumnos diseñan algoritmos paralelos que procesan muchas actualizaciones al mismo tiempo, mejorando la eficiencia y preservando la precisión.

Pero estos problemas dinámicos además plantean uno de los mayores desafíos que Shun y su equipo deben aventajar. Conveniente a que no hay muchos conjuntos de datos dinámicos disponibles para probar algoritmos, el equipo a menudo debe difundir datos sintéticos que pueden no ser realistas y podrían obstaculizar el rendimiento de sus algoritmos en el mundo efectivo.

Al final, su objetivo es desarrollar algoritmos de gráficos dinámicos que funcionen de forma competente en la destreza y que al mismo tiempo cumplan con las garantías teóricas. Eso garantiza que serán aplicables en una amplia matiz de entornos, afirma.

Shun calma que los algoritmos paralelos dinámicos tengan un enfoque de investigación aún longevo en el futuro. A medida que los conjuntos de datos continúan haciéndose más grandes, más complejos y cambian más rápidamente, los investigadores necesitarán crear algoritmos más eficientes para mantenerse al día.

Incluso calma que surjan nuevos desafíos a partir de los avances en la tecnología informática, ya que los investigadores necesitarán diseñar nuevos algoritmos para usar las propiedades del nuevo hardware.

«Esa es la belleza de la investigación: puedo intentar resolver problemas que otras personas no han resuelto antiguamente y contribuir con poco útil a la sociedad», afirma.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *