Athrun Data Intelligence



A medida que los costos de las tecnologías de dictamen y secuenciación se han desplomado en los últimos abriles, los investigadores han recopilado una cantidad sin precedentes de datos sobre enfermedades y biología. Desafortunadamente, los científicos que esperan tener lugar de los datos a nuevas curas a menudo necesitan la ayuda de cierto con experiencia en ingeniería de software.

Ahora, Watershed Bio está ayudando a científicos y bioinformáticos a realizar experimentos y obtener información con una plataforma que permite a los usuarios analizar conjuntos de datos complejos independientemente de sus habilidades computacionales. La plataforma basada en la estrato proporciona plantillas de flujo de trabajo y una interfaz personalizable para ayudar a los usuarios a explorar y compartir datos de todo tipo, incluida la secuenciación del genoma completo, transcriptómica, proteómica, metabolómica, imágenes de stop contenido, plegamiento de proteínas y más.

«Los científicos quieren formarse sobre las partes del campo del software y la ciencia de datos, pero no quieren convertirse en ingenieros de software que escriben código solo para comprender sus datos», dice el cofundador y director ejecutante Jonathan Wang ’13, SM ’15. «Con Watershed, no es necesario».

Watershed está siendo utilizado por equipos de investigación grandes y pequeños de la industria y el mundo colegial para impulsar el descubrimiento y la toma de decisiones. Cuando se describen nuevas técnicas analíticas avanzadas en revistas científicas, se pueden ampliar a la plataforma de Watershed inmediatamente como plantillas, lo que hace que las herramientas de vanguardia sean más accesibles y colaborativas para investigadores de todos los orígenes.

«Los datos en biología están creciendo exponencialmente y las tecnologías de secuenciación que generan estos datos son cada vez mejores y más baratas», afirma Wang. «Viniendo del MIT, este tema estaba cabal en mi punto de mando: es un problema técnico difícil. Todavía es un problema significativo porque estas personas están trabajando para tratar enfermedades. Saben que todos estos datos tienen valencia, pero les cuesta usarlos. Queremos ayudarlos a desbloquear más conocimientos más rápido».

Sin descubrimiento de código

Wang esperaba especializarse en biología en el MIT, pero rápidamente se entusiasmó con las posibilidades de crear soluciones que pudieran demorar a millones de personas con informática. Terminó obteniendo su estudios y ingenio en el Área de Ingeniería Eléctrica e Informática (EECS). Wang asimismo hizo una pasantía en un laboratorio de biología en el MIT, donde se sorprendió de lo lentos y laboriosos que eran los experimentos.

«Vi la diferencia entre biología e informática, donde había estos entornos dinámicos (en informática) que te permitían obtener feedback de inmediato», dice Wang. «Incluso siendo una sola persona escribiendo código, tienes mucho a tu valor para arriesgar».

Mientras trabajaba en enseñanza obligatorio y computación de stop rendimiento en el MIT, Wang asimismo cofundó una empresa de comercio de adhesión frecuencia con algunos compañeros de clase. Su equipo contrató investigadores con doctorados en áreas como matemáticas y física para desarrollar nuevas estrategias comerciales, pero rápidamente vieron un cuello de botella en su proceso.

«Las cosas avanzaban lentamente porque los investigadores estaban acostumbrados a construir prototipos», dice Wang. «Éstas eran pequeñas aproximaciones de modelos que podían ejecutar localmente en sus máquinas. Para poner esos enfoques en producción, necesitaban ingenieros que los hicieran funcionar de guisa de stop rendimiento en un liga de computación. Pero los ingenieros no entendían la naturaleza de la investigación, por lo que hubo muchas idas y venidas. Significaba que ideas que pensabas que podrían haberse implementado en un día tomaban semanas».

Para resolver el problema, el equipo de Wang desarrolló una capa de software que hizo que la construcción de modelos listos para producción fuera tan ligera como construir prototipos en una computadora portátil. Luego, unos abriles luego de graduarse del MIT, Wang notó que tecnologías como la secuenciación de ADN se habían vuelto baratas y ubicuas.

“El cuello de botella ya no era la secuenciación, por lo que la gentío decía: ‘Secuenciamos todo’”, recuerda Wang. «El número limitante se convirtió en la computación. La gentío no sabía qué hacer con todos los datos que se generaban. Los biólogos esperaban que los científicos de datos y bioinformáticos los ayudaran, pero esas personas no siempre entendían la biología a un nivel suficientemente profundo».

La situación le parecía sencillo a Wang.

«Era exactamente como lo que vimos en finanzas, donde los investigadores intentaban trabajar con ingenieros, pero los ingenieros nunca lo entendieron del todo, y había toda esta ineficiencia con la gentío esperando a los ingenieros», dice Wang. «Mientras tanto, aprendí que los biólogos tienen penuria de realizar estos experimentos, pero hay una brecha tan conspicuo que sintieron que tenían que convertirse en ingenieros de software o simplemente centrarse en la ciencia».

Wang fundó oficialmente Watershed en 2019 con el médico Mark Kalinich ’13, un ex compañero de clase en el MIT que ya no participa en las operaciones diarias de la empresa.

Desde entonces, Wang ha escuchado a ejecutivos de biotecnología y productos farmacéuticos balbucir sobre la creciente complejidad de la investigación en biología. Descubrir nuevos conocimientos implica cada vez más analizar datos de genomas completos, estudios de población, secuenciación de ARN, espectrometría de masas y más. Desarrollar tratamientos personalizados o separar poblaciones de pacientes para un estudio clínico asimismo puede requerir enormes conjuntos de datos, y constantemente se publican nuevas formas de analizar los datos en revistas científicas.

Hoy en día, las empresas pueden ejecutar estudio a gran escalera en Watershed sin tener que configurar sus propios servidores o cuentas de computación en la estrato. Los investigadores pueden utilizar plantillas listas para usar que funcionen con todos los tipos de datos más comunes para acelerar su trabajo. Todavía están disponibles herramientas populares basadas en inteligencia sintético como AlphaFold y Geneformer, y la plataforma de Watershed facilita compartir flujos de trabajo y profundizar en los resultados.

«La plataforma alcanza un punto inmejorable de usabilidad y personalización para personas de todos los orígenes», dice Wang. «Ninguna ciencia es positivamente igual. Evito la palabra producto porque eso implica implementar poco y luego simplemente ejecutarlo a escalera para siempre. La investigación no es así. La investigación consiste en originar una idea, probarla y utilizar el resultado para originar otra idea. Cuanto más rápido puedas diseñar, implementar y ejecutar experimentos, más rápido podrás tener lugar al ulterior».

Acelerando la biología

Wang cree que Watershed está ayudando a los biólogos a mantenerse al día con los últimos avances en biología y acelerando los descubrimientos científicos en el proceso.

«Si se puede ayudar a los científicos a descubrir conocimientos no un poco más rápido, sino 10 o 20 veces más rápido, positivamente se puede marcar la diferencia», afirma Wang.

Watershed está siendo utilizado por investigadores del mundo colegial y de empresas de todos los tamaños. Los ejecutivos de empresas farmacéuticas y de biotecnología asimismo utilizan Watershed para tomar decisiones sobre nuevos experimentos y candidatos a fármacos.

«Hemos trillado éxito en todas esas áreas, y el hilo popular es que las personas entienden la investigación pero no son expertas en ciencias de la computación o ingeniería de software», dice Wang. «Es emocionante ver cómo se desarrolla esta industria. Para mí, es quimérico ser del MIT y ahora estar de regreso en Kendall Square, donde tiene su sede Watershed. Aquí es donde se están produciendo gran parte del progreso de vanguardia. Estamos tratando de hacer nuestra parte para permitir el futuro de la biología».

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *