Athrun Data Intelligence



La equívoco en las imágenes médicas puede presentar desafíos importantes para los médicos que intentan identificar enfermedades. Por ejemplo, en una radiografía de tórax, el derrame pleural, una acumulación anormal de nítido en los pulmones, puede parecerse mucho a los infiltrados pulmonares, que son acumulaciones de pus o parentesco.

Un maniquí de inteligencia fabricado podría ayudar al clínico en el disección de rayos X al ayudar a identificar detalles sutiles y aumentar la eficiencia del proceso de diagnosis. Pero adecuado a que muchas condiciones posibles podrían estar presentes en una imagen, el médico probablemente querría considerar un conjunto de posibilidades, en oportunidad de solo tener una predicción de IA para evaluar.

Una forma prometedora de producir un conjunto de posibilidades, citación clasificación conforme, es conveniente porque se puede implementar fácilmente en la parte superior de un maniquí de educación automotriz existente. Sin retención, puede producir conjuntos que son impactamente grandes.

Los investigadores del MIT ahora han desarrollado una perfeccionamiento simple y efectiva que puede resumir el tamaño de los conjuntos de predicciones hasta en un 30 por ciento, al tiempo que hace que las predicciones sean más confiables.

Tener un conjunto de predicción más pequeño puede ayudar a un clínico a concertar en el diagnosis correcto de guisa más eficaz, lo que podría mejorar y racionalizar el tratamiento para los pacientes. Este método podría ser útil en una variedad de tareas de clasificación, por ejemplo, para identificar la especie de un animal en una imagen de un parque de vida silvestre, ya que proporciona un conjunto de opciones más pequeño pero más preciso.

«Con menos clases a considerar, los conjuntos de predicciones son lógicamente más informativos en que está eligiendo entre menos opciones. En cierto sentido, positivamente no está sacrificando falta en términos de precisión para poco más informativo», dice Divya Shanmugam PhD ’24, un postdoc de Cornell Tech que dirigió esta investigación mientras ella era un estudiante de posgrado de MIT.

Shanmugam se une en el papel por Helen Lu ’24; Swami Sankaranarayanan, un ex postdoc de MIT que ahora es científica de investigación de Lilia Biosciences; y el autor senior John Guttag, profesor de Dugald C. Jackson de Ingeniería de Ciencias de la Computación e Eléctrica en el MIT y miembro del Laboratorio de Informática e Inteligencia Sintético del MIT (CSAIL). La investigación se presentará en la conferencia sobre visión por computadora y gratitud de patrones en junio.

Garantías de predicción

Los asistentes de IA implementados para tareas de detención peligro, como clasificar las enfermedades en imágenes médicas, generalmente están diseñados para producir una puntuación de probabilidad anejo con cada predicción para que un adjudicatario pueda cronometrar la confianza del maniquí. Por ejemplo, un maniquí podría predecir que existe un 20 por ciento de posibilidades de que una imagen corresponde a un diagnosis particular, como Pleurisy.

Pero es difícil esperar en la confianza prevista de un maniquí porque muchas investigaciones previas han demostrado que estas probabilidades pueden ser inexactas. Con una clasificación conforme, la predicción del maniquí se reemplaza por un conjunto de diagnósticos más probables anejo con la respaldo de que el diagnosis correcto está en algún oportunidad del conjunto.

Pero la incertidumbre inherente en las predicciones de IA a menudo hace que el maniquí se ponga en conjunto que son demasiado grandes para ser enseres.

Por ejemplo, si un maniquí está clasificando a un animal en una imagen como una de las 10,000 especies potenciales, podría suscitar un conjunto de 200 predicciones para que pueda ofrecer una robusto respaldo.

«Esas son bastantes clases para que cualquiera tamice para descubrir cuál es la clase correcta», dice Shanmugam.

La técnica además puede ser poco confiable porque pequeños cambios en las entradas, como la rotación tenuemente de una imagen, pueden producir conjuntos de predicciones completamente diferentes.

Para hacer que la clasificación conforme sea más útil, los investigadores aplicaron una técnica desarrollada para mejorar la precisión de los modelos de visión por computadora llamado aumento de tiempo de prueba (TTA).

TTA crea múltiples aumentos de una sola imagen en un conjunto de datos, tal vez recortando la imagen, voltearla, acercarse, etc. Luego aplica un maniquí de visión por computadora a cada interpretación de la misma imagen y agrega sus predicciones.

«De esta guisa, obtienes múltiples predicciones de un solo ejemplo. La agregación de predicciones de esta guisa perfeccionamiento las predicciones en términos de precisión y robustez», explica Shanmugam.

Maximización de precisión

Para aplicar TTA, los investigadores mantienen algunos datos de imagen etiquetados utilizados para el proceso de clasificación conforme. Aprenden a unir los aumentos en estos datos retenidos, aumentando automáticamente las imágenes de una guisa que maximiza la precisión de las predicciones del maniquí subyacente.

Luego ejecutan una clasificación conforme en las nuevas predicciones transformadas en TTA del maniquí. El clasificador conforme genera un conjunto más pequeño de predicciones probables para la misma respaldo de confianza.

«Combinar el aumento en el tiempo de prueba con una predicción conforme es liviana de implementar, efectiva en la actos y no requiere capacitación maniquí», dice Shanmugam.

En comparación con el trabajo previo en una predicción conforme en varios puntos de narración de clasificación de imágenes estereotipado, su método mojado de TTA redujo los tamaños de establecimiento de predicción entre los experimentos, del 10 al 30 por ciento.

Es importante destacar que la técnica logra esta reducción en el tamaño del conjunto de predicción mientras se mantiene la respaldo de probabilidad.

Los investigadores además encontraron que, a pesar de que están sacrificando algunos datos etiquetados que normalmente se utilizarían para el procedimiento de clasificación conforme, TTA aumenta la precisión suficiente para exceder el costo de perder esos datos.

«Plantea preguntas interesantes sobre cómo utilizamos datos etiquetados posteriormente del entrenamiento del maniquí. La asignación de datos etiquetados entre diferentes pasos posteriores al entrenamiento es una dirección importante para el trabajo futuro», dice Shanmugam.

En el futuro, los investigadores quieren validar la efectividad de dicho enfoque en el contexto de los modelos que clasifican el texto en oportunidad de las imágenes. Para mejorar aún más el trabajo, los investigadores además están considerando formas de resumir la cantidad de cálculo requerida para TTA.

Esta investigación es financiada, en parte, por la Corporación Wistrom.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *