Athrun Data Intelligence


El expansión de un dictamen diferencial preciso (DDX) es una parte fundamental de la atención médica, típicamente lograda a través de un proceso paso a paso que integra el historial del paciente, los exámenes físicos y las pruebas de dictamen. Con el auge de las LLM, existe un potencial de creciente para apoyar y automatizar partes de este delirio de dictamen utilizando herramientas interactivas con viandas de IA. A diferencia de los sistemas de IA tradicionales que se centran en producir un solo dictamen, el razonamiento clínico del mundo actual implica renovar y evaluar continuamente múltiples posibilidades de dictamen a medida que hay más datos de pacientes disponibles. Aunque el enseñanza profundo ha generado con éxito DDX en campos como radiología, oftalmología y dermatología, estos modelos generalmente carecen de las capacidades interactivas y conversacionales necesarias para comprometerse de modo efectiva con los médicos.

The Adviento de LLMS ofrece una nueva vía para construir herramientas que pueden soportar DDX a través de la interacción del verbo natural. Estos modelos, incluidos los de uso universal como GPT-4 y los específicos de los médicos como Med-Palm 2, han mostrado un suspensión rendimiento en los exámenes médicos estandarizados y de opción múltiple. Si correctamente estos puntos de narración inicialmente evalúan el conocimiento médico de un maniquí, no reflejan su utilidad en entornos clínicos reales o su capacidad para ayudar a los médicos durante casos complejos. Aunque algunos estudios recientes han probado LLM en informes de casos desafiantes, todavía hay una comprensión limitada de cómo estos modelos podrían mejorar la toma de decisiones del médico o mejorar la atención al paciente a través de la colaboración en tiempo actual.

Los investigadores de Google introdujeron Amie, un maniquí de verbo amplio Administrado para el razonamiento de dictamen clínico, para evaluar su efectividad para ayudar con DDX. El desempeño independiente de Amie superó a los médicos sin ayuda en un estudio que involucra a 20 médicos y 302 casos médicos complejos del mundo actual. Cuando se integran en una interfaz interactiva, los médicos que usan AMIE adyacente con herramientas tradicionales produjeron listas DDX significativamente más precisas e integrales que aquellos que usan posibles unificado solo. AMIE no solo mejoró la precisión diagnóstica sino además mejoró las habilidades de razonamiento de los médicos. Su desempeño además superó a GPT-4 en evaluaciones automatizadas, mostrando promesa de aplicaciones clínicas del mundo actual y un entrada más amplio al soporte de nivel avezado.

Amie, un maniquí de idioma razonable para tareas médicas, demostró un cachas rendimiento en la gestación de DDX. Sus listas fueron calificadas en extremo para la calidad, la idoneidad y la amplitud. En el 54% de los casos, el DDX de Amie incluyó el dictamen correcto, superando significativamente a los médicos no asistidos. Logró una precisión de los 10 mejores del 59%, con el dictamen adecuado clasificado primero en el 29% de los casos. Los médicos asistidos por Amie además mejoraron su precisión diagnóstica en comparación con el uso de herramientas de búsqueda o trabajando solo. A pesar de ser nuevo en la interfaz AMIE, los médicos lo usaron de modo similar a los métodos de búsqueda tradicionales, mostrando su usabilidad habilidad.

En un estudio comparativo entre AMIE y GPT-4 utilizando un subconjunto de 70 casos de CPC NEJM, las comparaciones directas de evaluación humana fueron limitadas conveniente a diferentes conjuntos de evaluadores. En cambio, se utilizó una métrica automatizada que se alineaba razonablemente con el sensatez humano. Mientras que GPT-4 superó marginalmente a AMIE en la precisión de Top-1 (aunque no es estadísticamente significativa), AMIE demostró una precisión superior superior para N> 1, con ganancias notables para N> 2. Esto sugiere que AMIE generó DDX más integral y apropiado, un aspecto crucial en la razonamiento clínico del mundo actual. Por otra parte, AMIE superó a los médicos certificados por la agrupación en tareas DDX independientes y mejoró significativamente el rendimiento del clínico como una útil de protección, produciendo una maduro precisión de Top-N, calidad DDX y exhaustividad que la protección tradicional basada en la búsqueda.

Más allá del rendimiento bruto, la interfaz conversacional de Amie fue intuitiva y efectivo, y los médicos informaron una maduro confianza en sus listas DDX a posteriori de su uso. Si correctamente existen limitaciones, como la error de entrada de Amie a imágenes y datos tabulares en materiales clínicos y la naturaleza fabricado de las presentaciones de casos de estilo CPC. No obstante, el estudio enfatiza la requisito de una cuidadosa integración de los LLM en los flujos de trabajo clínicos, con atención a la calibración de confianza, la expresión de incertidumbre del maniquí y el potencial para sujetar sesgos y alucinaciones. El trabajo futuro debe evaluar rigurosamente la aplicabilidad, la equidad y los impactos a espléndido plazo del mundo actual asistido por el dictamen.


Confirmar Papel. Todo el crédito por esta investigación va a los investigadores de este tesina. Por otra parte, siéntete vacío de seguirnos Gorjeo Y no olvides unirte a nuestro 85k+ ml de subreddit.


Sana Hassan, una pasante de consultoría en MarktechPost y estudiante de doble naturaleza en IIT Madras, le apasiona aplicar tecnología e IA para topar los desafíos del mundo actual. Con un gran interés en resolver problemas prácticos, aporta una nueva perspectiva a la intersección de la IA y las soluciones de la vida actual.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *