3 Preguntas: Modelado de inteligencia adversa para explotar las vulnerabilidades de seguridad de AI | MIT News

Si has conocido dibujos animados como Tom y Jerry, reconocerás un tema popular: un objetivo esquivo evita a su formidable adversario. Este muestrario de «astuto y ratón», ya sea exacto o de otro tipo, implica despabilarse poco que te escape cada vez más correctamente en cada intento. De forma similar, sortear a los piratas informáticos […]
VulnWatch: Priorización de vulnerabilidades mejorada por IA

Cada estructura tiene el desafío de priorizar correctamente las nuevas vulnerabilidades que afectan a un gran conjunto de bibliotecas de terceros utilizadas internamente de su estructura. El gran bulto de vulnerabilidades que se publican diariamente hace que el monitoreo manual sea poco práctico y requiera muchos medios. En Databricks, uno de los objetivos de nuestra […]
Exponiendo vulnerabilidades en los puntos de narración automáticos de LLM: la obligación de mecanismos antitrampas más sólidos

Los puntos de narración automáticos como AlpacaEval 2.0, Arena-Hard-Coche y MTBench han reses popularidad para evaluar LLM adecuado a su asequibilidad y escalabilidad en comparación con la evaluación humana. Estos puntos de narración utilizan anotadores automáticos basados en LLM, que se alinean perfectamente con las preferencias humanas, para proporcionar evaluaciones oportunas de nuevos modelos. Sin […]