Athrun Data Intelligence


La IA multimodal: modelos capaces de procesar múltiples tipos diferentes de entradas como el acento, el texto y las imágenes) han sido Transformando las experiencias de los usuarios en el espacio de los wearables.

Con nuestras meta quevedos de ray-ban, IA multimodal Ayuda a las quevedos a ver qué está viendo el legatario. Esto significa que cualquiera que use meta quevedos de ray-ban puede hacerles preguntas sobre lo que están viendo. Las quevedos pueden proporcionar información sobre un punto de narración, traducir el texto que está viendo y muchas otras características.

Pero, ¿qué se necesita para tolerar la IA a un dispositivo portátil?

En este episodio del podcast de Meta Tech, Meet Shane, un investigador investigador de Meta que ha pasado los últimos siete abriles enfocándose en la visión por computadora y la IA multimodal para wearables. Shane y su equipo han estado detrás de la investigación de IA de vanguardia como Cualquieraun maniquí de jerga unificado que puede razonar sobre una variedad de señales de entrada que incluyen datos de texto, audio, video e incluso el sensor de movimiento de IMU.

Shane se sienta con Pascal Hartig Para compartir cómo su equipo está construyendo modelos fundamentales para las meta quevedos de Ray-Ban. Hablan sobre los desafíos únicos de las quevedos de IA y empujan los límites de la tecnología portátil impulsada por la IA.

Ya sea que sea un ingeniero, un entusiasta de la tecnología o simplemente singular, ¡este episodio tiene poco para todos!

Descargue o escuche el episodio a continuación:


Igualmente puede encontrar el episodio donde sea que obtenga sus podcasts, incluyendo:

El Podcast meta tecnológico es un podcast, que le ofrece Meta, donde destacamos el trabajo que los ingenieros de Meta están haciendo en todos los niveles, desde marcos de bajo nivel hasta características del legatario final.

Envíenos comentarios sobre Instagram, Traposo intríngulis.

Y si está interesado en ilustrarse más sobre oportunidades de carrera en Meta Visit the Meta carreras página.

Campo de golf

Marcas de tiempo

  • Preámbulo 0:06
  • Oss News 0:56
  • Preámbulo Shane 1:30
  • El papel de la investigación científica a lo desprendido del tiempo 3:03
  • ¿Qué es la IA multimodal? 5:45
  • Aplicación de IA multimodal en productos de Meta 7:21
  • Modalidades acústicas más allá del acento 9:17
  • Anymal 12:23
  • Zoológicos del codificador 13:53
  • Performance de 0-shot 16:25
  • Iterando en los modelos 17:28
  • Tamaño del parámetro LLM 19:29
  • ¿Cómo procesamos una solicitud de las quevedos? 21:53
  • Procesamiento de imágenes en movimiento 23:44
  • Escalera a miles de millones de usuarios 26:01
  • ¿Dónde se encuentra el potencial de optimización? 28:12
  • Incorporación de comentarios 29:08
  • Influencia de código descubierto 31:30
  • Software de My Eyes 33:57
  • Trabajar con expertos de la industria en Meta 36:18
  • Outro 38:55



Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *