La IA generativa y la robótica nos acercan cada vez más al día en que podamos pedir un objeto y crearlo en unos minutos. De hecho, los investigadores del MIT han desarrollado un sistema de conversión de voz a verdad, un flujo de trabajo impulsado por inteligencia químico que les permite proporcionar información a un padrino robótico y «charlar los objetos para que existan», creando cosas como muebles en tan solo cinco minutos.
Con el sistema de conversión de voz a verdad, un padrino robótico montado sobre una mesa puede cobrar información hablada de un humano, como «Quiero un taburete simple», y luego construir los objetos a partir de componentes modulares. Hasta la término, los investigadores han utilizado el sistema para crear taburetes, estanterías, sillas, una mesa pequeña e incluso nociones decorativos como una estatua de un perro.
«Estamos conectando el procesamiento del idioma natural, la IA generativa 3D y el ensamblaje robótico», dice Alexander Htet Kyaw, estudiante diplomado del MIT y miembro de la Sociedad de Diseño Morningside (MAD). «Estas son áreas de investigación que avanzan rápidamente y que no se habían reunido ayer de una forma que verdaderamente pueda crear objetos físicos con solo una simple indicación del palabra».
Acento a la verdad: producción bajo demanda utilizando IA generativa 3D y ensamblaje robótico discreto
La idea comenzó cuando Kyaw, un estudiante de posgrado en los departamentos de Edificio, Ingeniería Eléctrica y Ciencias de la Computación, tomó el curso del profesor Neil Gershenfeld, «Cómo hacer casi cualquier cosa». En esa clase, construyó el sistema de conversión del palabra a la verdad. Continuó trabajando en el plan en el Centro de Bits y Átomos (CBA) del MIT, dirigido por Gershenfeld, colaborando con los estudiantes graduados Se Hwan Jeon del Sección de Ingeniería Mecánica y Miana Smith de CBA.
El sistema de conversión de voz a verdad comienza con el gratitud de voz que procesa la solicitud del beneficiario utilizando un maniquí de idioma magnate, seguido de una IA generativa 3D que crea una representación de malla digital del objeto y un operación de voxelización que descompone la malla 3D en componentes de ensamblaje.
Luego de eso, el procesamiento geométrico modifica el ensamblaje generado por IA para tener en cuenta las limitaciones físicas y de fabricación asociadas con el mundo vivo, como la cantidad de componentes, los voladizos y la conectividad de la geometría. A esto le sigue la creación de una secuencia de ensamblaje factible y la planificación automatizada de la ruta para que el padrino robótico ensamble objetos físicos a partir de las indicaciones del beneficiario.
Al rendir el idioma natural, el sistema hace que el diseño y la fabricación sean más accesibles para personas sin experiencia en modelado 3D o programación robótica. Y, a diferencia de la impresión 3D, que puede tardar horas o días, este sistema se construye en cuestión de minutos.
«Este plan es una interfaz entre humanos, inteligencia químico y robots para cocrear el mundo que nos rodea», dice Kyaw. «Imagínese un decorado en el que usted dice ‘Quiero una apero’ y, en cinco minutos, una apero física se materializa frente a usted».
El equipo tiene planes inmediatos para mejorar la capacidad de carga de peso de los muebles cambiando los medios para conectar los cubos de imanes a conexiones más robustas.
«Igualmente hemos desarrollado procesos para convertir estructuras de vóxeles en secuencias de ensamblaje factibles para robots móviles pequeños y distribuidos, lo que podría ayudar a traducir este trabajo a estructuras de cualquier tamaño», dice Smith.
El propósito de utilizar componentes modulares es eliminar el desperdicio que se genera al producir objetos físicos desmontándolos y luego volviéndolos a ensamblar en poco diferente, por ejemplo, convertir un sofá en una cama cuando ya no lo necesitas.
Porque Kyaw incluso tiene experiencia usando gratitud de gestos y verdad aumentada para interactuar Con robots en el proceso de fabricación, actualmente está trabajando para incorporar el control del palabra y los gestos en el sistema de conversión del palabra a la verdad.
Apoyándose en sus memorias del replicador de la franquicia “Star Trek” y de los robots de la película animada “Big Hero 6”, Kyaw explica su visión.
«Quiero aumentar el acercamiento de las personas a la fabricación de objetos físicos de una forma rápida, accesible y sostenible», afirma. «Estoy trabajando por un futuro en el que la esencia misma de la materia esté verdaderamente bajo tu control. Un futuro en el que la verdad pueda generarse según demanda».
El equipo presentó su trabajo. “Discurso a la verdad: producción bajo demanda utilizando idioma natural, IA generativa 3D y ensamblaje robótico discreto” en el Simposio sobre fabricación computacional (SCF ’25) de la Association for Computing Machinery (ACM) celebrado en el MIT el 21 de noviembre.