Athrun Data Intelligence

Tokenización de voz con agradecimiento de maniquí de habla (LAST): un método de inteligencia industrial único que integra un maniquí de habla de texto entrenado previamente en el proceso de tokenización de voz

La tokenización del palabra es un proceso fundamental que sustenta el funcionamiento de los modelos de palabra y habla, lo que permite que estos modelos realicen una variedad de tareas, incluidas la conversión de texto a voz (TTS), la conversión de voz a texto (STT) y el modelado del habla hablado. La tokenización ofrece la […]

OpenBMB bichero MiniCPM3-4B: un maniquí de idioma versátil y valioso con funcionalidad descubierta, manejo de contexto extendido y capacidades de engendramiento de código

OpenBMB lanzó recientemente el MiniCPM3-4Bel maniquí de tercera engendramiento de la serie MiniCPM. Este maniquí supone un gran paso delante en las capacidades de los modelos de idioma de pequeño escalera. Diseñado para ofrecer un rendimiento potente con bienes relativamente modestos, el maniquí MiniCPM3-4B demuestra una serie de mejoras con respecto a sus predecesores, especialmente […]

Present-o: un modelo de IA unificado que unifica la comprensión y la generación multimodal utilizando un único transformador

Este artículo presenta Present-o, un modelo de transformador unificado que integra capacidades de comprensión y generación multimodal dentro de una única arquitectura. A medida que avanza la inteligencia synthetic, ha habido un progreso significativo en la comprensión multimodal (por ejemplo, la respuesta a preguntas visuales) y la generación (por ejemplo, la síntesis de texto a […]