Simplemente seguimos la documentación en partidura y, en unas pocas horas, estábamos operativos y comenzamos a ejecutar un trabajo. Nunca tuvimos ningún problema. – Klemen Simonic, fundador y director ejecutante
sonioxfundada en 2020 por investigadores experimentados en inteligencia fabricado, es la creadora del estudios no supervisado para el agradecimiento de voz. En 2022, lanzaron su primer producto, una IA de agradecimiento de voz con el más suspensión nivel de precisión para el ocho idiomas principales: tudesco, portugués, italiano, francés, castellano, chino, coreano e inglés. Cada maniquí de IA en idioma extranjero es bilingüe y puede comprender ese idioma más el inglés para proporcionar mejor los casos de uso empresarial.
El equipo de Soniox estaba adecuadamente versado en el entrenamiento de modelos de IA personalizados, por asegurar lo menos; antiguamente de trabajar con Databricks, ya habían entrenado un maniquí de jerga espacioso (LLM) multilingüe, soniox 7b. Sin secuestro, aun así recurrieron a Databricks en pesquisa de ayuda para capacitar su próximo gran LLM multimodal. omnioque tiene la capacidad de utilizar plenamente toda la información acondicionado en una señal de audio y representa un avance significativo en el campo del agradecimiento de voz. Omnio es el primer gran maniquí de IA que procesa el palabra y el audio de una forma similar a como lo haría un humano. Puede examinar y comprender el palabra, identificar distintos hablantes y discernir emociones y sentimientos. Incluso puede distinguir entre sonidos de fondo y sonidos creados por humanos. Para construir este maniquí increíblemente renovador, Sonix tuvo que discutir conjuntos de datos a escalera de Internet para audio y texto.
A posteriori de algunas investigaciones en partidura, Soniox encontró el camino en dirección a Databricks y Mosaic AI Training. Simonic explicó: “No somos un cliente distintivo de Databricks; Tenemos nuestros propios circuitos de formación e infraestructura de formación distribuida. Pero cuando comenzamos a trabajar con su equipo, quedó claro que sus herramientas fueron creadas por desarrolladores para desarrolladores. Nos encanta el entrenamiento de Mosaic AI; es ligera de usar”. Aunque Soniox había utilizado otros proveedores de infraestructura, apreciaron la disponibilidad informática y la conveniencia del clúster Mosaic AI Training.
Simonic continuó: “Se nota que quien creó Mosaic AI Training en realidad entiende cómo iniciar y capacitar trabajos. Hemos probado otras plataformas y la suya ha sido la forma más sencilla de iniciar cualquier trabajo. Su equipo creó las funciones adecuadas de la forma correcta y las hizo fáciles de usar”. Como fundador de una startup, Simonic originalmente percibió a Databricks como una empresa centrada en la empresa. Quedó gratamente sorprendido al cobrar donación personalizada de su equipo de cuentas. «Es en realidad importante escuchar a sus clientes, incluso si son una startup en su etapa original». Simonic continuó: «Cuando surgen desafíos técnicos, puede ser difícil para las nuevas empresas porque carecen de un presupuesto de estructura espacioso para soportar cualquier defecto». La atención personalizada que Simonic recibió del equipo de Databricks le ha hexaedro confianza en su capacidad para resolver cualquier problema que pueda surgir en futuras sesiones de capacitación.
Aunque el equipo de Soniox se sintió inicialmente atraído por la funcionalidad de Mosaic AI Training, aprecian que sea parte de un ecosistema GenAI más amplio de Databricks que puede soportar cargas de trabajo desde la ingesta de datos hasta el servicio de modelos. De cara al futuro, Soniox planea ampliar las capacidades de sus productos de voz a texto y Omnio para que pueda mudar la interacción de los usuarios con el audio en casos de uso que van desde la transcripción hasta el prontuario de audio y la interacción de voz, apoyando industrias como la de salubridad, permitido, atención al cliente y más. Soniox comenzó inicialmente como un plan de investigación para investigar cómo exprimir los datos de audio sin etiquetar. Hoy en día, su innovadora IA de agradecimiento de voz abre nuevas posibilidades en la interacción hombre-máquina.