Athrun Data Intelligence


La mayoría de las herramientas de inteligencia químico dependen de Internet y envían sus indicaciones a servidores remotos para procesarlas antaño de devolver los resultados. Este proceso siempre ha sido invisible para los usuarios. GRAMOohohgramoyomi cambia eso con yema 4! Que, si se configura correctamente, se ejecuta directamente en su teléfono, eliminando la carestia de conectividad constante.

Con una descarga única, todo se ejecuta localmente en su dispositivo, manteniendo la privacidad de sus datos. Puede obtener a él a través de la aplicación Google AI Edge Gallery. En este artículo, exploramos cómo usar la aplicación y qué puede crear con ella sin Internet, una vez que se haya configurado localmente en su dispositivo.

¿Qué es exactamente Gemma 4?

La clan Gemma 4 consta de cuatro modelos distintos, cada uno de ellos optimizado por Google para diversos requisitos de hardware. La traducción E2B es un dispositivo de bajos fortuna, mientras que la traducción E4B ha sido diseñada para un veterano rendimiento. Los modelos más grandes son positivamente impresionantes; por ejemplo, el maniquí denso de 31 mil millones ocupa el puesto número 3 en términos de todos los modelos de código rajado en todo el mundo, mientras que el maniquí MoE de 26 mil millones ocupa el puesto número 5, superando a muchos modelos más grandes.

Familia de modelos Gemma 4

Si aceptablemente estos puntos de narración son dignos de mención, existen muchas otras razones para apreciar esta nueva reproducción de inteligencia químico (IA). Toda la clan Gemma 4 ha sido diseñada para convidar capacidades más allá del simple chat; Podrá realizar razonamiento compleja y simplificar flujos de trabajo agentes, procesar palabras, videos y audio, y utilizar más de 140 idiomas diferentes.

Para dispositivos como teléfonos, las dos variantes de borde de Gemma 4 (E2B y E4B) se han creado específicamente para hardware de bajos fortuna. Estos modelos pueden manejar datos de visión, audio y texto; incluir llamadas a funciones; y ser lo suficientemente pequeño como para ser posible interiormente de las limitaciones de almacenamiento de las plataformas móviles.

Estudiar más: Gemma 4 de Google: experiencia

La aplicación que lo hace posible

Google ha valiente su aplicación AI Edge Gallery que funciona en plataformas Android e iOS. Su teléfono inteligente realiza todas las tareas de procesamiento sin carestia de ningún servicio en la montón. La aplicación funciona como un software de código rajado.

Las siguientes características de AI Edge Gallery la hacen esencial para nuestro caso de uso:

  • Chat AI con modo de pensamiento: El maniquí demuestra su proceso de razonamiento explicando su pregunta a través de su ruta de razonamiento completa.
  • Preguntar imagen: Puede usar su cámara para escanear cualquier objeto que desee investigar y hacer preguntas al respecto.
  • Escribano de audio: La aparejo permite a los usuarios convertir audio hablado en texto o en diferentes idiomas sin carestia de una conexión a Internet.
  • Habilidades del agente: El sistema puede realizar múltiples tareas sin preceptor humana utilizando fortuna como Wikipedia.
  • Laboratorio rápido: Los usuarios pueden evaluar sus indicaciones controlando la configuración de temperatura para mejorar sus resultados.

La función Agent Skills se destaca como un hábitat esencial del sistema. Se prostitución de uno de los primeros casos en los que los consumidores pueden utilizar tecnología de IA agente de varios pasos que funciona completamente fuera de linde en sus dispositivos móviles.

¿Por qué esto positivamente importa?

La capacidad de ejecutar IA en sistemas locales proporciona múltiples beneficios que van más allá de su atractivo estético. Las tres ventajas principales de esta tecnología presentan auténticos beneficios para los usuarios:

  • El maniquí funciona completamente en su dispositivo, lo que establece la privacidad como requisito principal. La aplicación no transmite ningún contenido compartido que incluya indicaciones, respuestas e imágenes a Google ni a ningún otro servidor. El sistema opera a través de su conexión de red que solo requiere descargar el maniquí.
  • No se necesita conectividad. El sistema funciona correctamente cuando estás en un revoloteo, en un sótano o en un ámbito con señal débil. Gemma 4 funciona independientemente de su ubicación coetáneo. El software proporciona una funcionalidad completa posteriormente de descargarlo.
  • El maniquí se podrá utilizar independientemente durante un período indefinido posteriormente de completar su descarga. Funciona sin utilizar ningún solicitud en segundo plano porque no requiere tokens, créditos ni suscripciones.

El acuerdo de deshonestidad establece otro requisito. Google lanzó Gemma 4 bajo una deshonestidad Apache 2.0 que permite a las empresas usar, modificar y construir sobre los modelos sin restricciones de uso.

Gemma 4 E2B | E4B

¿Qué maniquí debería designar?

La mayoría de la multitud se confunde en este punto. El tamaño de un maniquí no determina su valía porque los modelos más grandes no siempre superan a los más pequeños. Las cuatro variantes de Gemma 4 incluyen Efectivo 2B (E2B) y Efectivo 4B (E4B) y 26B Mezcla de Expertos y 31B Denso. Para los teléfonos, debe utilizar los sistemas E2B y E4B según Business Today.

A continuación se proporciona una descripción común esencial:

  • Gemma 4 E2B requiere menos de 1,5 GB de RAM para funcionar. El sistema brinda respuestas inmediatas a consultas simples mientras genera breves resúmenes a través de sus preguntas y respuestas.
  • Gemma 4 E4B requiere aproximadamente 2,5 GB de RAM para su funcionamiento. El sistema puede ejecutar asignaciones visuales más avanzadas a través de sus capacidades de razonamiento mejoradas y su sistema de emplazamiento de funciones mejorado.

El sistema E2B funciona mejor que otros sistemas para operaciones básicas que muestran evacuación de stop rendimiento. El sistema E4B ofrece un mejor rendimiento que otros sistemas porque maneja esquemas de funciones complejos y múltiples opciones de funciones mejor que otros sistemas.

Gemma 4 E2B | E4B

Debe comenzar con E2B como punto de partida. Cambie a E4B cuando observe que no puede manejar tareas de razonamiento de varios pasos.

Primeros pasos con Gemma 4

Paso 1: Vaya a Google Play Store (para Android) o Apple Store (para iOS), escriba Túnel de borde de IA de Google y descarga la aplicación.

Paso 2: Abre la aplicación. Accederá al menú principal y verá los cinco modos entre los que puede designar (Chat AI, Preguntar una imagen, Audio Scribe, Habilidades del agente, y Laboratorio rápido).

Paso 3: Navegue a la sección Papeleo de modelos y descargue Gemma 4 E2B o Gemma 4 E4B. El único momento en el que necesitas estar conectado a Internet es al descargar estos modelos; sólo debes hacer esto una vez.

Paso 4: A posteriori de la descarga, puede activar el modo avión. A partir de este momento, todas las funciones funcionarán sin estar conectado a Internet.

Tarea 1: crear un grupo de Sudoku utilizando la función AI Chat

Aquí, desarrollaremos el grupo de sudoku usando Gemma 4 en Google AI Edge Gallery seleccionando la función AI Chat:

  1. Comience abriendo la aplicación y seleccionando AI Chat, luego habilite Modo de pensamiento.
  2. Escriba «Cree un grupo de sudoku usando HTML Css Javascript para tener un cronómetro, comprobar las funciones de la decisión y comprobar de que sea compatible con dispositivos móviles» (sin comillas).
  3. El maniquí realizará su razonamiento antaño de producir el código completo.
  4. Cuando termine, simplemente copie todo el código y péguelo en un nuevo archivo de texto que se guardará como un archivo .html, luego refugio el nuevo archivo html usando cualquier navegador web; Tu grupo ahora debería estar funcionando.

Nota: Si desea tener un código construido de forma más limpia desde el principio, intente utilizar Gemma 4 E4B. Adicionalmente, si surgen problemas con funciones que anteriormente funcionaban correctamente, simplemente dígale a Gemma con qué función necesita problemas y pídale ayuda para repararla.

Observación de revisión:

Cuando solicité el maniquí E2B, simplemente se detuvo a porción de la tarea, pero posteriormente de solicitar el maniquí E4B, produjo el resultado. El maniquí nos proporcionó un archivo de código html con instrucciones detalladas que fueron muy avíos en el caso de usuarios sin conocimientos técnicos. Sin bloqueo, igualmente podría habernos mostrado una interfaz exterior que fue un poco decepcionante. Adicionalmente, como se ejecuta en modo fuera de linde, lleva mucho tiempo, lo que nos muestra la restricción del maniquí.

Tarea 2: automatizar tareas con habilidades de agente

  1. Habilite las habilidades de Planisferio, Correo electrónico y Wikipedia tocando Habilidades del agente y habilítelas.
  2. A posteriori de eso, puede probar al agente dándole las siguientes tres solicitudes, una tras otra:
    • «Encuentra una cafetería más cercana a mí y colócala en un planisferio para mí».
    • «Redacta un correo electrónico para enviárselo a John indicando que llegaré 10 minutos tarde y envíalo».
  3. A posteriori de cada solicitud, el agente dividirá la solicitud en tareas individuales, llamará a las herramientas apropiadas y confirmará con usted antaño de completar y mandar cualquier trabajo.

Nota: Puede realizar un seguimiento preciso de qué habilidades utilizó el agente posteriormente de cada paso. El agente igualmente es completamente transparente en sus acciones con usted.

Observación de revisión:

Los resultados fueron poco variados para los tipos de habilidades de múltiples agentes. Para la primera consulta, Map generalmente proporcionó resultados en los que la ubicación parecía correcta en el planisferio, pero debería poseer podido detectar mi ubicación por sí solo en espacio de preguntarme explícitamente.

Para la segunda consulta, cargó apropiadamente la tiento para «mandar correo electrónico». A posteriori de la ejecución de la tiento, mostró que el mensaje había sido enviado pero no tenía ninguna información de dónde lo envió, lo cual es un gran inconveniente. El tiempo de respuesta y las fallas ocasionales en la capacidad para completar la tarea demostraron que todavía queda mucho por mejorar en el uso de dispositivos de tipo IA agente.

¿Qué no puede hacer (todavía)?

Cuando hablamos de Gemma 4, igualmente tiene algunas limitaciones:

  • Hay un consumo de condensador asociado con el uso de la inferencia, ya que requiere mucha más potencia de computadora que otros tipos de aplicaciones. Por lo tanto, agotará tu condensador mucho más rápido que otro tipo de aplicaciones. Los dispositivos con NPU dedicadas son mucho mejores para tener la llave de la despensa el uso de la condensador de inferencia que usar solo la CPU para la inferencia. Por ejemplo, un Pixel 9 Pro con un Gemma 4 4B agotará su condensador a un ritmo mucho más paulatino que si usa solo una CPU pura.
  • Adicionalmente, las versiones más grandes de Gemma (26B y 31B) no se pueden utilizar en un teléfono móvil; necesitas una computadora portátil con mucha RAM para ejecutarlos. Los dispositivos E2B y E4B están aceptablemente para las tareas diarias; sin bloqueo, no reemplazarán a los modelos de montón de frontera en el corto plazo.
  • Finalmente, los modelos de borde tienen una ventana de contexto de 128k, lo cual es bueno; sin bloqueo, transmitido que los teléfonos no tienen tanta memoria como las computadoras, necesitarás abastecer tus conversaciones relativamente cortas en un teléfono.

Conclusión

El término «IA en su teléfono» a lo espacioso de varios primaveras se describió como una interfaz básica que accedía a API remotas en la montón. El sistema procesó su información a través de una ruta tortuosa que pasó por un servidor desprotegido.

Joya 4 establece un conexión completamente nueva entre dos entidades diferentes.

Su dispositivo de saquillo coetáneo puede realizar tres funciones que incluyen transcribir charlas y analizar contenido visual y resolver desafíos difíciles a través de capacidades fuera de linde. Anteriormente, el funcionamiento del sistema requería una instalación de servidor completa. Ahora requiere la descarga de una aplicación.

La era de la IA ejecutándose silenciosamente en su dispositivo de saquillo, sin servidor involucrado, ya no es una demostración de investigación.

Preguntas frecuentes

P1. ¿Qué es Gemma 4 y cómo funciona sin conexión?

R. Gemma 4 se ejecuta directamente en su teléfono y procesa las indicaciones localmente posteriormente de una descarga única, sin mandar datos a servidores externos.

P2. ¿Qué maniquí de Gemma 4 debo usar en un teléfono?

R. Utilice E2B para tareas básicas con poca RAM y E4B para razonamientos más complejos y funciones avanzadas en dispositivos móviles.

P3. ¿Cuáles son los principales beneficios de ejecutar la IA sin conexión?

R. Garantiza la privacidad, funciona sin Internet y evita costos continuos como suscripciones, tokens o tarifas de uso de la montón.

Aprendiz de ciencia de datos en Analytics Vidhya
Actualmente trabajo como aprendiz de ciencia de datos en Analytics Vidhya, donde me enfoco en crear soluciones basadas en datos y aplicar técnicas de IA/ML para resolver problemas comerciales del mundo actual. Mi trabajo me permite explorar exploración avanzados, estudios involuntario y aplicaciones de inteligencia químico que permiten a las organizaciones tomar decisiones más inteligentes basadas en evidencia.
Con una sólida colchoneta en informática, explicación de software y exploración de datos, me apasiona disfrutar la IA para crear soluciones impactantes y escalables que cierren la brecha entre la tecnología y los negocios.
📩 Todavía puedes comunicarte conmigo en (correo electrónico protegido)

Inicie sesión para continuar leyendo y disfrutar de contenido seleccionado por expertos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *