ia··7 min de lectura

Construyendo un asistente de IA on-device con Gemini Nano

Cómo construí una extensión de Chrome que resume, traduce y conversa — completamente offline con Gemini Nano.

La mayoría de herramientas de IA para el navegador queman tokens, necesitan API keys y se rompen cuando el Wi‑Fi se cae. Yo quería lo opuesto: un asistente que viva en el navegador, funcione offline y mantenga tus datos locales.

Qué hace la extensión

  • Resumir cualquier página en un clic, optimizado para escaneo rápido.
  • Traducir texto seleccionado sin enviarlo a un servidor.
  • Conversar en contexto dentro del popup — cero pestañas, cero latencia.

Por qué Gemini Nano

Gemini Nano se ejecuta on-device en Chrome. Sin gestión de claves, sin dependencia de la nube, sin compromisos de privacidad. La restricción es el tamaño del modelo y la variación de hardware — así que el diseño tuvo que adoptar degradación elegante.

Diseñando micro-UX para un viewport diminuto

  • Tres modos claros con mínimo chrome.
  • Una acción primaria por modo; acciones secundarias escondidas.
  • Claridad de estado agresiva: escuchando, pensando, listo, error.

Notas técnicas

  • Manifest V3 + service worker orquestando mensajería entre tabs.
  • UI liviana: HTML/CSS plano + vanilla JS para mantener el bundle pequeño.
  • Caché de resúmenes recientes para que ir atrás/adelante se sienta instantáneo.

Enseñándolo en Google I/O Extended

Convertir el proyecto en un taller forzó el pulido. Lo presenté en Sucre, Santa Cruz y Cochabamba — haciendo live coding del popup y explicando las restricciones on-device. El mejor QA que podía pedir.

Conclusiones

  • IA on-device = confianza por defecto.
  • Diseñá primero los estados de fallo (límites de hardware, micrófonos bloqueados).
  • UX de extensiones es micro-UX: cada píxel tiene que ganarse su lugar.

Si querés las slides o el repo, mandame un mensaje.