Construyendo un asistente de IA on-device con Gemini Nano

La mayoría de herramientas de IA para el navegador queman tokens, necesitan API keys y se rompen cuando el Wi‑Fi se cae. Yo quería lo opuesto: un asistente que viva en el navegador, funcione offline y mantenga tus datos locales.

Qué hace la extensión

Resumir cualquier página en un clic, optimizado para escaneo rápido.
Traducir texto seleccionado sin enviarlo a un servidor.
Conversar en contexto dentro del popup — cero pestañas, cero latencia.

Por qué Gemini Nano

Gemini Nano se ejecuta on-device en Chrome. Sin gestión de claves, sin dependencia de la nube, sin compromisos de privacidad. La restricción es el tamaño del modelo y la variación de hardware — así que el diseño tuvo que adoptar degradación elegante.

Diseñando micro-UX para un viewport diminuto

Tres modos claros con mínimo chrome.
Una acción primaria por modo; acciones secundarias escondidas.
Claridad de estado agresiva: escuchando, pensando, listo, error.

Notas técnicas

Manifest V3 + service worker orquestando mensajería entre tabs.
UI liviana: HTML/CSS plano + vanilla JS para mantener el bundle pequeño.
Caché de resúmenes recientes para que ir atrás/adelante se sienta instantáneo.

Enseñándolo en Google I/O Extended

Convertir el proyecto en un taller forzó el pulido. Lo presenté en Sucre, Santa Cruz y Cochabamba — haciendo live coding del popup y explicando las restricciones on-device. El mejor QA que podía pedir.

Conclusiones

IA on-device = confianza por defecto.
Diseñá primero los estados de fallo (límites de hardware, micrófonos bloqueados).
UX de extensiones es micro-UX: cada píxel tiene que ganarse su lugar.

Si querés las slides o el repo, mandame un mensaje.