Cómo Medir si tu Chatbot de WhatsApp Funciona
Sin datos no hay mejora. Las 6 métricas esenciales para optimizar tu chatbot y el framework para iterar.
Las 6 métricas esenciales
| Métrica | Qué mide | Benchmark | Cómo mejorar |
|---|---|---|---|
| Tasa de completación | % que termina el flujo | > 60% | Simplificar preguntas, reducir pasos |
| Tasa de handoff | % que necesita humano | < 30% | Ampliar flujos del bot, mejorar IA |
| Tiempo de primera respuesta | Segundos hasta la primera respuesta | < 5 seg | Optimizar infraestructura y webhooks |
| Tiempo de resolución | Minutos hasta cierre del caso | < 5 min | Mejor calificación, flujos más cortos |
| CSAT | Satisfacción del usuario (1-5) | > 4.0 | Encuesta post-servicio, iterar en puntos de dolor |
| Tasa de abandono | % que deja el chat sin resolver | < 20% | Analizar en qué paso abandonan y simplificar |
Tasa de completación: la métrica #1
Si tu chatbot tiene una tasa de completación del 40%, significa que 6 de cada 10 usuarios abandonan el flujo sin terminar. ¿Por qué? Las causas más comunes son: demasiadas preguntas, preguntas confusas, el bot no entiende la respuesta del usuario, o el flujo no ofrece la opción que el usuario necesita.
Tasa de handoff: ¿cuánto resuelve el bot?
Una tasa de handoff del 30% no es mala — significa que el bot resuelve el 70% sin intervención humana. El objetivo no es llegar a 0% (algunas consultas REQUIEREN humano) sino que el bot escale correctamente: escalar demasiado tarde frustra al usuario, escalar demasiado rápido desperdicia agentes.
El framework de optimización
Medir
Instrumentá las 6 métricas clave en tu dashboard. Sin datos no puedes mejorar.
Identificar
¿Dónde abandonan? ¿Qué preguntas no entiende? ¿Cuándo escala mal? Encuentra el punto de dolor.
Hipótesis
'Si simplifico la pregunta 3, la completación va a subir del 40% al 55%'. Sé específico.
Implementar
Haz un cambio a la vez. Si cambiás 5 cosas juntas, no sabes cuál funcionó.
Medir de nuevo
Esperá 1-2 semanas con volumen suficiente antes de sacar conclusiones. Iterá.
Errores comunes al medir
- Medir solo volumen — "el bot atendió 5.000 chats" no dice nada si no sabes cuántos resolvió
- No segmentar — las métricas por flujo son más útiles que el promedio general
- Ignorar el CSAT — un bot puede "resolver" técnicamente pero dejar al usuario frustrado
- Optimizar demasiado pronto — esperá a tener volumen suficiente (mínimo 200 conversaciones) antes de sacar conclusiones

