¿Qué es latencia?
Latencia es el retraso de tiempo entre iniciar una solicitud y recibir una respuesta, típicamente medido en milisegundos (ms). En contextos de redes y DNS, la latencia representa el tiempo de ida y vuelta para que los datos viajen desde un cliente a un servidor y de regreso. La latencia baja es crítica para carga rápida de sitios web, aplicaciones receptivas y experiencias de usuario positivas. La latencia alta causa retrasos notables que frustran a los usuarios y pueden impactar métricas de negocio.Tipos de latencia
Latencia de red
Tiempo para que paquetes de datos atraviesen la red:
- Distancia física entre cliente y servidor
- Número de saltos de red (enrutadores, conmutadores)
- Congestión de red y limitaciones de ancho de banda
- Calidad de infraestructura de red
Latencia DNS
Tiempo para resolver un nombre de dominio a una dirección IP:
- Tiempo de respuesta del servidor DNS
- Estado de caché (impacto vs falta)
- Cadena de consulta DNS (resolver → autorizado)
- Gastos generales de validación DNSSEC
Latencia de aplicación
Tiempo para que aplicaciones procesen solicitudes:
- Ejecución de consulta de base de datos
- Procesamiento del lado del servidor
- Generación de respuesta API
- Comunicación de servicio de backend
Medición de latencia
Herramientas comunes
# Prueba de ping (latencia ICMP)
ping example.com
# Tiempo de resolución DNS
dig example.com | grep "Query time"
# Tiempo HTTP
curl -w "@curl-format.txt" -o /dev/null -s https://example.com
Métricas clave
| Métrica | Descripción | Objetivo bueno |
|---|---|---|
| RTT (Tiempo de ida y vuelta) | Ciclo completo solicitud-respuesta | <100ms |
| TTFB (Tiempo al primer byte) | Iniciación de respuesta del servidor | <200ms |
| Resolución DNS | Búsqueda de dominio a IP | <50ms |
| Tiempo de conexión | Finalización del protocolo de enlace TCP | <100ms |
Impacto de latencia por región
La distancia geográfica afecta directamente la latencia:
| Ruta | Latencia típica |
|---|---|
| Misma ciudad | 1-10ms |
| Mismo país | 20-50ms |
| Mismo continente | 50-100ms |
| Transcontinental | 100-200ms |
| Global (lados opuestos) | 200-300ms |
Reducción de latencia DNS
Anycast DNS
Desplegar servidores DNS globalmente, enrutar consultas a la más cercana:
- Múltiples servidores comparten la misma dirección IP
- Enrutamiento automático a ubicación más cercana
- Redundancia integrada
Caché DNS
Apalancar TTL para búsquedas repetidas:
example.com. 300 IN A 192.0.2.1
↑ TTL en segundos
- Caché del navegador (segundos a minutos)
- Caché del sistema operativo
- Caché del resolutor ISP
Subred de cliente EDNS
Habilitar respuestas geográficamente conscientes:
- Ubicación del cliente pasada al servidor autorizado
- Devolver IP del servidor más cercano
- Desempeño mejorado de CDN
Reducción de latencia general
Redes de entrega de contenidos (CDN)
- Almacenar contenido en ubicaciones periféricas
- Servir usuarios desde servidores cercanos
- Reducir carga del servidor de origen
Optimización de conexión
- Multiplexación HTTP/2
- Conexiones de tipo keep-alive
- Reanudación de sesión TLS
- HTTP/3 (QUIC) para protocolos de enlace reducidos
Elecciones de infraestructura
- Múltiples ubicaciones de centro de datos
- Proveedores de red premium
- Rutas de enrutamiento optimizadas
- Computación periférica para contenido dinámico
Latencia vs ancho de banda
Comprensión de la diferencia:
- Latencia: Qué tan rápido comienzan a llegar los datos (retraso)
- Ancho de banda: Cuántos datos pueden fluir por segundo (rendimiento)
Ambos importan para el desempeño, pero la latencia a menudo tiene mayor impacto en la velocidad percibida por el usuario, especialmente para aplicaciones interactivas.
La latencia baja es esencial para el desempeño moderno de la web, impactando directamente la satisfacción del usuario, tasas de conversión y rankings de motores de búsqueda.