El retraso de tiempo entre una solicitud y una respuesta, típicamente medido en milisegundos.

Latencia - Qué Significa y Cómo Funciona

¿Qué es latencia?

Latencia es el retraso de tiempo entre iniciar una solicitud y recibir una respuesta, típicamente medido en milisegundos (ms). En contextos de redes y DNS, la latencia representa el tiempo de ida y vuelta para que los datos viajen desde un cliente a un servidor y de regreso. La latencia baja es crítica para carga rápida de sitios web, aplicaciones receptivas y experiencias de usuario positivas. La latencia alta causa retrasos notables que frustran a los usuarios y pueden impactar métricas de negocio.

Tipos de latencia

Latencia de red

Tiempo para que paquetes de datos atraviesen la red:

Distancia física entre cliente y servidor
Número de saltos de red (enrutadores, conmutadores)
Congestión de red y limitaciones de ancho de banda
Calidad de infraestructura de red

Latencia DNS

Tiempo para resolver un nombre de dominio a una dirección IP:

Tiempo de respuesta del servidor DNS
Estado de caché (impacto vs falta)
Cadena de consulta DNS (resolver → autorizado)
Gastos generales de validación DNSSEC

Latencia de aplicación

Tiempo para que aplicaciones procesen solicitudes:

Ejecución de consulta de base de datos
Procesamiento del lado del servidor
Generación de respuesta API
Comunicación de servicio de backend

Medición de latencia

Herramientas comunes

# Prueba de ping (latencia ICMP) ping example.com # Tiempo de resolución DNS dig example.com | grep "Query time" # Tiempo HTTP

curl -w "@curl-format.txt" -o /dev/null -s https://example.com

Métricas clave

Métrica	Descripción	Objetivo bueno
RTT (Tiempo de ida y vuelta)	Ciclo completo solicitud-respuesta	<100ms
TTFB (Tiempo al primer byte)	Iniciación de respuesta del servidor	<200ms
Resolución DNS	Búsqueda de dominio a IP	<50ms
Tiempo de conexión	Finalización del protocolo de enlace TCP	<100ms

Impacto de latencia por región

La distancia geográfica afecta directamente la latencia:

Ruta	Latencia típica
Misma ciudad	1-10ms
Mismo país	20-50ms
Mismo continente	50-100ms
Transcontinental	100-200ms
Global (lados opuestos)	200-300ms

Reducción de latencia DNS

Anycast DNS

Desplegar servidores DNS globalmente, enrutar consultas a la más cercana:

Múltiples servidores comparten la misma dirección IP
Enrutamiento automático a ubicación más cercana
Redundancia integrada

Caché DNS

Apalancar TTL para búsquedas repetidas:

example.com. 300 IN A 192.0.2.1

↑ TTL en segundos

Caché del navegador (segundos a minutos)
Caché del sistema operativo
Caché del resolutor ISP

Subred de cliente EDNS

Habilitar respuestas geográficamente conscientes:

Ubicación del cliente pasada al servidor autorizado
Devolver IP del servidor más cercano
Desempeño mejorado de CDN

Reducción de latencia general

Redes de entrega de contenidos (CDN)

Almacenar contenido en ubicaciones periféricas
Servir usuarios desde servidores cercanos
Reducir carga del servidor de origen

Optimización de conexión

Multiplexación HTTP/2
Conexiones de tipo keep-alive
Reanudación de sesión TLS
HTTP/3 (QUIC) para protocolos de enlace reducidos

Elecciones de infraestructura

Múltiples ubicaciones de centro de datos
Proveedores de red premium
Rutas de enrutamiento optimizadas
Computación periférica para contenido dinámico

Latencia vs ancho de banda

Comprensión de la diferencia:

Latencia: Qué tan rápido comienzan a llegar los datos (retraso)
Ancho de banda: Cuántos datos pueden fluir por segundo (rendimiento)

Ambos importan para el desempeño, pero la latencia a menudo tiene mayor impacto en la velocidad percibida por el usuario, especialmente para aplicaciones interactivas.

La latencia baja es esencial para el desempeño moderno de la web, impactando directamente la satisfacción del usuario, tasas de conversión y rankings de motores de búsqueda.

Latencia