O que é Latency?
Latency é o atraso de tempo entre iniciar uma solicitação e receber uma resposta, tipicamente medida em milissegundos (ms). Em contextos de rede e DNS, a latência representa o tempo de ida e volta para os dados viajarem de um cliente para um servidor. A baixa latência é fundamental para o carregamento rápido do site, aplicações responsivas e experiências positivas do usuário. Alta latência causa atrasos perceptíveis que frustram usuários e podem impactar métricas de negócios.Tipos de latência
# Latency de rede
Tempo para os pacotes de dados atravessarem a rede:
- Distância física entre cliente e servidor
- Número de lúpulos de rede (roteadores, interruptores)
- Limitações de congestionamento de rede e largura de banda
- Qualidade da infra-estrutura de rede
DNS Latency
Hora de resolver um nome de domínio para um endereço IP:
- Tempo de resposta do servidor DNS
- Estado da 'cache' (hit vs miss)
- Cadeia de consulta DNS (resolver → autoritário)
- Validação do DNSSEC
Latency da aplicação
Tempo para as aplicações processarem pedidos:
- Execução de pesquisa de banco de dados
- Processamento do lado do servidor
- Geração de resposta API
- Comunicação de serviço de infra-estrutura
Medir a Latência
Ferramentas comuns
# Ping test (ICMP latency)
ping example.com
# DNS resolution time
dig example.com | grep "Query time"
# HTTP timing
curl -w "@curl-format.txt" -o /dev/null -s https://example.com
"Métrica Chave"
| Métrico | Designação das mercadorias | Bom Alvo |
|---|---|---|
| RTT (Tempo de Viagem Redonda) | Ciclo completo de resposta à solicitação | < 100ms |
| TTFB (Tempo para o Primeiro Byte) | Iniciação da resposta do servidor | <200ms |
| Resolução DNS | Pesquisa de domínio para IP | <50ms |
| Tempo de Ligação | Completação do aperto de mão TCP | < 100ms |
Impacto da Latência por Região
A distância geográfica afeta diretamente a latência:
| Rota | Latência Típica |
|---|---|
| Mesma cidade | 1-10ms |
| Mesmo país | 20-50ms |
| Mesmo continente | 50-100ms |
| Continental cruzado | 100-200ms |
| Global (lado oposto) | 200-300ms |
Redução da latência do DNS
# # Anycast DNS
Implantar servidores DNS globalmente, encaminhar consultas para o mais próximo:
- Vários servidores compartilham o mesmo endereço IP
- Roteamento automático para localização mais próxima
- Remuneração integrada
DNS Caching
Aproveite o TTL para buscas repetidas:
example.com. 300 IN A 192.0.2.1
↑ TTL in seconds
- Cache de navegador (segundos a minutos)
- Cache do sistema operacional
- 'Cache' de resolução de ISP
# EDNS Client Subnet
Habilitar respostas geograficamente conscientes:
- Localização do cliente passada para servidor autorizado
- Devolver IP do servidor mais próximo
- Melhor desempenho CDN
Redução da Latência Geral
Redes de Entrega de Conteúdo (CDNs)
- Conteúdo de cache em locais de borda
- Servir usuários de servidores próximos
- Reduzir a carga do servidor de origem
Otimização da Ligação
- Multiplexação HTTP/2
- Conexões vivas
- Retomada da sessão TLS
- HTTP/3 (QUIC) para apertos de mão reduzidos
# Escolhas de Infraestrutura
- Vários locais de data center
- Fornecedores de rede Premium
- Caminhos de roteamento otimizados
- Computação de bordas para conteúdo dinâmico
Latência vs Largura de Banda
Compreender a diferença:
- Latency: Quão rápido os dados começam a chegar (atraso)
- Largura de banda: Quantos dados podem fluir por segundo (throughput)
Ambos são importantes para o desempenho, mas a latência muitas vezes tem maior impacto na velocidade percebida pelo usuário, especialmente para aplicações interativas.
Baixa latência é essencial para o desempenho web moderno, impactando diretamente a satisfação do usuário, as taxas de conversão e os rankings do Search Engine.