Referência de Programador

Similaridade de Domínio Documentação da API

Similaridade de Domínio Documentação da API: Compare dois domínios para similaridade visual e textual usando múltiplos algoritmos incluindo distância de Levenshtein, similaridade de Jaro-Winkler e análise visual de homoglífos. Essencial para detectar typosquatting, representação de marca e domínios de phishing.

Similaridade de Domínio

Compare dois domínios para similaridade visual e textual usando múltiplos algoritmos incluindo distância de Levenshtein, similaridade de Jaro-Winkler e análise visual de homoglífos. Essencial para detectar typosquatting, representação de marca e domínios de phishing.

GET /v1/similarity

Parâmetros de Consulta

ParâmetroTipoDescrição
domain1 obrigatório string Primeiro domínio (tipicamente o domínio legítimo)
domain2 obrigatório string Segundo domínio (domínio potencialmente suspeito)

Algoritmos de Similaridade

AlgoritmoDescrição
levenshteinDistância de edição normalizada (0-1)
jaro_winklerSimilaridade de string ponderada por prefixo
visualDetecção de caracteres homoglífos/semelhantes

Pedido de Exemplo

curl "https://domscan.net/v1/similarity?domain1=paypal.com&domain2=paypa1.com"
import requests

# Check multiple suspicious domains
legit = "paypal.com"
suspects = ["paypa1.com", "paypaI.com", "pаypal.com"]  # Note: last one has Cyrillic 'а'

for suspect in suspects:
    response = requests.get(
        "https://domscan.net/v1/similarity",
        params={"domain1": legit, "domain2": suspect}
    )
    data = response.json()
    print(f"{suspect}: {data['typosquatting_risk']} risk (visual: {data['similarity']['visual']:.2f})")

Resposta de Exemplo

{
  "domain1": "paypal.com",
  "domain2": "paypa1.com",
  "similarity": {
    "levenshtein": 0.86,
    "jaro_winkler": 0.93,
    "visual": 0.95
  },
  "is_similar": true,
  "typosquatting_risk": "high",
  "homoglyphs_detected": ["l → 1"],
  "risk_factors": ["character_substitution", "high_visual_similarity"]
}

Campos de Resposta

Campo Tipo
domain1 string
domain2 string
similarity_score number
visual_similarity number
textual_similarity number
is_confusable boolean
risk_level string

Usado por pessoas em empresas incríveis

VercelLLM PulseOLXCasa ModernaPipeCal.comBeehiivSnykTogglRemoteSprigDeel