Referência para desenvolvedores

Similaridade de Domínio

Explore a documentação da API de Similaridade de Domínio, os parâmetros de solicitação, os campos de resposta, os exemplos de código e o tratamento de erros para integrações com o DomScan.

Similaridade de Domínio

Compare dois domínios para similaridade visual e textual usando múltiplos algoritmos incluindo distância de Levenshtein, similaridade de Jaro-Winkler e análise visual de homoglífos. Essencial para detectar typosquatting, representação de marca e domínios de phishing.

GET /v1/similarity

Parâmetros de Consulta

Parâmetro	Tipo	Descrição
domain1 obrigatório	string	Primeiro domínio (tipicamente o domínio legítimo)
domain2 obrigatório	string	Segundo domínio (domínio potencialmente suspeito)

Algoritmos de Similaridade

Algoritmo	Descrição
`levenshtein`	Distância de edição normalizada (0-1)
`jaro_winkler`	Similaridade de string ponderada por prefixo
`visual`	Detecção de caracteres homoglífos/semelhantes

Pedido de Exemplo

curl -H "X-API-Key: your-api-key" "https://domscan.net/v1/similarity?domain1=paypal.com&domain2=paypa1.com"

import requests

domscan = requests.Session()
domscan.headers.update({"X-API-Key": "your-api-key"})

# Check multiple suspicious domains
legit = "paypal.com"
suspects = ["paypa1.com", "paypaI.com", "pаypal.com"]  # Note: last one has Cyrillic 'а'

for suspect in suspects:
    response = domscan.get(
        "https://domscan.net/v1/similarity",
        params={"domain1": legit, "domain2": suspect}
    )
    data = response.json()
    print(f"{suspect}: {data['typosquatting_risk']} risk (visual: {data['similarity']['visual']:.2f})")

Resposta de Exemplo

{
  "domain1": "paypal.com",
  "domain2": "paypa1.com",
  "similarity": {
    "levenshtein": 0.86,
    "jaro_winkler": 0.93,
    "visual": 0.95
  },
  "is_similar": true,
  "typosquatting_risk": "high",
  "homoglyphs_detected": ["l → 1"],
  "risk_factors": ["character_substitution", "high_visual_similarity"]
}

Campos de Resposta

Campo	Tipo
`domain1`	string
`domain2`	string
`similarity_score`	number
`visual_similarity`	number
`textual_similarity`	number
`is_confusable`	boolean
`risk_level`	string