开发者参考

域名相似性

通过 DomScan API，使用多个算法比较两个域名的视觉和文本相似性,包括Levenshtein距离、Jaro-Winkler相似性和视觉同字素分析。对于检测仿冒、品牌冒充和钓鱼域名至关重要。

域名相似性

使用多个算法比较两个域名的视觉和文本相似性,包括Levenshtein距离、Jaro-Winkler相似性和视觉同字素分析。对于检测仿冒、品牌冒充和钓鱼域名至关重要。

GET /v1/similarity

查询参数

参数	类型	说明
domain1 必需	string	第一个域名(通常是合法域名)
domain2 必需	string	第二个域名(可能是可疑域名)

相似性算法

算法	描述
`levenshtein`	编辑距离正规化(0-1)
`jaro_winkler`	前缀加权字符串相似性
`visual`	同字素/外观相似字符检测

请求示例

curl -H "X-API-Key: your-api-key" "https://domscan.net/v1/similarity?domain1=paypal.com&domain2=paypa1.com"

import requests

domscan = requests.Session()
domscan.headers.update({"X-API-Key": "your-api-key"})

# Check multiple suspicious domains
legit = "paypal.com"
suspects = ["paypa1.com", "paypaI.com", "pаypal.com"]  # Note: last one has Cyrillic 'а'

for suspect in suspects:
    response = domscan.get(
        "https://domscan.net/v1/similarity",
        params={"domain1": legit, "domain2": suspect}
    )
    data = response.json()
    print(f"{suspect}: {data['typosquatting_risk']} risk (visual: {data['similarity']['visual']:.2f})")

响应示例

{
  "domain1": "paypal.com",
  "domain2": "paypa1.com",
  "similarity": {
    "levenshtein": 0.86,
    "jaro_winkler": 0.93,
    "visual": 0.95
  },
  "is_similar": true,
  "typosquatting_risk": "high",
  "homoglyphs_detected": ["l → 1"],
  "risk_factors": ["character_substitution", "high_visual_similarity"]
}

响应字段

字段	类型
`domain1`	string
`domain2`	string
`similarity_score`	number
`visual_similarity`	number
`textual_similarity`	number
`is_confusable`	boolean
`risk_level`	string