开发者参考

域名相似性 API 文档

域名相似性 API 文档: 使用多个算法比较两个域名的视觉和文本相似性,包括Levenshtein距离、Jaro-Winkler相似性和视觉同字素分析。对于检测仿冒、品牌冒充和钓鱼域名至关重要。

域名相似性

使用多个算法比较两个域名的视觉和文本相似性,包括Levenshtein距离、Jaro-Winkler相似性和视觉同字素分析。对于检测仿冒、品牌冒充和钓鱼域名至关重要。

GET /v1/similarity

查询参数

参数类型说明
domain1 必需 string 第一个域名(通常是合法域名)
domain2 必需 string 第二个域名(可能是可疑域名)

相似性算法

算法描述
levenshtein编辑距离正规化(0-1)
jaro_winkler前缀加权字符串相似性
visual同字素/外观相似字符检测

请求示例

curl "https://domscan.net/v1/similarity?domain1=paypal.com&domain2=paypa1.com"
import requests

# Check multiple suspicious domains
legit = "paypal.com"
suspects = ["paypa1.com", "paypaI.com", "pаypal.com"]  # Note: last one has Cyrillic 'а'

for suspect in suspects:
    response = requests.get(
        "https://domscan.net/v1/similarity",
        params={"domain1": legit, "domain2": suspect}
    )
    data = response.json()
    print(f"{suspect}: {data['typosquatting_risk']} risk (visual: {data['similarity']['visual']:.2f})")

响应示例

{
  "domain1": "paypal.com",
  "domain2": "paypa1.com",
  "similarity": {
    "levenshtein": 0.86,
    "jaro_winkler": 0.93,
    "visual": 0.95
  },
  "is_similar": true,
  "typosquatting_risk": "high",
  "homoglyphs_detected": ["l → 1"],
  "risk_factors": ["character_substitution", "high_visual_similarity"]
}

响应字段

字段 类型
domain1 string
domain2 string
similarity_score number
visual_similarity number
textual_similarity number
is_confusable boolean
risk_level string

被出色公司的人们使用

VercelLLM PulseOLXCasa ModernaPipeCal.comBeehiivSnykTogglRemoteSprigDeel