开发者参考
域名相似性 API 文档
域名相似性 API 文档: 使用多个算法比较两个域名的视觉和文本相似性,包括Levenshtein距离、Jaro-Winkler相似性和视觉同字素分析。对于检测仿冒、品牌冒充和钓鱼域名至关重要。
域名相似性
使用多个算法比较两个域名的视觉和文本相似性,包括Levenshtein距离、Jaro-Winkler相似性和视觉同字素分析。对于检测仿冒、品牌冒充和钓鱼域名至关重要。
GET
/v1/similarity
查询参数
| 参数 | 类型 | 说明 |
|---|---|---|
| domain1 必需 | string | 第一个域名(通常是合法域名) |
| domain2 必需 | string | 第二个域名(可能是可疑域名) |
相似性算法
| 算法 | 描述 |
|---|---|
levenshtein | 编辑距离正规化(0-1) |
jaro_winkler | 前缀加权字符串相似性 |
visual | 同字素/外观相似字符检测 |
请求示例
curl "https://domscan.net/v1/similarity?domain1=paypal.com&domain2=paypa1.com"
import requests
# Check multiple suspicious domains
legit = "paypal.com"
suspects = ["paypa1.com", "paypaI.com", "pаypal.com"] # Note: last one has Cyrillic 'а'
for suspect in suspects:
response = requests.get(
"https://domscan.net/v1/similarity",
params={"domain1": legit, "domain2": suspect}
)
data = response.json()
print(f"{suspect}: {data['typosquatting_risk']} risk (visual: {data['similarity']['visual']:.2f})")
响应示例
{
"domain1": "paypal.com",
"domain2": "paypa1.com",
"similarity": {
"levenshtein": 0.86,
"jaro_winkler": 0.93,
"visual": 0.95
},
"is_similar": true,
"typosquatting_risk": "high",
"homoglyphs_detected": ["l → 1"],
"risk_factors": ["character_substitution", "high_visual_similarity"]
}
响应字段
| 字段 | 类型 |
|---|---|
domain1 |
string |
domain2 |
string |
similarity_score |
number |
visual_similarity |
number |
textual_similarity |
number |
is_confusable |
boolean |
risk_level |
string |