WHOISとは何か?
WHOISはドメイン名登録情報をクエリするための元々のプロトコルで、インターネットの初期段階にまで遡ります。WHOIS検索を実行すると、登録者情報、作成日、有効期限日、および従来は登録者の連絡先情報を含む、ドメイン登録に関する詳細を含むテキストベースのレスポンスを受け取ります。
WHOISの歴史
WHOISは1980年代に出現し、インターネットがはるかに小さかった時代です。元々RFC 812 (1982)で記録されたWHOISは、システム管理者がネットワークリソースの責任者を特定できるように設計されていました。プロトコルはTCPポート43で動作し、シンプルなテキストクエリを受け付け、人間が読みやすい (しかし機械に不親切な)レスポンスを返します。
開発者にとってWHOISが問題である理由
WHOISデータを解析するアプリケーションを構築してきたのであれば、その根本的な欠点をご存じでしょう: 標準形式が存在しないという点です。各レジストラおよびレジストリは異なる方法でWHOIS出力をフォーマットします。以下の現実的な課題を考慮してください:
一貫性のないフィールド名
- あるレジストラは「Creation Date」を使用
- 別のレジストラは「Created On」を使用
- 3番目のレジストラは「Registration Date」を使用
- 一部は小文字で「created:」を使用
多様な日付形式
2024-01-15T00:00:00Z
15-Jan-2024
January 15, 2024
15/01/2024
予測不可能な構造
いくつかのレジストラはセクション間に空行を含み、他のレジストラは含みません。区切り文字としてコロンを使用するものもあれば、タブを使用するものもあります。この矛盾は、堅牢なWHOIS解析では数十の正規表現パターンを保持し、レジストラが形式を変更するたびにそれらを更新し続ける必要があることを意味します。
WHOISの技術的詳細
プロトコルレベルではWHOISクエリはシンプルです:
1. WHOISサーバーのポート43へのTCP接続を開く
2. ドメイン名の後に改行を送信
3. 接続が閉じられるまでレスポンスを読む
echo "example.com" | nc whois.verisign-grs.com 43
レスポンスはプレーンテキストで標準化された構造を持たず、有用な情報を抽出するための慎重な解析が必要です。
WHOISのプライバシー変更
2018年のGDPR導入は、WHOIS データ可用性を根本的に変更しました。以前は、WHOISレスポンスは以下を含みました:
- 登録者名および組織
- メールアドレスと電話番号
- 住所
現在では、ほとんどのレジストラはこの個人情報を削除し、以下のみを表示します:
- レジストラ名
- 登録および有効期限日
- ネームサーバー情報
- ドメインステータスコード
このプライバシー保護は、連絡先検索の点ではWHOISの有用性を低下させていますが、利用可能性確認と技術的ドメイン情報には依然として価値があります。
WHOISとRDAPの使い分け
新しい開発では、利用可能な場合は常にRDAPを優先します。RDAPは同じ情報を解析が簡単な標準化されたJSON形式で提供します。ただし、WHOISは以下の場合に必要です:
- 移行していない従来のシステム
- RDAPを実装していないいくつかのccTLD
- 履歴データ分析ツール
WHOISサーバーの検索
各TLDには指定されたWHOISサーバーがあります。例えば:
- .com/.net: whois.verisign-grs.com
- .org: whois.publicinterestregistry.org
- .io: whois.nic.io
IANAは whois.iana.org に適切なTLDのWHOISサーバーにあなたを指すことができるルートデータベースを保持しています。
WHOISの未来
ICANNはRDAP採用を義務付けており、WHOISは段階的に廃止されています。WHOISサーバーは今後数年間は運用され続ける可能性がありますが、新しいアプリケーションはRDAPで構築される必要があります。DomScanはサポートされているすべてのTLD間で一貫した信頼性の高い結果を保証するため、ドメイン利用可能性チェックにRDAPのみを使用します。