Unicode 란 무엇입니까?
Unicode는 세계 최대의 텍스트의 일관성 있는 인코딩, 표현 및 처리에 대한 범용 컴퓨팅 표준입니다. 도메인 업계에서 Unicode는 중국, 아랍, Cyrillic 및 기타 스크립트와 같은 비 라틴 문자를 포함하는 국제화 된 도메인 이름 (IDN)을 가능하게합니다. Unicode는 모든 언어의 모든 문자에 고유 한 코드 포인트를 할당, 다른 시스템에 걸쳐 일관된 표현을 보장합니다.도메인 이름의 Unicode
IDN 지원
Unicode는 다음과 같은 도메인을 활성화합니다.
- .jp (일본어)
- محال.مر (아라빅)
- пример.рф (러시아 Cyrillic)
- 한국어 (Korean)
Punycode 변환
DNS는 ASCII를 사용하므로 Unicode 도메인은 Punycode로 변환합니다.
Unicode: münchen.de
Punycode: xn--mnchen-3ya.de
Unicode: 北京.中国
Punycode: xn--1lq90i.xn--fiqs8s
Unicode 코드 포인트
구조
Format: U+XXXX (hexadecimal)
Examples:
A = U+0041 (Latin A)
а = U+0430 (Cyrillic a)
中 = U+4E2D (Chinese character)
캐릭터 블록
| 제품정보 | 주요 특징 | 스크립트 |
|---|---|---|
| 기본 Latin | 우+0000-007F | 한국어/ASCII |
| 카테고리 | U+0400-04FF를 위해 | 러시아, 등. |
| 주요 특징 | 사이트맵 | 주요 특징 |
| 사이트맵 | 우+4E00-9FFF | 중국어/일본어/한국어 |
보안 Concerns
Homoglyph 공격
다른 스크립트에서 비슷한 문자:
Latin 'a' (U+0061) vs Cyrillic 'а' (U+0430)
Latin 'o' (U+006F) vs Cyrillic 'о' (U+043E)
Attack: аpple.com (Cyrillic 'а') looks like apple.com
브라우저 보호
브라우저는 의심스러운 혼합 스크립트 도메인에 대한 Punycode를 표시 할 수 있습니다.
Unicode 정상화
동일한 문자를 나타내는 다른 방법:
é = U+00E9 (precomposed)
é = U+0065 + U+0301 (decomposed: e + combining accent)
Normalization forms: NFC, NFD, NFKC, NFKD
Unicode는 글로벌 인터넷 접근성에 필수적이며, 전 세계 사용자들이 네이티브 스크립트 및 언어의 도메인 이름을 등록하고 액세스할 수 있도록 합니다.