유니코드

프로토콜 및 표준
거의 모든 세계 문자 체계에서 일관된 인코딩 및 텍스트 처리를 위한 컴퓨팅 표준입니다.
← 용어집으로 돌아가기

Unicode 란 무엇입니까?

Unicode는 세계 최대의 텍스트의 일관성 있는 인코딩, 표현 및 처리에 대한 범용 컴퓨팅 표준입니다. 도메인 업계에서 Unicode는 중국, 아랍, Cyrillic 및 기타 스크립트와 같은 비 라틴 문자를 포함하는 국제화 된 도메인 이름 (IDN)을 가능하게합니다. Unicode는 모든 언어의 모든 문자에 고유 한 코드 포인트를 할당, 다른 시스템에 걸쳐 일관된 표현을 보장합니다.

도메인 이름의 Unicode

IDN 지원

Unicode는 다음과 같은 도메인을 활성화합니다.

Punycode 변환

DNS는 ASCII를 사용하므로 Unicode 도메인은 Punycode로 변환합니다.

Unicode: münchen.de

Punycode: xn--mnchen-3ya.de

Unicode: 北京.中国

Punycode: xn--1lq90i.xn--fiqs8s

Unicode 코드 포인트

구조

Format: U+XXXX (hexadecimal)

Examples:

A = U+0041 (Latin A)

а = U+0430 (Cyrillic a)

中 = U+4E2D (Chinese character)

캐릭터 블록

제품정보주요 특징스크립트
기본 Latin우+0000-007F한국어/ASCII
카테고리U+0400-04FF를 위해러시아, 등.
주요 특징사이트맵주요 특징
사이트맵우+4E00-9FFF중국어/일본어/한국어

보안 Concerns

Homoglyph 공격

다른 스크립트에서 비슷한 문자:

Latin 'a' (U+0061) vs Cyrillic 'а' (U+0430)

Latin 'o' (U+006F) vs Cyrillic 'о' (U+043E)

Attack: аpple.com (Cyrillic 'а') looks like apple.com

브라우저 보호

브라우저는 의심스러운 혼합 스크립트 도메인에 대한 Punycode를 표시 할 수 있습니다.

Unicode 정상화

동일한 문자를 나타내는 다른 방법:

é = U+00E9 (precomposed)

é = U+0065 + U+0301 (decomposed: e + combining accent)

Normalization forms: NFC, NFD, NFKC, NFKD

Unicode는 글로벌 인터넷 접근성에 필수적이며, 전 세계 사용자들이 네이티브 스크립트 및 언어의 도메인 이름을 등록하고 액세스할 수 있도록 합니다.

이 지식을 활용하세요

DomScan의 API를 사용하여 도메인 가용성, 상태 등을 확인하세요.