일반 유니코드(Unicode)와 'UTF-8 유니코드'의 차이점

Posted at 2006/10/24 12:37 // in 트랜드/Web 2.0 // by 블루비
(1) 보통의 한국어 텍스트 문서: 이것은 아스키 문서이며 유니코드가 아닙니다. 영문/숫자/기호는1바이트. 한글과 한자는 2바이트로 표현됩니다. euc-kr 또는 ksc_c_5601-1987 로 불리는 인코딩이며 웹페이지작성에 사용할 수 있습니다. 특수한 외국어 문자나 일본식/중국식 한자는 표현할 수 없습니다.

다음의 2개가 유니코드입니다:

(2) 일반 유니코드(Unicode): 모든 글자를 2바이트로 표현합니다. 전세계 모든 글자들을 한꺼번에 표현할 수 있습니다. 인터넷에 HTML 파일로 올릴 수 없습니다. 즉 웹페이지 작성에 쓸 수 없습니다.

(3) UTF-8 유니코드:영문/숫자/기호는 1바이트로, 한글과 한자 등은 3바이트로 표현합니다. 전세계 모든 글자들을 한꺼번에 표현할 수 있습니다.웹페이지 작성에 쓸 수 있습니다.

출처 : http://mwultong.blogspot.com/2006/10/java-utf-8-ks.html
2006/10/24 12:37 2006/10/24 12:37

http://blueb.net/blog/trackback/656

  1. TENMA

    2006/10/24 15:00 [수정/삭제] [답글]

    (2)번은 UTF-16 이라는 이름이 정싱명칭일겁니다. 아마도(아닌가 -_-;)

  2. TENMA

    2006/10/25 10:55 [수정/삭제] [답글]

    이만한데가 없긴 하지요 http://en.wikipedia.org/wiki/Unicode
    잘못 알고 있는건 아니고, 우리가 사용하고 있는 대부분의 2바이트 유니코드는 UTF-16이 맞긴 맞는것 같네요. 윈도우즈 쪽은 UCS-2에서 UTF-16으로 확장이 된 것 같고요...

댓글을 남겨주세요.

[로그인][오픈아이디란?]