유니코드와 UTF-8 1. ASCII Encoding - 1 byte (8 bit) 중 Checksum으로 1 bit를 제외한 총 7 bit로 문자를 표현 - 한글이나 한자의 경우 2 개 이상의 특수문자를 합쳐서 표현하기 때문에 글자가 자주 깨짐 2. Unicode - 2-4 byte 공간에 여유있게 문자 할당 - 문제점) 1 byte로 표현 가능한 문자(영어, 숫자)도 필요 이상의 공간을 할당해 메모리 낭비가 심함 3. UTF-8 - Unicode의 가변길이 문자 인코딩 방식: 불필요한 공간의 낭비를 줄일 수 있음 - 표) UTF-8 byte 순서의 이진 포맷 byte 수 byte 1 byte 2 byte 3 byte 4 1 0xxx xxxx 2 110x xxxx 10xx xxxx 3 1110 xxxx 10xx xxxx 1.. 이전 1 다음