개발관련/other

UTF-8, UTF-16 및 UTF-32 의 차이점

Rateye 2021. 7. 6. 10:16
728x90
반응형

 

질문 : UTF-8, UTF-16 및 UTF-32

UTF-8, UTF-16 및 UTF-32의 차이점은 무엇입니까?

나는 그것들이 모두 유니 코드를 저장할 것이고 각각은 문자를 표현하기 위해 다른 수의 바이트를 사용한다는 것을 이해합니다. 하나를 선택하는 것이 장점이 있습니까?

답변

UTF-8은 ASCII 문자가 텍스트 블록에서 대부분의 문자를 나타내는 경우 이점이 있습니다. UTF-8은이를 8 비트 (예 : ASCII)로 인코딩하기 때문입니다. 또한 ASCII 문자 만 포함 된 UTF-8 파일은 ASCII 파일과 인코딩이 동일하다는 점에서 유리합니다.

UTF-16은 주로 문자 당 2 바이트를 사용하기 때문에 ASCII가 우세하지 않은 곳에서 더 좋습니다. UTF-8은 상위 문자에 대해 3 바이트 이상을 사용하기 시작하며 UTF-16은 대부분의 문자에 대해 2 바이트로 유지됩니다.

UTF-32는 가능한 모든 문자를 4 바이트로 처리합니다. 이것은 그것을 꽤 부풀게 만듭니다. 나는 그것을 사용하여 어떤 이점도 생각할 수 없습니다.

출처 : https://stackoverflow.com/questions/496321/utf-8-utf-16-and-utf-32

 

728x90
반응형