티스토리 뷰

JSP

[JSP #7 ] 한글처리방식(인코딩)

녹색꼬맹이 2017. 9. 18. 21:37
반응형
SMALL

 

1. JSP의 charset 과 pageEncoding

 

1
2
<%@ page language="java" contentType="text/html; charset=EUC-KR"
    pageEncoding="EUC-KR"%>
cs

 

 

위 처럼 처음 JSP를 생성하면 나오는 코드.

보면 charset=EUC-KR pageEncoding=EUC-KR 로 설정되어있다.

 

charset : HTTP Client(웹브라우저)가 받아볼 페이지의 인코딩 방식.

pageEncoding : JSP파일에 기록된 소스코드 자체의 인코딩 방식.

 

 

그럼 이 둘의 차이는 뭘까 ?

 

2. EUC-KR 과 UTF-8

 

한글을 처리하는 인코딩 방식으로 말할 수 있다.

 

ECU-KR : 한글을 완성된 글자 자체로 보관하고 있다. ( 대략 총 11,172 의 완성된 글자가 저장되어 있다나..? )

하나의 글자를 2byte로 동일하게 처리하며, 메모리를 많이 차지하게 되고 한글이 가끔 깨져서 전송될 때가 있다. 완성된 글자로 저장하기 때문에 저장되지 않은 문자는 깨진다고 보면 된다.

 

UTF-8 : 조합형 한글 유니코드 란다. ( 한글을 분리해서 저장하는 방식 )

메모리를 적제 차지하는것이 장점이라면 장점!, 한글로 따로 복원할 필요 없이 데이터를 전송할 수 있다. 다만, 조합형 한글 유니코드다보니 하나하나의 글자가 저장되는 메모리가 다르다. ( 1~3byte 로 저장한다. )

 

최근에는 메모리를 적게 차지하는 UTF-8을 주로 사용한다고 알고 있다.

 

 

반응형
LIST
댓글