한자/SIP

 




SIP는 사실상 '''한자 전용 평면'''이다. 평면 이름부터 보조 표의 문자 평면(Supplementary Ideographic Plane)이다.[1] 유니코드의 BMP 영역에는 이미 2만 7천여 자나 되는 한자가 배당되어 있지만, 그것만으로는 부족하기 때문에 한자 전용 평면을 만든 것이다.
SIP의 한자는 현대에는 잘 쓰이지 않는다고 생각하기 쉬우나, 현대에도 잘 쓰이는 것들이 있다. 𠮟,[2] 𠮷, 𥝱, 𩸽 등은 현대 일본어에서 쓰이고, 주기율표/중국어의 𬭊/𨧀, 𬭳/𨭎, 𬭛/𨨏, 𬭶/𨭆, 𫟼, 𬬭, 𫓧, 𫟷 등은 현대 표준중국어에서 쓰이며, 𡃁, 𨋢 등은 현대 광동어에서 쓰인다.
단일 문서로 SIP의 모든 글자를 넣기에는 공간이 너무 부족해서 부득이하게 두 개의 문서로 쪼개었고, 이마저도 길어 유니코드 하위 문서로 대체되었다. SIP는 UTF-8에서는 모두 '''4바이트 크기'''다. 이게 65,535자가 있다고 생각해 보라.

[1] 그런데 한자는 표의 문자보다는 표어 문자로 분류하는 것이 적절하다. 순수히 뜻만 나타내는 글자도 있지만, 음이나 형태소를 나타내는 글자도 있기 때문.[2] 일본의 2010년 개정 상용한자에는 U+53F1 叱이 아니라 U+20B9F 𠮟이 들어갔다. 일본의 상용한자 중에서 유일하게 BMP가 아니라 SIP에 있는 한자다.