Unicode用語

- -
抽象文字集合 Unicodeが対象とする文字集合
符号化文字集合 抽象文字集合に非負整数の番号を付けたもの
文字符号化形式 コンピュータ中での符号化文字集合データ表現方法
文字符号化方法 文字符号化形式にエンディアンなどを決定したもの

符号化文字集合は 0x000000 ~ 0x10FFFF までの範囲で定義される。
UTF16 は 0x100000 ~ 0x10FFFF をサロゲートペアを使用して表す。

文字符号化形式は UTF8 や UTF16 、 UTF32 など。
文字符号化方法は UTF16-BE など。