UNICODEのエンコーディングモデルに関する考え。
詳細はUnicode Technical Report #17を参照(※誰か邦訳して。)
何回かに分ける予定。
UNICODEに於いて、「キャラクターエンコーディングモデル」を4つの階層に分けて考える。
1. ACR: 抽象化済み文字対称集合
抽象化済みの文字のレパートリー※1(Abstract Character Repertoire)
2. CCS: 符号化文字集合(Coded Character Set)
3. CEF: 文字符号化形式(Character Encoding Form)
4. CES: 文字符号化方式(Character Encoding Scheme)
各階層について順次詳細を記述する。
......ACRの説明の前にノーマライゼーションの方が必要かなぁ。
※1勝手訳が気に入らないので訂正。
コメントする