Unicode とサロゲートコードポイント
Posted on 土 14 11月 2020 in 規格 • Tagged with Unicode, UTF, 文字コード
Unicode は、文字コードの標準を目指して創設された規格であり、文字をどう処理するか、テキストデータとしてどう表すかを規定している。今や国際的に普及した規格で、特に Unicode が規定する符号化方式 UTF-8 は、いまやテキストデータのエンコーディングデファクト標準となっている。
Unicode は歴史的経緯からサロゲートコードポイントという仕様を包含している。今回は、この仕様の紹介と、UTF-8 を使う際の注意点を見ていく。なお,
- Unicode 13.0.0: https://www …
Continue reading