@iorivur
先史時代
自分たちの信じるデフォルトエンコードを使っていた。
8bit幅
警察国家、メール到来
メールで世界を統一しよう。英語しか喋れなくしよう
7bit幅
警察国家、メールの氾濫
base64でエンコードするから阿鼻と叫喚の混声合唱
Emoji国家の勃興と破壊的イノベーション
独自の絵文字でバリエーション
民族解放運動 Unicode
別々の文字で殴りあう時代にさよならしたかった
Unicodeについて少し
Unicodeでは文字は直接には1つの表現方法は持たない
Unicodeで禅問答
Aとaは違うのか
文字とはなにか
Unicodeについてはそれぞれの文化で話し合うようにしてみる
コードポイントは、文字を表すうつろなものでしかなかった。
UTF-16とC言語
16bitですべての文字を表す
while(str[i]) { i++; }
有名なnull-terminate問題
wchar、t、fwscanf()が加わったけど、これが扱う文字がUTF-16と決まったわけではない。
PHPが世界を飲み込む
PHPは文字は1バイト
レンダリングの話
レンダリングはどうするのか
モンゴル語は縦書