2011-06-30
■なぜ右矢印はiPhoneで絵文字にならないのか
- もうすぐMacでカラー絵文字が使えるようになる。そうすると当然、Macで入力した絵文字(Unicode絵文字)をiPhoneやiPadで目にすることになるだろう。というわけで、その状況を先取りし、Unicode絵文字(私用領域ではない符号位置で表現したもの)をiPadで*1表示してみた結果が、前回のエントリの最後の図。iPhone/iPadでは絵文字として表示されないものが、いくつかあった。たとえば「⬆⬇➡⬅」のなかでは「➡」が、iPhoneでは絵文字にならない(下図)。
2011-06-28
■iPhone絵文字についてUnicodeの視点からまとめてみた
- いまの段階では、iPhone絵文字は主にSMS/MMSなどシフトJISの世界で使われるものだが、Unicodeで表現することもできる。iPhoneでは、文字化けを防ぐために、絵文字キーボードは絵文字が使えるシーン(シフトJISの世界)でしか出てこないようになっている。しかし、たとえばSMS/MMSで絵文字を入力した上でクリップボードにコピーし、Unicodeの世界に連れてくることは可能である。
- Unicodeでは、iPhone絵文字は基本的に私用領域(PUA)の符号位置で表現される。それに加え、日本のケータイ絵文字がUnicodeに収録されたことを受けて、iOSはこちらの(PUAではない)符号位置もサポートしている。おそらくiOS 5では、PUAではない符号位置のほうがデフォルトになるものと思われる。
- iPhone絵文字はSoftBank絵文字と互換性を持っている。ただし、SoftBank絵文字には動くものが含まれるのに対して、iPhone絵文字は動かない。このため、動きによってのみ区別されるSoftBank絵文字のペアに対しては、iPhone絵文字は同じものが割り当てられている。
- たとえばSoftBank絵文字には動く疑問符と動かない疑問符があるが、それらをiPhoneに送信すると、いずれも動かない疑問符となる。逆にiPhoneから動かない疑問符を送信した場合、SoftBank絵文字では「動く」疑問符となるのがおもしろい。同様にiPhoneから送信した動かない感嘆符はSoftBank絵文字では動く感嘆符となり、星はまたたく星となる*2。
2011-06-23
■PRI 183についてのメモ
- PRI 183を、ざっとチェックしたので、その内容についてメモ。PRI 183は、Adobe-Japan1のグリフを表現するための、32のIVSの追加提案(の公開レビュー)であり、IVDのUnicode 6.0対応を図るアップデートだ。
- これまで、Adobe-Japan1の漢字のうちIVSでは表現できないものが20文字あった(Unicodeでは表現できない2つの漢字)が、今回の追加で「積み残し」は解消される*1。
- 下図は、新たにIVSで表現することが可能となる20文字(白地)。符号位置の右は、その字を追加したUnicodeのバージョン。括弧内はソース。UTCソースはAdobe-Japan1そのもの。CID+13763は、一度はU+5DE5には包摂されない(IVSにおいてU+5DE5を基底文字とすることはできない)と見なされた経緯があるが、結局以前の提案(PRI 98)通りの形に戻ったようだ。
- 追加される32のIVSから上図の20文字を引いた残りの12のケースでは、登録済みのグリフに対して、別の(2つ目の)IVSを割り当てることになる。一度登録したIVSは変更または削除することができないので、より適切な基底文字が出てきた場合、そちらにも新たにIVSを振るしかない。
- CID+13723(上図右上の赤枠)の基底文字としては、U+2363AよりもU+2B78Eのほうが適切だと思われるが、「できるだけIVSの重複を増やさない」という方針により、U+2B78Eを基底文字としたIVSが追加されるのは、U+2B78Eの例示とドンピシャで一致するCID+13724のみとなっているようだ*2。CID+14065(上図左下の赤枠)も同様の事情。
2011-06-17
■Hanyo-Denshiのハイフン
The identifiers for collections and sequences are character strings starting with one of 'A'..'Z', 'a'..'z', and continuing with one of 'A'..'Z', 'a'..'z', '0'..'9', '_'.
■汎用電子の正規表現
- UTS #37とその改訂版のドラフトによれば、あるコレクションに含まれるシーケンス識別子は、IVD_Collections.txtに記述された正規表現にマッチしなければならない。
- IVD_Collections.txtにおける汎用電子の正規表現は、次のようになっている。
[A-Z][A-Z][0-9A-F]+S*
*1:Ken Lundeさん、情報ありがとうございます! http://twitter.com/#!/ken_lunde/status/81349166600683521 http://twitter.com/#!/ken_lunde/status/81419976807944192
*2:ところで、汎用電子のシーケンス識別子(グリフ名)における大文字のSと小文字のsの意味の違いって何だっけ?
2011-06-13
■Adobe-Japan1と汎用電子のIVSは統合できるのか
- たとえば「次」のE0100(Adobe-Japan1)とE0103(汎用電子)は、いずれもJIS X 0208:1990の例示字形を参照しており、明らかに同じ字であると考えられる。しかし、Adobe-Japan1にはE0100とE0102の区別があるのに対して、汎用電子ではどちらの形もE0103に包摂されている(下図)。
- このため、水色地のグリフであることを明示的に表現するための(Adobe-Japan1の)6B21 E0100というIVSに対して、「汎用電子側への正規化」を行い、6B21 E0103に変換すると、(Adobe-Japan1ではE0102で表現されるはずの)ピンク地のグリフに「化けて」表示される可能性がある。