2009年08月07日 15:00 [Edit]
Unicode - JISマークは一文字!
私もびっくりしたのですが、事実です。
まずは以下をご覧下さい。
〄は一文字です(U+3004)。
フォントまわりをカスタマイズしていないIEでも表示を確認できました。UbuntuのFirefoxでは空白でしたが。
なぜ気がついたかと言えば、unicode@unicode.org
にこんな書き込みが登場したからです。
At http://en.wikipedia.org/wiki/Japanese_Industrial_Standards, a new symbol for JIS is shown and discussed. Will there be a new character in the Standard? (Not a new glyph in the same codepoint, I hope!!)
JISマークが刷新されたけど、Unicodeは割り当てられるの?(新グリフを同じコードポイントに割り当てるのは勘弁な!)
確かに、よく見るとU+3004は、旧JISマークとして表示されています。というか、JISってロゴ変わったんだ。
その答えは後回しにして、これに対する返事でU+FFFD吹いた。
If this is a character, those should be glyph variants.
これが文字だとしたら、異字体に決まってんだろJK
異字体www。彈と弾みたいなものであると。
しかし、それ以前になんで一団体のロゴがコードポイントもっているのでしょう。ISOのロゴすらもっていないのに。
他にもこういう例がないかと調べてみると、ありました。
% grep STANDARD /usr/local/lib/perl5/5.10.0/unicore/Name.pl 3004 JAPANESE INDUSTRIAL STANDARD SYMBOL 327F KOREAN STANDARD SYMBOL
㉿も一文字ですが、表示できるかな?
しかし、なぜ日本と韓国の工業標準団体のロゴだけが、Unicodeされてるんだ? JIS X 0208にもJIS X 0213にも「JIS一文字」なんてないのに。
犯人は酒井法子より意外でした。
% grep 3004 ~/cpan/Encode/trunk/ucm/*.ucm /Users/dankogai/cpan/Encode/trunk/ucm/macJapanese.ucm:\x86\xB5 |0 # JAPANESE INDUSTRIAL STANDARD SYMBOL
なんと、犯人はAppleだったのです。
なんでこんなことになったかいえば、それがたまたま macJapanese に登録されていて、そして Unicode が制定されるときに、それまでの主立った文字コードとのラウンドトリップ互換性 -- Unicodeに変換して元に変換しなおせる -- ことを保証したからなのです。その「これまでの文字コード」の中に、macJapaneseが入っていたのだと(おかげでEncodeでもサポートしています)。
JISの中の人も、知らなかったでしょうね。まさか自分ところのロゴが知らない間に国際規格になっていたなんて!
実は、同じ理由で Apple のロゴも Unicode にあります。以下をご覧下さい。
http://unicode.org/Public/MAPPINGS/VENDORS/APPLE/KEYBOARD.TXTよりUnicode | Apple | Description | |
⇥ | U+21E5 | 0x02 | RIGHTWARDS ARROW TO BAR # Tab right (left-to-right text) |
⇤ | U+21E4 | 0x03 | LEFTWARDS ARROW TO BAR # Tab left (right-to-left text) |
⌤ | U+2324 | 0x04 | UP ARROWHEAD BETWEEN TWO HORIZONTAL BARS # Enter key |
⇧ | U+21E7 | 0x05 | UPWARDS WHITE ARROW # Shift key |
⌃ | U+2303 | 0x06 | UP ARROWHEAD # Control key |
⌥ | U+2325 | 0x07 | OPTION KEY # Option key |
␣ | U+2423 | 0x09 | OPEN BOX # Space key (Mac OS X mapping, duplicates mapping for 0x61, hence no round-trip) |
⌦ | U+2326 | 0x0A | ERASE TO THE RIGHT # Delete right (right-to-left text) |
↩ | U+21A9 | 0x0B | LEFTWARDS ARROW WITH HOOK # Return key (left-to-right text) |
↪ | U+21AA | 0x0C | RIGHTWARDS ARROW WITH HOOK # Return key (right-to-left text) |
| U+F802 | 0x0F | lower left pencil |
⇣ | U+21E3 | 0x10 | DOWNWARDS DASHED ARROW |
⌘ | U+2318 | 0x11 | PLACE OF INTEREST SIGN # Command key |
✓ | U+2713 | 0x12 | CHECK MARK |
◆ | U+25C6 | 0x13 | BLACK DIAMOND |
| U+F8FF | 0x14 | Apple logo |
⌫ | U+232B | 0x17 | ERASE TO THE LEFT # Delete left (left-to-right text) |
⇠ | U+21E0 | 0x18 | LEFTWARDS DASHED ARROW |
⇡ | U+21E1 | 0x19 | UPWARDS DASHED ARROW |
⇢ | U+21E2 | 0x1A | RIGHTWARDS DASHED ARROW |
⎋ | U+238B | 0x1B | BROKEN CIRCLE WITH NORTHWEST ARROW # Escape key; for Unicode 3.0 and later |
⌧ | U+2327 | 0x1C | X IN A RECTANGLE BOX # Clear key |
U+0020 | 0x20 | SPACE | |
0 | U+0030 | 0x30 | DIGIT ZERO |
1 | U+0031 | 0x31 | DIGIT ONE |
2 | U+0032 | 0x32 | DIGIT TWO |
3 | U+0033 | 0x33 | DIGIT THREE |
4 | U+0034 | 0x34 | DIGIT FOUR |
5 | U+0035 | 0x35 | DIGIT FIVE |
6 | U+0036 | 0x36 | DIGIT SIX |
7 | U+0037 | 0x37 | DIGIT SEVEN |
8 | U+0038 | 0x38 | DIGIT EIGHT |
9 | U+0039 | 0x39 | DIGIT NINE |
F | U+0046 | 0x46 | LATIN CAPITAL LETTER F |
␣ | U+2423 | 0x61 | OPEN BOX # Blank key |
⇞ | U+21DE | 0x62 | UPWARDS ARROW WITH DOUBLE STROKE # Page up key |
⇪ | U+21EA | 0x63 | UPWARDS WHITE ARROW FROM BAR # Caps lock key |
← | U+2190 | 0x64 | LEFTWARDS ARROW |
→ | U+2192 | 0x65 | RIGHTWARDS ARROW |
↖ | U+2196 | 0x66 | NORTH WEST ARROW |
?⃝ | U+003F U+20DD | 0x67 | QUESTION MARK + COMBINING ENCLOSING CIRCLE # Help key |
↑ | U+2191 | 0x68 | UPWARDS ARROW |
↘ | U+2198 | 0x69 | SOUTH EAST ARROW |
↓ | U+2193 | 0x6A | DOWNWARDS ARROW |
⇟ | U+21DF | 0x6B | DOWNWARDS ARROW WITH DOUBLE STROKE # Page down key |
| U+F8FF U+F87F | 0x6C | Apple logo, outline |
| U+F803 | 0x6D | Contextual menu key symbol |
❘⃝ | U+2758 U+20DD | 0x6E | LIGHT VERTICAL BAR + COMBINING ENCLOSING CIRCLE # Power key |
F1 | U+F860 U+0046 U+0031 | 0x6F | group_2 + F + 1 # F1 key |
F2 | U+F860 U+0046 U+0032 | 0x70 | group_2 + F + 2 # F2 key |
F3 | U+F860 U+0046 U+0033 | 0x71 | group_2 + F + 3 # F3 key |
F4 | U+F860 U+0046 U+0034 | 0x72 | group_2 + F + 4 # F4 key |
F5 | U+F860 U+0046 U+0035 | 0x73 | group_2 + F + 5 # F5 key |
F6 | U+F860 U+0046 U+0036 | 0x74 | group_2 + F + 6 # F6 key |
F7 | U+F860 U+0046 U+0037 | 0x75 | group_2 + F + 7 # F7 key |
F8 | U+F860 U+0046 U+0038 | 0x76 | group_2 + F + 8 # F8 key |
F9 | U+F860 U+0046 U+0039 | 0x77 | group_2 + F + 9 # F9 key |
F10 | U+F861 U+0046 U+0031 U+0030 | 0x78 | group_3 + F + 1 + 0 # F10 key |
F11 | U+F861 U+0046 U+0031 U+0031 | 0x79 | group_3 + F + 1 + 1 # F11 key |
F12 | U+F861 U+0046 U+0031 U+0032 | 0x7A | group_3 + F + 1 + 2 # F12 key |
F13 | U+F861 U+0046 U+0031 U+0033 | 0x87 | group_3 + F + 1 + 3 # F13 key |
F14 | U+F861 U+0046 U+0031 U+0034 | 0x88 | group_3 + F + 1 + 4 # F14 key |
F15 | U+F861 U+0046 U+0031 U+0035 | 0x89 | group_3 + F + 1 + 5 # F15 key |
⎈ | U+2388 | 0x8A | HELM SYMBOL # Control key (ISO standard), Unicode 3.0 and later |
⎇ | U+2387 | 0x8B | ALTERNATIVE KEY SYMBOL # Unicode 3.0 and later |
⏏ | U+23CF | 0x8C | EJECT SYMBOL # Unicode 4.0 and later, Mac OS X only |
英数 | U+82F1 U+6570 | 0x8D | Japanese "eisu" key symbol # Mac OS X only |
かな | U+304B U+306A | 0x8E | Japanese "kana" key symbol # Mac OS X only |
F16 | U+F861 U+0046 U+0031 U+0036 | 0x8F | group_3 + F + 1 + 6 # F16 key, Mac OS X only |
ただし、あくまで互換性のために用意されたに過ぎず、PRIVATE USE = 外字扱いとなっています。
コマンド記号 - WikipediaアップルコンピュータのMacintoshでは、修飾キーとして、コマンドキーとよばれるキーが使用され、アップルマーク(ユニコードではU+F8FFで「」であるが、現在のUnicodeには実装されておらず外字として使用される)が刻印されていたが、1984年に発売されたMacintoshからはアップルマークと併用してコマンド記号も刻印されるようになり、2007年に発売された機種からは、コマンド記号のみになった。
同様のいきさつで入ってしまったJISマークが、立派な記号文字として分類されて、「新旧字体」がうんぬんされるようになったのとは対象的です。しかも、おそらくJISの与り知らぬところで。
どうでもいいことを押尾学んでしまった。
Dan the Reluctant Unicoder
この記事へのトラックバックURL
Appleにいる(いた)当事者に聞かないとわかんないだろうけれど。