文字
文字@デジタル
(2010/04/01)
そもそも「しかる」という字は、「シツ」という音からも分かるように、叱Bつまり「口へんに七」が本来の形とされています。これに対し「叱A」のほうは、諸橋大漢和などを見ると、読みは「カ」で、「口を開くさま」を意味する、とあります。「しかる」とは全く別の字ということですが、「叱A」が実際に「口を開くさま」の意味で使われることはなく、もっぱら「しかる」の意味で、「叱B」よりもむしろ多く使われてきました。
そこで国語審は「表外漢字字体表」の印刷標準字体の欄には「叱B」を示したうえで、「叱A」も「字体の差として考えなくてよいデザイン差」と位置づけました。どちらを使っても構わない、ということにしたわけです。(変換候補につく「デザイン差」という注記が、その意味です)
問題は、JIS漢字への反映でした。
従来のJIS漢字では、第1水準の1-28-24というコードに「叱」がありました。規格票に示された例示字体は「叱A」になっていましたが、規格としては「叱A」と「叱B」を区別せず、このコードに「叱B」を割り当ててもかまわないことが明記されていました。(小さな字体差を区別せずに同じコードで運用することを「包摂」と呼びます)
このような場合、JIS漢字にもともとあった字を「叱A」から「叱B」に変更すればよいはずでした。もともと区別しないのですから、例示字体がどちらの形であっても規格の実質は変わらないわけです。実際、04年改正で例示字体が変更された「葛」など168字は、そうした理屈によるものでした。しかし、「叱」を含む10字については、そうはいきませんでした。
現在のパソコンの内部処理で使われている文字コードは、実はJIS漢字そのものではなく、国際文字コードの「Unicode(ユニコード)」です。これはおおざっぱにいうと世界中の文字をコンピューター上で扱うために作られた文字コードで、各国の文字コードを集めて並べ直したものがベースになっています。上述の三つのJIS漢字は、コンピューター上ではいずれもUnicodeのサブセット(部分集合)として機能しており、両者の間で安定したコード変換が行われる必要があります。
このUnicodeには、当初「叱A」しか無かったのですが、途中で漢字を大幅に拡張した際に「叱B」が別個に追加されていました(表外漢字字体表答申と同じ頃でした)。追加された「叱B」を出せるフォントはまだあまり出回っていませんでしたが、規格としては後戻りできません。Unicodeが「叱A」と「叱B」を明確に区別することにした以上、もしJIS漢字の例示字体を「叱A」から「叱B」に変えてしまうと、JIS漢字とUnicodeとの対応にねじれが生じ、問題が出るおそれがありました。そこでJISとしては、字体変更ではなく、「叱B」を第1水準から分離・独立させて、第3水準に追加することにしました。
パソコンに標準装備される日本語フォントや仮名漢字変換は、Unicodeの文字すべてを相手にしているわけではなく、JIS漢字に入っているかどうかがひとつの基準になっています。
こうした経緯のもと、「JIS2004」をサポートした新しいマシンでは、「似たものどうし」の2種類の「叱」が変換候補に出てくるようになったのです。
(つづく)
(比留間直和)