JIS X 0208の幽霊漢字についてTwitterで興味深いツイートを見ました。
朝日新聞デジタルの記事で、JIS X 0208の出所不明の幽霊漢字「彁」らしく見える文字が大正12年の印刷物に見えたという話です。
内容について詳しくは記事(2011/09/05付)そのものを読んでいただければ良いのですが、備忘として概要をかいつまんで紹介しておきたいと思います。
JIS X 0208の幽霊漢字とは
JIS漢字コード規格JIS X 0208にはいくつか出所不明の漢字が含まれていて幽霊文字と俗に呼ばれています。拙著『プログラマのための文字コード技術入門』第3章にも説明しているので詳細は省きます。中でも55区27点の「彁」は手がかりがまるで存在しないものとして知られています。
新聞社の記事データベースでヒットした
この記事によると、朝日新聞社の記事データベースでキーワードに「彁」を含む記事がヒットしたということです。1923 (大正12)年2月23日付の朝日新聞朝刊に「埼玉自彁会」として入っていたとのこと。
リンク先には画像も掲載されています。文字がだいぶかすれていますがなるほどそのように見えます。
「彊」の誤認か
この記事で推測されているところでは、「自彊会」という言葉の「彊」の字がかすれて、データベースへの入力の際に「彁」として入力したのではないかということです。同じ記事のより良い状態の復刻版紙面を確認したところ、「彊」と読み取れたということです。画像を見ると確かに「自彊會」と見えます。
さらに記事では、JIS X 0208に「彁」が入ったのも同じ字のかすれたものを誤認したのが理由かもしれないという、ご存じ笹原宏之先生の推測を紹介しています。また、今後も同じ誤りが生じるかもしれないという懸念も示され、疑問があれば、もとの紙資料に立ち戻るべしとしています。
JISに入った理由が同じかどうかは決定的な証拠があるわけではなく推測の域を出ませんが、なかなか本当らしい説だと思えます。
(もし間違えることが多いならいっそのこと「彁」を「彊」の略体として採用するとなかなか愉快なのでは......とちょっと思いました。冗談ですよ!)
コメントする