スクリーンショット_2019-02-06_13

一文字都道府県

いや、なんかこれ、昨年中に上げておこうと思ったんだけど。なんか、年末進行に年度末進行が被ってしっちゃかめっちゃか……このクソ忙しいのに遊んでいる場合じゃないって言われちゃったよ。いや、ホント。う〜ん……。

さて、だいぶ時間が空いてタイムリーさはなくなったんだけど、まぁ、別にいいよね? 気を取り直して、インチキ漢字……じゃなかった一文字都道府県で、前回の続きです。

まぁこのように一文字でもスペースを稼ごうとこう人がチマチマ苦労して作業しているところを、まるで真横で、さもあざ笑うかのように、やらかしてくれちまいましたよ、本当に、光の速度でかっさらっていきましたからねコレが、もう、何故人の話を聞かないっ! そこまで勝手にするんだったら投票にする必要ないでしょ? いつの時代のどこの独裁者ですか!……

え、何の話かって? 言わずと知れた、高輪ゲートウェイですよ、高輪ゲートウェイ。こいつが無駄に8文字もとるおかげで山手線の駅名が絡む場所の表組みは全てやり直し、高田馬場だって多いのにそれに輪をかけスペース倍増ですよ。ほんと、とんだ大惨事だ。おいちゃんたちが全ての都道府県を1文字にしようとがんばってきたのが台無しじゃないですか。こっちで幾ら倹約しても、電気付けっぱなし、水道流しっぱなし、おまけにガスは炊き放題。コンロはストーブじゃありませんよ! だいたい、何で和を意識した駅舎から名前がゲートウェイになるのか、そこは門でいいやん。大門があるんだから高輪門、実際にも江戸の朱引きの南限なんだから由緒正しい高輪門。ゲートウェイって何ですか? おいちゃん高卒なんでサッパリわかりませんよ。もう、池袋ウエストゲートパークなみの頭の悪そうなネーミング。それとも大きな声では言えませんが裏のグローバルゲートウェイ品川にネーミングライツ的にお金貰ってたりしちゃったりしてる? 1回そんなことを許したら目黒雅叙園前とか高田馬場ビックボックスなんて駅が次から次にできるようになって、もうほんと大災害なんですよ。関係者に時刻表の本作る係の人が一人でもいればこんないたましい出来事には、え? 時刻表の本? そんなもん今どき外注だよって……はぁ、そうですかぁ……。


それも、ともかく。前回の続き。適当に作った嘘漢字が、ほんとうは存在しているかもしれない……っていう疑問が発生したらどうするって話。表示出来ているかどうかはブラウザ次第だが、なにしろ「騼」「覕」とか「𣮮」「𡘏」みたいな字までコード化されているので大抵のものはとっくに登録済み……って考えるほうが精神衛生上はいいよね。よくある話で、誰も思いつかないような大発見をしちゃったよ的に大喜びしていたら、いやぁ〜、それ、百年前からあるから的なあるある。非常に小っ恥ずかしいコトになるパターン。車輪を再発明しない為にも日常から、洗面嗽、恥ずかしさで開き直って変な病気にかかってからでは遅いんですよ! まぁ、というわけで、解決編。コナン君の登場……じゃあなくて前回チラリと話の中に混ぜ込んだ「glyphwiki」の登場と、こうなるわけです。

GlyphWikiは明朝体の漢字に特化したウィキでグリフの管理・登録・共有が可能。2010年の時点ですでに53万レコードを誇り、現時点では、え〜っと58万を超える……うん、まぁ、ちょっと頭がおかしくなりそうな量だな。検索は手書きでも可能なので、う〜ん、そうだなぁ、まぁちょっと具体的に動かしてみようか。

画像

前回の冒頭で作ったこの3文字、まずこれをチェックしてみよう。

真ん中の文字はわりとすんなり見つかる。涷(6db7)凍の異体字という扱いだ。まぁ、ありそうだもんね。左右は厄介そうだが、まず左、検索窓のところにu2ff1-u53b6ってしてあげると頭に厶が乗っかっているグリフを探しに行く、これは漢字構造記述という方法で、(⿱厶)ってかき方で全角を上下に割った上の部分に厶が入ってますよというかきかただ。ブラウザ上で見えているかはともかくね。なので、次のカギ括弧の中の文字「⿰⿱⿲⿳⿴⿵⿶⿷⿸⿹⿺」見えてる? 点線で出来ている文字が見えたら正解。この文字の点線の枠に何の文字が入るのかという漢字構成記述文字を利用した記述方式。構造記述は入れ子にできるので上の右の文字、江戸川は(⿰氵⿸戸巛)若しくは(⿰氵⿱一⿸尸巛)って感じになる。結果は2勝1敗……いやいや、勝ち負けじゃないよね? 勝利の暁にはこのコーディックに文字を刻むことが許されるって感じ、漢字だけに……って、いや、なんでもありません。

さて、それで例の全国都道府県を一文字にしたよ〜っていう大学生の件、前回の話の続きだけれど……ってこれ1文字づつ確認するの面倒くさいな……結果は……う〜ん、微妙な惜敗率。……まぁ、長くなるので検証過程はすっ飛ばすけど結論から言えば、残念なお知らせです。一文字都道府県にはすでに先行研究が存在していました。まぁ、そ〜だよなぁ。出典のリンク先が消滅しているで内容不明。Wayback Machineしたら個人blogからのようなので……どのぐらいのレベルで利用されたものだったのか、どのていどの訴求率かもよくわからない……。まぁでも、そういうことなら、心置きなくいろいろと……って、なんか悪い顔になっているよ。いや、ホント。

さて、世の中にはきとくな人がいるもので、今回の件で早速グリフウィキの中にグループページもできている。

なので、これを知っていればいちいち確認しにいかなくても良かったのでは、う〜ん、そうだよね。では、このページの上から順番にっ……………………あ〜、これ、あ、そうかぁ〜…………字形差の話しなきゃ駄目。う〜ん、ここから始めるとまた長くなりそうだなぁ……いやぁ〜、女に乳首で母が毎の……いや、この先もかぁ…これは、いきなり面倒くさいぞ、ここは見なかったことにしたい。駄目? うん、まあ、そのうちなんかでするかも……。興味がでてきたら漢字字形差とか字体と字形の違いとかで検索してください。面倒くさい一端が判るからって…う〜ん、どうしよう、まぁ、ともかく、結論から先に進めると、すでにUnicodeでコード化されているもの…まぁブラウザで表示できるものが「𥐣、𨱢、鵈、槝、崗、嬡」6つ。字形をある程度無視すれば、16〜7文字から20字以上がsousaku-で始まる創作漢字のグループと被るんだけど……そこは、まぁいいや、五割当たれば御の字だ。上等じゃない。まぁとりあえずコード化されているものがあるのなら、字形をそれに割り振って……っていうふうにすると思うよね?

しかし、なんだろうね、ココまでの話を卓袱台返して申し訳ないのだが、今回の場合ぶっちゃけコードとかそういうのは、ほんとうはどうでも良い。え〜なんでぇ〜って、まぁなるよね。おいちゃんGlyphWikiの話したいだけやったんかい! って、まぁ半分はあるかもしれないけど、実際にアル角ウッカってコトとは…やばい、変なしゃっくりが出た。


あ〜、もう、なんのはなしをしようか…っていうのが、しゃっくりでみんなとんじゃったじゃない。うん、ちょっと面倒くさい話をしようとすると直ぐコレだ。まぁ、いい、ちょっと思い出しながら…そもそも論として、なんで共通コードが必要かって考える。つまりお互い遠くにいる白山羊さんと黒山羊さんとのあいだで共通にやりとりするための仕組みで白山羊さんが手紙をパッケージして黒山羊さんに贈ったときにそのパッケージを開いたとき黒山羊さんがちゃんと手紙だって認識できるようするための仕組み。それがないと手紙が食品だって認識されて肝心の内容が届かない、いや、胃の中に届いたって役に立たないんですから…で、そのためにこれこれこういうやりとりにしてあるものは紙だけど食べ物じゃありませんよっていうお約束をって……う〜ん、かえって判りにくくなったか……さっきまで、いい言い方おもいついていたんだけど……ん〜。なんだろう、そういえば去年noteで熟成下書きってお題で募集ってしてたけど、もうこっちは本文自体が下書きだからね。ろくに校正していないって言う感じだと、熟成はしていないな……って駄目じゃん。もう、なにをはなそうとしていたのかがさっぱりだ。しばらく思い出せないかも……。


そういうわけなので、まぁ、いろいろすっとばして、今回の場合だったら愛媛県を意味する文字「嬡」はコードポイントがUnicodeの5b21にある文字とグリフが被っている、もちろん「嬡」の文字に愛媛県の意味はない手持ちの安い漢和辞典だと訓読みすらないなぁ、娘? あぁ、まあ愛姫かぁ、あってるようなきもしてきたけどまぁ、それはともかく、そんなこといいだしたら、米英独仏蘭といった文字にだってもともとそんな意味はない。広いグリフセットの中で勝手にそうなっているだけだから。ん〜、まあなんでRiceがAmericaなのかは説明付けづらいよね、しかし、その広いグリフセット。その広いグリフセットの中で米はアメリカ以外にもお米の米やぺーぺーの意味での新米社員とか米沢、米倉といった地名、人名と日本語の文字の中では他のグリフと組み合わせて多岐多用に使用されるんだけど、今回の場合その組み合わせるグリフセットが用意できていない。

まぁ、ようはなんとな〜く漢字に見えるだけで、実は文字としての役割はなく、どちらかといえばアイコンとかピクトグラムに近い。漢字文化圏限定ピクトグラム。つまり、絵文字に使うフォントを作りましたよっていうスタンス。絵文字に各県地域を意味するコードポイントがあれば(ないけど)コード化の意味からも、そちらと同じコードをふるべきなんだろう……しかし、各国の言語や絵文字まで含めると字体字形差の議論っていうのはこう……ぁ、この話はしないことにしたんだっけ、まぁ、ともかく、そんなこんなで、Unicodeも字だけでなく絵文字にまでコード振り出して、そのうち目に映るモノは全てコード化するとか言いかねない勢いだけど……そっちもともかく、それで、このことが広く認識されるようになって、どうしても一文字都道府県のコード化が必要だっていう一般認識にまで至れば、そのときにあらためて符号化の方法を提案すれば良いんじゃないかと思う……んだよね……なんでも、かんでも、目に映るもの全てをコード化すればいいってもんじゃ無いと思うんだけどね。いや、全てを符号化しようなんていう厨二的野望も、わからなくはないんですけどね……。


じゃあ、まぁ、具体的にどういう工程で、っていうと実作業に即してみてみよう。と、いうわけで、今回はオリジナルに敬意を表してなるべく提唱者のスタイルに即して……って思ってもいたんだけど、先行研究があると知れれば遠慮はいらない。とは、いっても下のように、之を辶に辶を氵に北を突いた方がいいのか離したほうがいいのか母なのか海なのかっていうもうこういうのを全部で説明していくと切りが無いのと、まぁ個人的好みで、まぁ理由はそれぞれあるんだが…どうしてこうなったってなったりするので……。っていうか、まぁ、……そういう感じ? いや、ほんと、酷い。もう作った人には見せられないな。というわけで、完成したタイトルのフォントは多少自分の好みでオリジナルとは微妙に違っているんだけど、まぁいいよね?

ともかく、そんなこんなで、検討過程で色々作ったのも、とりあえずは全部グリフ化しておく方向です、ってするとするとどうするかというと、下の図の下のように名前をつけておく。

画像

画像

名前は、まぁようは判ればなんでもいい、ただ内部的に予約されている名前とかぶると問題が出るってくらい。なので頭のアンダーバーはおまじない。_hokkaido(北海道)のドット以下の拡張子は、これも区別可能なら何でもいいんだけど、要は異体字として登録するための準備、Glyphsだったら拡張子を決めておけば自動でプログラムを出力してくれたんだけど、FontLabはそこまで面倒見はよくない。まぁそれもともかく、それでcvはキャラクターバリエーションの略だと思って貰えれば、っていうかそうなんだけど。で、これをフォントのプログラム、OpentypeFutureでcv01とcv02をそれぞれ

feature cv01 {
 sub _hokkaido by _hokkaido.cv01;
};
feature cv02 {
 sub _hokkaido by _hokkaido.cv02;
};

って感じ記述しておく。するともうこれで北海道の異体字ってことになる。異体字については、前にも話したと思うので説明省くけど、まぁこんな感じで。

それで、これだけでもいいのだけれど、これだと取り出し方に難がある。一応樽は用意したけどタップに繋がっていないビールみたいなものだ。こいつを淀みなく出力できるようにするための仕組みを、OpentypeFutureで記述すると……たとえば具体的には愛媛と打ったら嬡が、長野って打つと𨱢が出てくるという仕組み、こうしておくといちいち字形のウインドウを引っ張り出して文字をさがす必要がなくなる。まぁ感のいい人は判ったと思うけど、そうリガチャー(合字)ってやつだ。愛媛の例でいえば、

feature liga {
 sub uni611B uni5A9B by _ehime;
};

これで、愛(611b)媛(5a9b)と打ったら勝手に嬡になる。まぁただ、このままだと実はエラーが出る。このフォントに愛がない……じゃなかった、なんか嫌な言い方だな、つまり、愛と媛のグリフ。コード番号uni611Bとuni5A9Bの文字が存在しないからだ、空でいいので箱だけ作っておこう。プログラムを走らせるとエラーメッセージが出てFontLabが、ないグリフを作るかって聞いてくるからOK押してもいいし、後の文字のことも考えると常用漢字分だけでも空箱を一気に用意しておけば……まぁ、多分大丈夫…だと思う。後は都道府県分これを延々とやっていけばいいので……うん、まぁ、そうだな……こういうときのためのスクリプトパネルなんだけど……その辺りの手抜き方はまた後でかんがえるか……。で、気がついた人もいると思うけどGlyphsの場合はFontLabで判ればなんでもいいで_ehimeって名前付けしたところをちゃんとuni611B_uni5A9B.liga(愛(611b)媛(5A9B)の合字)ってしておくだけで、これでもう自動でOpentypeFutureのプログラムつくってくれるので簡単、もっともFontLabでもちゃんと探せばスクリプトくらいでてくると思うんだけど……う〜ん、まぁ、そうだよなぁ。ちょっとそれをやってるとまた終わらなそうだな……。

まぁ、とにかく、こういうふうにしてOTFで出力して出来上がり、まぁまぁこんな感じ。ついでなので高輪ゲートウェイ記念! 一文字山手線駅名フォントも追加する……あ、いや、仕事に戻りますって、ホント。


いいなと思ったら応援しよう!

コメント

コメントするには、 ログイン または 会員登録 をお願いします。
一文字都道府県|hide
word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word

mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1