ページ内ジャンプ:

アレゲなニュースと雑談サイト

サイト一時停止のお知らせ:2011年8月30日 14:00から17:00の間、システムアップデートのためslashdot.jpの全サービスを一時停止いたします。アップデートに関する詳細はこちら

yasuoka の日記から検索

yasuoka (21275)

yasuoka
(メールアドレス非表示)
http://kanji.zin ... oka/index-j.html
2011 年 08 月 29 日
PM 10:30
数学

Moving Sofa Problemに関して、妙な妄想が湧いてしまったので、とりあえずここに記しておくことにする。端的には、Hammersley型の真ん中の削り取る部分を、直径4/πの正円ではなく、長径√2・短径2-√2の楕円にしてしまおう、という考え方である。楕円の中心を原点とした時の媒介変数表示(-π/2≦θ≦π/2)は、以下のとおり。

  • x=√2(sinθ)/2
  • y=(1-√2/2)cosθ

当然、外側の削れている部分も正円というわけにはいかないので、第1象限の外枠(0≦θ≦π/2)は以下のようにする。

  • x=√2(sinθ)/2+sin(θ/2+π/4)
  • y=(1-√2/2)cosθ+cos(θ/2+π/4)

第2象限の外枠(-π/2≦θ≦0)も同様に以下のとおり。

  • x=√2(sinθ)/2+sin(θ/2-π/4)
  • y=(1-√2/2)cosθ+cos(θ/2-π/4)

もちろん、|x|≦√2/2において、外枠はy=1とする。また、√2/2≦|x|≦1+√2/2において、内枠はy=0とする。こうすると、問題のソファーの面積は、ざっと2√2-π(√2-1)/4≒2.5031くらいになってしまう。かなりでかい。

ただ、こんな簡単な解が、これまでに見つからなかったはずはないので、きっとこのソファーは曲がりきれないのだと思う。でも、何となく大丈夫そうなのだけど、どこで勘違いしてるんだろ?

2011 年 08 月 25 日
AM 10:13
携帯電話

電話機の右下にある「#」は「NUMBER SIGN」なのか「MUSIC SHARP SIGN」なのか、という質問をもらった。歴史的に見れば、もちろん「NUMBER SIGN」だ。ただ、それを言うなら、左下の「⚹」は、どう見ても「SEXTILE」に見えるが、歴史的には「ASTERISK」ということになる。少し歴史を紐解いてみよう。

1961年にAT&TがTouch-Toneを実験しはじめた際には、電話のボタンは10個しかなかった(『Bell Laboratories Record』1961年9月号pp.312-316)。これにボタンを2つ追加するにあたり、Bell Telephone Laboratoriesは、とりあえず「☆」と「◇」を割り当てた。しかし、電話をコンピュータの端末として用いるのなら、これらはASCIIから選んだ方がよいのではないか、という議論となり、「☆」と「◇」に比較的類似した「⚹」と「#」になったわけである。非常に不幸なことに、彼らが参照したのは1965年版ASCIIのドラフトであり、そこでは2/10が「*」ではなく、90度回転した「⚹」で印刷されていた(『Communications of ACM』1965年4月号p.207)。この結果、電話機には「⚹」と「#」が、「ASTERISK」と「NUMBER SIGN」として搭載されることになったわけである。

ちなみに電電公社では、元々これら2つのボタンは、赤色の「●」と緑色の「◉」だった(『NEC日本電気技報』1970年7月号表紙)。電電公社は、遅くとも1971年7月には、AT&Tと同じ「⚹」と「#」にしているが、過去との互換性を考慮して、それぞれを赤色と緑色に塗りわけている。その意味では、日本の電話の「#」は、「シャープ」とか「いげた」ではなく、「緑色のボタン」とか「青いボタン」とか呼ぶのが、あるいは正しいのかもしれない。

2011 年 08 月 22 日
PM 11:36
お金

みずほ銀行のロゴを、ボーっと眺めていたところ、UとHの合字をどうすべきか気になりはじめた。もちろん現時点では、ISO/IEC 10646に「LATIN CAPITAL LIGATURE UH」のような文字は収録されていない。でも、新たな合字の収録ってのは、まあ皆んなイヤがるだろうし、商標登録第4613546号で保護されているロゴに使われている文字なんて、あぶなっかしくて文字コードになどできない。まあ、現状は無理せず、ほっといた方がいいかな。

2011 年 08 月 19 日
PM 02:38
法廷

「H2.10.20法務省民二第5200号通達に対抗するには」を読んだ方から、「戸籍地を管轄する家庭裁判所」と「戸籍を担当する役所/役場の住所地を管轄する家庭裁判所」はどう違うのか、という質問をもらった。まあ、たいていは同じ家庭裁判所なのだが、これが違う場合もあるのだ。

たとえば、兵庫県朝来郡生野町に本籍がある場合、「戸籍地を管轄する家庭裁判所」は現時点では神戸家裁姫路支部だ。これに対し、生野町の戸籍は、2005年4月の合併により、現在は朝来市役所が担当している。朝来市役所は和田山町にあるので、「戸籍を担当する役所/役場の住所地を管轄する家庭裁判所」は神戸家裁豊岡支部だ。つまり、町村合併によって戸籍を担当する役所/役場の場所が変わったにもかかわらず、家庭裁判所の管轄が変更されていない場合には、こういうヤヤコシイことになってしまうわけだ。なお、朝来市生野町に本籍があっても、現時点では、やはり同じことになり、別々の家庭裁判所が管轄するケースとなる。

一方、長野県木曾郡山口村に本籍がある場合は、現在の「戸籍地を管轄する家庭裁判所」は岐阜家裁多治見支部(中津川出張所)となっており、中津川市役所と同じ管轄になっていて、特に問題がない。あるいは、北海道択捉郡留別村に本籍を置いている場合は、「戸籍地を管轄する家庭裁判所」は釧路家裁根室支部なので、根室市役所と同じ管轄だったりする。ちなみに、樺太に本籍がある場合は東京家裁が管轄なのだが、そもそも戸籍謄本を手に入れるのが難しいし、「H2.10.20法務省民二第5200号通達」にひっかかる可能性は極めて低いと思う。

2011 年 08 月 17 日
PM 10:40
法廷

Yahoo!知恵袋のこの質問での私(安岡孝一)の回答を読んだ方から、「該当の字」が掲載されている漢和辞典が見つからなかったらどうすればいいのか、という趣旨の質問をいただいた。問題を少し整理してみよう。

H2.10.20法務省民二第5200号通達に基づき、戸籍の氏における「該当の字」が「正字」に変えられてしまった場合、対抗する手段は大きく3つある。1つは「該当の字」が掲載された漢和辞典を見つけて、戸籍を担当する市役所(区役所・町役場・村役場)に持ち込む方法。もう1つは、戸籍地を管轄する家庭裁判所に、戸籍訂正を申し立てる方法。最後の1つは、戸籍を担当する役所/役場の住所地を管轄する家庭裁判所に、市町村長の処分に対する不服申立をおこなう方法。最初の方法については、ここに詳しく書いておいたので、残る2つの方法について説明しよう。

2つ目の方法は、役所/役場から「該当の字」の変更について、変更時点での連絡がなかった(あるいは連絡を受け取らなかった)場合におこなうもので、その変更は無効だから元に戻してほしい、と、家庭裁判所に戸籍訂正を申し立てることになる。判例としては、鹿児島家裁知覧支部平成19年(家)第175号[H19.7.19審判]くらいしか私自身は知らないのだが、基本的には、役所/役場の手続ミスを突くことになるはずだ。

3つ目の方法は、役所/役場から「該当の字」の変更について連絡があった場合に、それに対する不服を家庭裁判所に申し立てるものだ。ただ、単純に不服を申し立ててもあまりうまくいかないので、戦略としては、高校の卒業証書(あるいは大学の学位記など)に書かれた「該当の字」を戸籍上で勝手に変更されると、今後、学歴を証明する必要が生じるたびに改製原戸籍や除籍謄本を合わせて示さねばならず、はなはだ不都合だ、というあたりが一案だ。

しかしながら、2つ目と3つ目の方法は、いずれも家庭裁判所の審判をあおがねばならず、裁判官の心証に左右されることは言うまでもない。できれば最初の方法が、確実で最も早いのだが、そういう漢和辞典を探すのは、やっぱり大変かなぁ…。

2011 年 08 月 11 日
PM 10:09
アメリカ合衆国

松田裕之の『モールス電信士のアメリカ史』(日本経済評論社、2011年4月)を読んだ。私(安岡孝一)の専門分野と近いこともあって、結構たのしく読めたのだが、『文字符号の歴史 欧米と日本編』を引用しそこなっている個所がいくつかあって、そのあたりが気になった。たとえば、Alfred Vailがモールス符号を設計するくだり。

――さて、どの文字がすり減っているかな
ヴェイルは職人の活字箱を調べることで、文字の使用頻度を入念に確認した。活字の摩耗度からそれが判明するからだ。この調査をもとに、彼は文字と符号の組み合わせを決定する。すなわち、最も活字の摩耗度が激しい「E」には《・》、次に激しい「T」には《-》、その次に激しい「A」には《・-》というように、頻出度の高い文字ほど簡潔な符号で表した。(p.19)

Alfred Vailは、印刷所の活字箱の活字数と、活字の発注数は調査したが、活字の摩耗度をチェックしたという記録はない。というか、摩耗した活字はどんどん再発注されるので、活字の摩耗度など調べてもあまり意味がなく、各文字ごとの活字の発注数を調査すべきということになるのだ。しかも、p.25の図1-5で「オリジナル・モールス符号」と「コンチネンタル・モールス符号」が逆になってしまっているため、正直わけがわからなくなってしまっている。

一九一九年、印刷電信機メーカーのモーグラム社(一九〇七年にジョイ・モートンとチャールズ・グラムが創立)は、送受信機を一体化した《テレタイプ》を開発する。(p.224)

『キーボード配列 QWERTYの謎』にも書いたが、Joy MortonとCharles Lyon Krumが1907年10月5日に設立したのは、Morkrum(モークラム)だ。モーグラムじゃない。

『モールス電信士のアメリカ史』は、全体としてのストーリーは面白かったのだが、こういうアラが目に付きだすと、どうしても他の部分(私の専門分野以外の部分)にも問題があるのではないか、と思えてきてしまうのだ。もう少し細かいところにまで、気を配って書いてくれるといいのだが。

2011 年 08 月 07 日
PM 09:11
バイオテック

木村康の『血痕鑑定』(中公新書654、1982年6月)を読んでいたところ、ABO血液型に関して、おかしなことが書かれているのを見つけた(pp.78-80)。

ABO式血液型は一九〇一年、カール・ランドシュタイナー(Karl Landsteiner)によって 発見された。…ランドシュタイナーが発見した当初は三つの型があると報告され、A型、B型、C型と命名されていた。C型は現在のO型に相当しているので、ランドシュタイナーはAB型のあることを見逃していたわけである。…一九一〇年のフォン・デュンゲルン(Von Dungern)とヒルツフェルト(Hirszfeld)の報告は、…カール・ランドシュタイナーの命名したA、Bはそのまま使用し、CをO、もう一つの型をABと命名するとともに、A型の血球を凝集する凝集素をα(抗A)、B型の血球を凝集する凝集素をβ(抗B)として、血球に存在する凝集原A、B(抗原)のみならず、血漿あるいは血清中に存在する凝集素(抗体)をも命名している。ランドシュタイナーの命名したCをOとしたのは、この血球にはA凝集原もB凝集原もないからゼロの意味でOとしたのであり、また新たに加えたABグループはA凝集原もB凝集原も両方ともある血球だからABとしたという筋の通った命名であった。当時の国際連盟は、混乱をさけるために一九二七年に開催された第三回血清標準委員会において、このフォン・デュンゲルン、ヒルツフェルトの命名を採用して、人の血清中に先天的に存在する自然抗体の抗Aをα、抗Bをβと呼ぶことも決定したのである。

「O型はゼロ型なのか」にも書いたのだが、Emil Freiherr von DungernとLudwik Hirszfeldが1910年から1911年にかけて発表した一連の論文では、O型に関して「大文字のO」と「小文字のo」が使い分けられており、「数字の0」がもとになったとは考えにくい。AB型についても当初は「A und B」と呼んでおり、あくまで遺伝形質として「A」と「B」の両方を親に持つという意味である。また、「国際連盟における血液型の標準化」にも書いたが、国際連盟の「血清標準委員会」が1927年に会議を開いた記録はない。国際連盟のCommission permanente de standardisation des sérums, réactions sérologiques et produits biologiquesが、ヒトの血液型をO, A, B, ABで表記する決定をしたのは、1928年4月のことである。

ただ、ABO血液型に関するこれらのガセネタは、いまだあちこちで広められていて、なかなか無くならないようだ。さて、どうしたものか…。

2011 年 08 月 03 日
PM 04:22
アップル

現時点でのAppleカラー絵文字フォントは、フォーマット上はttfでありながら、「glyf」テーブルに絵文字を含んでおらず、代わりにアヤシゲな「sbix」というテーブルを含んでいる。この「sbix」のフォーマットは、今のところ公開されてないみたいなので、私(安岡孝一)の推測をここにメモっておく。

  • ULONG version (たぶんsbixのバージョン、現状では0x00010001)
  • ULONG numImageTables (画像テーブルの個数)
  • ULONG OffsetTable[numImageTables] (各画像テーブルへのオフセット)

各画像テーブルは、以下のようなフォーマットになっているようだ。

  • USHORT height (画像の高さ(ピクセル数))
  • USHORT DPI (現状では0x0048すなわち72dpi)
  • ULONG ImageOffset[numGlyphs+1] (各画像データへのオフセット)
  • VARIABLE imagedata

numGlyphsは「maxp」テーブルから取ってくることになる。画像の幅は書かれておらず、正方形の画像しか許されていないのか、それとも画像を出力する時にデータ内から「見切る」のか、正直なところ謎だ。また、各画像データの長さも書かれていないので、直後のImageOffsetとの差で求めることになる。ちなみに、現状の各imagedataは、最初の4バイトが0x00000000、次の4バイトが「0x706e6720」(png )で、その直後からPNG画像そのものが入っている。

なお、「cmap」テーブルや「morx」テーブルに関しては従来どおりなので、UnicodeからglyphIDへの変換や、リガチャのglyphIDへの変換は、従来のプログラムが使える。ただ、こんな「sbix」なんていう新しいテーブルを作るくらいなら、なぜ従来の「EBLC」テーブルのcolorRefを拡張する方向で設計しなかったのか、返す返すも残念と言わざるを得ない。

2011 年 07 月 28 日
PM 08:25
日本

宮武外骨の『奇態流行史』(半狂堂、大正11年7月)を読んでいたところ、「讀めない字の本名」(p.96)の以下の部分が気になった。

果は康煕字典や玉篇などから、人々の讀めない字を撰り出し、それを我子の名に付けて、お父さんは學者であつたらしいと、後の人にも評されやうといふツモリで、普通の字引にも活字にもない難字を用ゐる事がはやり、それが明治三十年前後には最も甚だしく行はれた

「奛」「𡺯」「宲」「賰」「晥」「𨬑」「𢤄」「箎」「𠠢」「亝」「孞」「釓」

上記の讀みにくい字の表は、最近の『職員録』中に見えた判任官の本名を拔記したのが多い

これは面白い、と思って、さっそく大正10年7月1日現在の『職員録』(印刷局、大正10年12月)をチェックしてみた。難字のキラキラネームがズラッと並んでいるのを期待したのだ。

しかし残念ながら、全くの期待はずれで、『職員録』は難字どころか普通の字ばかりだった。しかも、↑の12字中、陸軍技術本部に砲兵一等銃工長の「二橋賰治」と、靜岡地方裁判所濱松區裁判所の書記に「速水釓太郎」の二人は見つかったものの、他の10字は見当たらなかった。外骨に担がれた、ということだろう。

もちろん、私(安岡孝一)の見落としということも、十分ありえる。他の10字を含む明治時代の人名をご存知の方は、是非、私まで教えてほしい。

2011 年 07 月 27 日
PM 01:28
書籍

Yahoo知恵袋のこの質問が気になったので、とりあえず『赤ちゃんのしあわせ名づけ』(ベネッセ、2011年2月)をチェックしてみた。「龍」はもちろん掲載されているのだが、左上の第1画が「丨」だった。人名用漢字の「龍」は左上の第1画が「一」なので、『赤ちゃんのしあわせ名づけ』は、微妙に異なる字体を子供の名づけに推奨しているわけだ。

では、他の本はどうだろう、と、『赤ちゃんの幸せ名づけ事典』(ナツメ社、2011年2月)、『未来にはばたく赤ちゃんの名づけ事典』(永岡書店、2011年3月)、『幸せを呼ぶ赤ちゃんの名づけ大事典』(成美堂出版、2011年6月)もチェックしてみたが、どれもこれも、ことごとく「龍」の第1画は「丨」だった。「辻」はちゃんと2点しんにょうになっているのに、どうして「龍」はちゃんと印刷しないんだろう?