[リストへもどる]
一括表示
タイトル方針の維持を主張したのは、私だけではありません
記事No5382
投稿日: 2012/10/28(Sun) 22:59:40
投稿者土屋
No.5288で、富田倫生氏はこう発言しています。

> 後に、これに反対する人があらわれる中で、足かけ5年あまりに渡って論議しました。
> その際、方針の維持を主張したのは、私だけではありません。

富田氏が田部井氏の提案を拒否する理由は、富田ルールに賛成する人がほかにいるからである。
田部井氏に同調する人が何人いようと、富田ルールに賛成する人がいる限り、富田ルールを固持し続ける、というのが富田氏の理屈です。

つまり、富田ルールに賛成する人、一人一人が、田部井氏を拒否している、ということです。
そうした方々には、説明責任をはたしていただきたいと思います。

と言ったところで出てきてはもらえないでしょうから、過去に
・富田ルールに賛成された方
・現状維持に賛成された方
・私や鈴木さんに批判的な立場から発言された方

の名前と発言内容を全面公開することで、それに替えます。

タイトル戸坂潤「読書法」校正
記事No5391
投稿日: 2012/11/03(Sat) 08:16:18
投稿者土屋
送信:2006年12月ごろ
--------
 『ラモオの甥』の方は →【行頭の空白を削除。底本では字下げしているが、他の箇所に合わせる。】

 工作員マニュアルで:

一部の書籍では、新しい段落の始まりに括弧(「「」、「(」など)がくる際、1字または半字下げてある場合があります。(右の例では、1字下げてあります。)こうした場合にも、下のように、スペースは入れずに入力してください。

としている件。
 富田さんは、たしか「こもれび」かどこかの掲示板で「基準はなく、編集者の判断でしていることだから〜」というようなことをおしゃっていたと思います(過去ログがみつかりませんでした)。
 しかし編集者の判断でしていることは、漢字の選択、送り仮名、ルビの有無、見出しの字下げなど多岐にわたっており、これだけ特別扱いする理由としては弱いのではないか、底本で下げているなら、その通り字下げして入力すればいいのでは、という考えも成り立つように思います。
「ケヶ」の件もそうですが、『「底本のできるだけ忠実な再現」を目標に置き、「勝手な編集はしない」』という原則に立ち返って、考えなおしてはいかがでしょうか。

タイトル戸坂潤「読書法」の公開用ファイル作成にあたってご報告
記事No5392
投稿日: 2012/11/03(Sat) 08:27:48
投稿者富田氏
これは、富田倫生氏から送られたメールを、土屋が転載しているものです。

送信:2007年1月ごろ
戸坂潤「読書法」の公開用ファイル作成にあたってご報告
--------
▼「ケヶ」の扱いについて
「コ・カ・ガ」等と読まれる片仮名のケに類似した文字に関しては、1997で、「ヶ」(5-86)を「仮名又は漢字に準じるもの」の仲間であることを示す措置がなされました。
本来ならここで「ヶ」(5-86)には、大小の字体が包摂されるといっておければ、「コ・カ・ガ」等と読まれる片仮名のケに類似した文字の0208における扱いには、何の疑問も生じなかったはずです。
ただ、これも非漢字という事情があったせいか、こうした包摂規準は示されませんでした。
そのために、「コ・カ・ガ」等と読まれる片仮名のケに類似した文字が底本で大きくつくられていた場合、形を優先して片仮名の「ケ」で入れて良いのか、それとも使用字脈から判断して「ヶ」で入れざるを得ないのか、疑問が生じます。

青空文庫では論議を重ねた上で、使用字脈によって、それが片仮名であるか、漢字に準じるものであるのかをまず判定し、それを規準に区点位置を決めた上で、規格上の穴になっている大小問題を、ファイル末の注記で補うという方針を選んだ、と理解しています。

▼行頭の括弧の処理

書籍における行頭の括弧の組み版処理には、以下の三パターンがみられます。

・天から半角あいているようにみえるもの。(全角括弧)
・天から全角あいているようにみえるもの。(全角あき+半角括弧、もしくは半角空き+全角括弧)
・天から全角+半角あいているようにみえるもの。(全角あき+全角括弧)

加えてごく稀に、以下のようなものも見られます。

・天付きにみえるもの。(半角括弧)

これらを全て、底本通り表現しようとすると、半角括弧の使用が避けられません。
また、「半角レベルのレイアウト調整は、テキストに反映する」ということなのか、
それとも「括弧の扱いに限って、半角レベルのあき調整を反映する」ということなのかも決めることになると思います。

行頭の括弧の扱いは、組み版の方針に依存するものであり、またこれを底本通り表現しようとすれば、使用しないと決めている「半角カタカナ」に属する半角の括弧を使用すると方針変更した上で、複数の組み合わせパターンの考えられる処理法(全角あき+半角括弧、もしくは半角空き+全角括弧)の中からおそらく一つを選んで、作業に当たられる方みなさんに実践してもらうことになります。

それはなかなか困難であろうと思われ、「半角カタカナ」に属するものを使用すれば、そこで文字化けを生じないよう、テキスト・ビュワー側にも対処してもらわなければならないと思います。

こうした事情がある中で、現行の方針を変更する、説得力のある筋立ては、なかなか難しい気がするのですが、いかがでしょうか?

タイトルRE: 戸坂潤「読書法」の公開用ファイル作成にあたってご報告
記事No5393
投稿日: 2012/11/03(Sat) 08:37:38
投稿者土屋
送信:2007/01/06
RE: 戸坂潤「読書法」の公開用ファイル作成にあたってご報告

▼「ケヶ」の扱いについて
>「コ・カ・ガ」等と読まれる片仮名のケに類似した文字に関しては、1997で、「ヶ」(5-86)を「仮名又は漢字に準じるもの」の仲間であることを示す措置がなされました。

そんな措置などされていないと思います。そうおっしゃるなら条文を示していただけませんか?
小書きの「ヶ」は本来漢字であるが、JIS X 0208の文字種(用字系)としてはカタカナとする、ということが1997であらためて確認された、と私は理解しています。

>本来ならここで「ヶ」(5-86)には、大小の字体が包摂されるといっておければ、「コ・カ・ガ」等と読まれる片仮名のケに類似した文字の0208における扱いには、何の疑問も生じなかったはずです。
>ただ、これも非漢字という事情があったせいか、こうした包摂規準は示されませんでした。

「ヶ」(5-86)に大小の字体が包摂されることは、絶対にありえません。
小書きカタカナ「ヶ」が大きかったら、それは「ケ」であって、それは(5-17)にすでに用意されています。

>そのために、「コ・カ・ガ」等と読まれる片仮名のケに類似した文字が底本で大きくつくられていた場合、形を優先して片仮名の「ケ」で入れて良いのか、それとも使用字脈から判断して「ヶ」で入れざるを得ないのか、疑問が生じます。

『使用字脈から判断して「ヶ」で入れざるを得ない』と考えるのが間違いだと思います。
JISの規定以前から、「一ヶ月」等の、「コ・カ・ガ」と読まれる「ケ」は大きく書かれることも、小さく書かれることもありました。これはたくさんある日本語の表記のゆれの一つにすぎません。

>青空文庫では論議を重ねた上で、使用字脈によって、それが片仮名であるか、漢字に準じるものであるのかをまず判定し、それを規準に区点位置を決めた上で、規格上の穴になっている大小問題を、ファイル末の注記で補うという方針を選んだ、と理解しています。

同じカタカナの文字種の中に大きな「ケ」と小さな「ヶ」があり、これらは字体で(ここでは文字の大小で)区別される、というのがJISの規定です。この基本は、97年の改定でも、またJIS X 0213でも変っていません。規格上の穴などありません。
不備(というか不親切)があるとすれば、(5-17)の用例に「一ケ月」等を示していないことぐらいでしょう。

>▼行頭の括弧の処理
>
>書籍における行頭の括弧の組み版処理には、以下の三パターンがみられます。
>
>・天から半角あいているようにみえるもの。(全角括弧)
>・天から全角あいているようにみえるもの。(全角あき+半角括弧、もしくは半角空き+全角括弧)
>・天から全角+半角あいているようにみえるもの。(全角あき+全角括弧)
>
>加えてごく稀に、以下のようなものも見られます。
>
>・天付きにみえるもの。(半角括弧)
>
>これらを全て、底本通り表現しようとすると、半角括弧の使用が避けられません。
>また、「半角レベルのレイアウト調整は、テキストに反映する」ということなのか、
>それとも「括弧の扱いに限って、半角レベルのあき調整を反映する」ということなのかも決めることになると思います。
>
>行頭の括弧の扱いは、組み版の方針に依存するものであり、またこれを底本通り表現しようとすれば、使用しないと決めている「半角カタカナ」に属する半角の括弧を使用すると方針変更した上で、複数の組み合わせパターンの考えられる処理法(全角あき+半角括弧、もしくは半角空き+全角括弧)の中からおそらく一つを選んで、作業に当たられる方みなさんに実践してもらうことになります。
>
>それはなかなか困難であろうと思われ、「半角カタカナ」に属するものを使用すれば、そこで文字化けを生じないよう、テキスト・ビュワー側にも対処してもらわなければならないと思います。
>
>こうした事情がある中で、現行の方針を変更する、説得力のある筋立ては、なかなか難しい気がするのですが、いかがでしょうか?

日本語文脈で半角文字を使わないという方針は妥当だと思います。であれば、あとは全角一字分を下げるか下げないかと二者択一の判断になりますが、そうなれば一目瞭然であって、なにも難しいことはないという気がするのですが、いかがでしょうか。

タイトル作業方針について
記事No5397
投稿日: 2012/11/07(Wed) 23:26:25
投稿者富田氏
これは、富田倫生氏から送られたメールを土屋が転載しているものです。

送信:2007/01/27
作業方針について

▼行頭の括弧の処理について

「底本の組み版を厳密になぞるために、半角括弧を用いることは行わない。」とした
上で、改行行頭の始め括弧が、

 ・天付きにみえるもの。
 ・天から半角あいているようにみえるもの。
は、全角一字分のあきを挟まないことにする。

 ・天から全角あいているようにみえるもの。
 ・天から全角+半角あいているようにみえるもの。
は、全角一字分のあきを挟むことにする。

と決めるのは、合意を得られやすい選択肢の一つだと思います。
テキスト・アーカイヴィングを0から始めるのであれば、そうすることに決まったと
しても、私には異論はありません。

ただ、ある程度の作業成果を積み上げてきた青空文庫で、作業方針を変更しようとす
る場合には、常に「すでに作ってしまったファイルの見直しと修正」の問題がついて
回ります。

当初の青空文庫のマニュアルには、行頭の括弧の処理に関する作業方針は、示してあ
りませんでした。
ある程度の作品公開が進んだ後で、底本の状態を必ずしも反映しない形で、あきが入
ったり入っていなかったりすることを知り、これに対する作業方針に関して、あらた
めて話し合うことになった時点で、私自身は、「あきなしで統一してしまうのが賢明
ではないか」と考えました。
たとえば注記形式の変更であれば、作業対象のファイルをチェックしながら直してい
くだけで、変更が可能です。
ところが、この問題については、底本にいちいちあたり直しての確認が求められます。

作業方針の変更、確定に伴う、公開済みファイルの見直し、修正作業に際しては、広
く作業協力を仰いで進める形をとったこともあります。
ただ、修正作業用の手引きを用意しても、仕上がりには大きなばらつきが生じ、改行
コードの扱い等々の、本来はなかった問題が新たに発生してしまうことも知りました

誤っていた点の作業者へのフィードバックと、再点検、再修正の手間を勘案して、大
規模な見直し、修正作業は結局、点検グループの数人で進めることになりました。
XHTMLスクリプトに対応するための形式変更作業は、もう、5年近く、ひっそりやっ
ていますが、片手間に進めざるを得ないという事情があり、まだ、済んでいません。
ルビ分割/まとめの見直しも、まだまだの状況です。

どうしてもやらなければならないならという判断があるなら、さかのぼっての見直し
、修正には、大変であっても取り組むべきでしょう。
ただ、改行行頭の括弧の処理については、そこまでして進めるべきことか、個人的に
は疑問です。

もちろん、現在の呼びかけ人や点検グループは、作業方針の選択に関して独占的な決
定権をもっているわけではありません。
メーリングリスト等の論議を通じて変更することに決まれば、それに従います。

▼「コ・カ・ガ」等と読まれる片仮名のケに類似した文字の入力について

JIS X 0208:1997が出るまでは、「コ・カ・ガ」等と読まれる片仮名のケに類似した
文字を、0208で表現できるか否かは、明らかでなかったと思います。
0208では、二重ハイフンを「=」で表現できるかが明らかでないのと同様です。

表現できるか否かわからない文字の取り扱いは、共同して作業を進めるに当たっては
、方針として決めることになると思います。
仮定の話になりますが、JIS X 0208:1997以前に方針を決めるのであれば、当該の文
字は、「「ケ」と「ヶ」で入力できるということにしよう」とするのが素直な選択で
はなかったかと思います。

青空文庫の作業が始まる少し前に出たJIS X 0208:1997で、05-86の「ヶ」に「カ」と
いう音訓が設定されました。(「附属書11(参考) 区点位置索引」「3. 音・訓に
よる索引」)

御指摘のように、解説は「規格の一部ではない」とされていますが、その記述の直前
には「本体及び附属書に規定・記載した事柄,及びこれらに関連した事柄を説明する
もの」ともあります。
その解説の24にも、05-86の「ヶ」に「カ」という音訓を設定したと書いてあります。

岩波国語事典第五版によれば、音訓とは、「漢字の音と訓。すなわち、漢字の中国に
おける発音をもとにした読み方と、漢字の意味に対して日本語を当てた読みかた。」
とあります。
この定義が、特殊であるとか、誤っているとは、私は考えません。

JIS X 0213:2000の規格票にも、「ヶ」には「カ」という読みが設定してありますが
、その記載のある「2.3 漢字音訓索引」には、冒頭に「漢字の音訓による索引を次
に示す。」と書いてあります。

JIS X 0208:1997の「附属書11(参考) 区点位置索引」で、05-86の「ヶ」に「カ」
という読みが設定されたことで、「コ・カ・ガ」等と読まれる片仮名のケに類似した
文字は、「0208で表現できる」とする拠り所が得られたと、私は理解しています。

ただ、表現に際して利用できる区点位置として示唆されたのは、05-86のみです。05-
17の「ケ」に対しては、そうした措置はなされていません。

「コ・カ・ガ」等と読まれる片仮名のケに類似した文字は、0208では、05-86の「ヶ
」で表現できます。
けれど、05-17の「ケ」で表現できるかは、誰にもわかりません。
1997の改訂に際して、05-86にのみ読みを設定し、05-17には設定しないと明らかな区
別をつけたことを踏まえれば、「附属書11」と「解説」は、「コ・カ・ガ」等と読ま
れる片仮名のケに類似した文字の区点位置として、05-86のみに誘導をかけていると
私にはみえます。

「コ・カ・ガ」等と読まれる片仮名のケに類似した文字については、まず、この文字
を何と認識するかという問題が生じます。
共同作業を行うにあたって、これを「漢字、もしくは漢字に準じる記号であると認識
しよう」と意思統一を図ったとし、「附属書11」に設定された音訓をたよりに05-86
に行き着いたとしても、今度は、大小の問題をどう扱ってよいのかわからないという
問題が残ります。

こうした問題を抱える文字コード規格に拠ると決めた青空文庫が、「コ・カ・ガ」と
読むものは、「漢字、もしくは漢字に準じる記号」と認識しようと確認し、「附属書
11」の導きにそってこれを05-86で入力すると申し合わせ、規格の枠組みでは解決策
の見えない大小問題については、ファイル末の注記によって底本の状態を記録してお
こうとする作業方針を立てたことは、必要であり、また妥当であったと私は考えます


ちなみに、JIS X 0208:1997には正誤表が出ており、附属書もその対象となっていま
すが、「05-17に対して「カ」の読みを補った」という記載は、見つけられませんで
した。
JIS X 0208:1997で、05-17に対して「カ」の読みを設定しなかったことがうっかりミ
スであり、それが正誤訂正の対象にもならず、そのまま「JIS X 0213:2000」にも引
き継がれ、2004の0213改訂でも訂正されなかったとは、考えにくい気がします。

また、JIS X 0208:1997において、解説の問題の箇所の見出しを、御指摘のように「
“仮名又は漢字に準じるもの”または“片仮名”」としたとすれば、一方の観点から
は「間違いのない記述」との評価を得たでしょうが、他方からは、「仮名に音訓を設
定するというのは、どういう意味か」という別の疑問を、表だって生じさせることに
なったと思います。

タイトルRe: 作業方針について
記事No5398
投稿日: 2012/11/07(Wed) 23:46:46
投稿者土屋
送信:2007/01/28
--------
まず私の基本的な考えから。
日本語は表記の揺れが大きい言語で(他の言語と比べたわけではありませんが)、さらに組版の約束事なんてないに等しい。その中でテキスト・アーカイヴィングを共同で行うための拠り所が、
 「底本のできるだけ忠実な再現」を目標に置き、「勝手な編集はしない」
という原則ではなかったのでしょうか。
「JIS X 0208」を使って、「テキスト・ファイル」の形式で入力するという制約から、底本通りにできないこともあります。しかし、今話題にしている2点は、
「底本の忠実な再現」という原則から外れるルールであるが、そうする根拠が存在しない、
という点が問題です。底本に大きな「ケ」があったら「ケ」を入力し、底本の行頭の括弧が一字分下げたところにあればその分の空白を入力する、という作業に何の苦があるでしょう。

>富田倫生です。
>
>▼行頭の括弧の処理について
(略)
>ただ、ある程度の作業成果を積み上げてきた青空文庫で、作業方針を変更しようとす
>る場合には、常に「すでに作ってしまったファイルの見直しと修正」の問題がついて
>回ります。
(略)
>どうしてもやらなければならないならという判断があるなら、さかのぼっての見直し
>、修正には、大変であっても取り組むべきでしょう。
>ただ、改行行頭の括弧の処理については、そこまでして進めるべきことか、個人的に
>は疑問です。
>
>もちろん、現在の呼びかけ人や点検グループは、作業方針の選択に関して独占的な決
>定権をもっているわけではありません。
>メーリングリスト等の論議を通じて変更することに決まれば、それに従います。

青空文庫をこの先も続けるつもりであるのなら、これから先に積み上げていく作業のことを考えるべきだと思います。
過去のファイルを修正することの緊急性を感じない、ということであれば同感です。
しかし過去のファイルの存在が、これから先の作業方針を変更できない理由になるとは思いません。
こちらについては、メーリングリスト等で論議してくださるのでしたらそれに期待します。

>▼「コ・カ・ガ」等と読まれる片仮名のケに類似した文字の入力について

このあとのご説明は、工業規格であるJIS X 0208が、これを実装する者に、同じ符号で同じ図形文字を出させることを目的としたもの、という大前提から外れたものだと思います。05-86が表すのは「小書きのヶ」であって、どの装置であっても小さな「ヶ」として表示し、大きな「ケ」とは図形文字として区別されることが求められます。

>JIS X 0208:1997が出るまでは、「コ・カ・ガ」等と読まれる片仮名のケに類似した
>文字を、0208で表現できるか否かは、明らかでなかったと思います。
>0208では、二重ハイフンを「=」で表現できるかが明らかでないのと同様です。

「4.定義 w)包摂」の備考には「異なる文字であっても図形概念として区別が困難なものは、この規格では、字体の包摂に準じて同一区点位置を与えることがある。」という記述があります。活字で印刷された書物、また現在の電子化された文書の多くで「コ・カ・ガ」等と読まれる片仮名のケに類似した文字が何の断りもなく片仮名のケで表されていることを見ても、それらはすでに図形概念として区別されていないことは明らかです。JISの規定はそのような現実を反映したものだと思います。

>仮定の話になりますが、JIS X 0208:1997以前に方針を決めるのであれば、当該の文
>字は、「「ケ」と「ヶ」で入力できるということにしよう」とするのが素直な選択で
>はなかったかと思います。

JIS X 0208:1997以後では違うとおっしゃっているようですが、そのような認識は「JIS X 0208:1997」で「ケ/ヶ」の扱いに変更があったとの誤解から生じているように見受けられます。しかし片仮名の文字種の中に大きな「ケ」と小さな「ヶ」があるというのがJISの規定であり、それは1997の改定でも、またJIS X 0213でも全く変りはありません。

>青空文庫の作業が始まる少し前に出たJIS X 0208:1997で、05-86の「ヶ」に「カ」と
>いう音訓が設定されました。(「附属書11(参考) 区点位置索引」「3. 音・訓に
>よる索引」)
>
>御指摘のように、解説は「規格の一部ではない」とされていますが、その記述の直前
>には「本体及び附属書に規定・記載した事柄,及びこれらに関連した事柄を説明する
>もの」ともあります。

その通りであって、「本体及び附属書に規定・記載」されていないことを解説から演繹してはなりません。

>その解説の24にも、05-86の「ヶ」に「カ」という音訓を設定したと書いてあります。

JIS X 0208:1997で「ケ/ヶ」の扱いに全く変更はないと、私は申しました。05-86の「ヶ」に「カ」という音訓を設定したというのはJISの規定の変更でしょうか。それ以前の「ヶ」は「一ヶ月」のように使ってはいけないものだったのでしょうか。
違います。05-86の「ヶ」は最初から「一ヶ月」のように使われることを想定して用意されたものです。
それなのになぜ05-86の「ヶ」に「カ」という音訓を設定したという
ことがわざわざ言及されたか、その理由もJISの解説に書いてあります。JIS X 0212-1990で「〆」に別の区点位置を与えたような誤りを避けるために、文字種が分かりにくいものを音訓索引で引けるようにしたのです。それ以上の意味はありません。

>岩波国語事典第五版によれば、音訓とは、「漢字の音と訓。すなわち、漢字の中国に
>おける発音をもとにした読み方と、漢字の意味に対して日本語を当てた読みかた。」
>とあります。
>この定義が、特殊であるとか、誤っているとは、私は考えません。
>
>JIS X 0213:2000の規格票にも、「ヶ」には「カ」という読みが設定してありますが
>、その記載のある「2.3 漢字音訓索引」には、冒頭に「漢字の音訓による索引を次
>に示す。」と書いてあります。
>
>JIS X 0208:1997の「附属書11(参考) 区点位置索引」で、05-86の「ヶ」に「カ」
>という読みが設定されたことで、「コ・カ・ガ」等と読まれる片仮名のケに類似した
>文字は、「0208で表現できる」とする拠り所が得られたと、私は理解しています。

この記述は「コ・カ・ガ」と読む小さな「ヶ」を表したい人を片仮名の05-86に誘導するためのものです。
「コ・カ・ガ」と読む大きな「ケ」を05-86で表現できるとする拠り所と解釈するのは誤りです。

>ただ、表現に際して利用できる区点位置として示唆されたのは、05-86のみです。05-17の「ケ」に対しては、そうした措置はなされていません。

>「コ・カ・ガ」等と読まれる片仮名のケに類似した文字は、0208では、05-86の「ヶ」で表現できます。
>けれど、05-17の「ケ」で表現できるかは、誰にもわかりません。
>1997の改訂に際して、05-86にのみ読みを設定し、05-17には設定しないと明らかな区別をつけたことを踏まえれば、「附属書11」と「解説」は、「コ・カ・ガ」等と読ま
>れる片仮名のケに類似した文字の区点位置として、05-86のみに誘導をかけていると
>私にはみえます。

違います。05-86にのみ読みを設定したのは、小さな「ヶ」が片仮名の場所にあることを見つけられない人がいるかもしれない、と心配したからです。大きな「ケ」が見つけられないとは思っておらず、また片仮名「ケ」と「コ・カ・ガ」等と読まれる大きな「ケ」を図形文字として区別しようともしていません。JISを利用する人も、それで全く困らなかったのです。

>「コ・カ・ガ」等と読まれる片仮名のケに類似した文字については、まず、この文字
>を何と認識するかという問題が生じます。
>共同作業を行うにあたって、これを「漢字、もしくは漢字に準じる記号であると認識
>しよう」と意思統一を図ったとし、
>「附属書11」に設定された音訓をたよりに05-86
>に行き着いたとしても、今度は、大小の問題をどう扱ってよいのかわからないという
>問題が残ります。

JISの文字種類には「漢字」と「仮名又は漢字に準じるもの」というのがありますが、「ケ/ヶ」の文字種類は「片仮名」ですから、「漢字、もしくは漢字に準じる記号である」という認識のままではどちらにもコード化できません。それらが片仮名に分類されており、図形文字として大小で区別されていると認識しなおすことで、初めてコード化できます。

>こうした問題を抱える文字コード規格に拠ると決めた青空文庫が、「コ・カ・ガ」と
>読むものは、「漢字、もしくは漢字に準じる記号」と認識しようと確認し、「附属書
>11」の導きにそってこれを05-86で入力すると申し合わせ、規格の枠組みでは解決策
>の見えない大小問題については、ファイル末の注記によって底本の状態を記録してお
>こうとする作業方針を立てたことは、必要であり、また妥当であったと私は考えます。

JISの規定は同じ片仮名の文字種類の中に大きな「ケ」と小さな「ヶ」を用意せよ、
というものであって、それに従ってコード化していれば大小問題など生じません。問題を抱えたのは青空文庫の作業方針が原因であって、JIS規格の問題ではありません。

>ちなみに、JIS X 0208:1997には正誤表が出ており、附属書もその対象となっていま
>すが、「05-17に対して「カ」の読みを補った」という記載は、見つけられませんでした。
>JIS X 0208:1997で、05-17に対して「カ」の読みを設定しなかったことがうっかりミ
>スであり、それが正誤訂正の対象にもならず、そのまま「JIS X 0213:2000」にも引
>き継がれ、2004の0213改訂でも訂正されなかったとは、考えにくい気がします。

それは一方でJISに誤りがあるだの穴があるだのおっしゃっている方がいうセリフではないと思いますよ。
JISでの読みの設定は「それ以外の読み方をしてはいけない」ということではなく、
05-17に対して「カ」の読みを設定してないのは誤りではありません(不親切ではあると思う)。
ただ、1997での音訓設定の追加の目的は、小書きの「ヶ」を探す人を片仮名の05-86に誘導することですから、ここで「ケ」の読みの設定を追加していないのは、ある意味当然です。

>また、JIS X 0208:1997において、解説の問題の箇所の見出しを、御指摘のように
>「“仮名又は漢字に準じるもの”または“片仮名”」としたとすれば、一方の観点から
>は「間違いのない記述」との評価を得たでしょうが、他方からは、「仮名に音訓を設
>定するというのは、どういう意味か」という別の疑問を、表だって生じさせることに
>なったと思います。

そのような疑問は、これが工業規格であるということを理解していれば生じえないものだと思います。
JISにおける音訓とは、図形文字の同定を補助する情報の一つ、という以上の意味はありません。

タイトル作業方針について
記事No5399
投稿日: 2012/11/14(Wed) 00:05:03
投稿者富田氏
これは富田倫生氏から送られたメールを、土屋が転載しているものです。

送信:2007年2月ごろ
--------
まず、「コ・カ・ガ」等と読まれる、片仮名のkeに似た文字の底本における扱いは、現行の方針で、記述できます。

それがこの作業方針を選択した根拠ではありませんが、OCRの入れてきたまま、仮名漢字変換モジュールが最初に示した候補のママ、無自覚に「ケ/ヶ」が散在している性格の強かったかつてよりは、この方針を選択して以降の方が、底本の状態は正しく記述される割合が高まっています。

「ヶ」に音訓を付した理由は、「小書きの「ヶ」を探す人を片仮名の05-86に誘導すること」にあるとの御指摘でした。しかしそれでは、「これらは、他の漢字と全く異なる所に配置されていて検索しにくいため、この規格で表現できないと誤って判断される例が少なくない」から、「検索を容易にするために、あえて音訓を設定」したという解説の文言と、結び付きません。
それが理由であるなら、設定する読みは「ke」で良いでしょう。
同様の措置が、「ヵ」に対して取られていないことも、説明が付きません。

文字集合に対する変更は行わず、記号に関する包摂規準の明示にまで手が回らなかったのであれば、「コ・カ・ガ」等と読まれる、片仮名のkeに似た文字をこの規格で表現できるか否か示すためには、特別の規定を設ける必要があったのではないかと思います。
それをせずに、「ヶ」に対して音訓を設定するということで収めようとした、「まあまあこんなことで」といった態度が、この問題をわかりにくくしていると思います。

こうした、「こんなところでおさめてよ」といった態度は、正誤訂正にはなじまないでしょう。
問題を解くための必要な対処は、「記号に関する包摂規準の明示」です。
それが行われれば、おそらく、「コ・カ・ガ」等と読まれる、片仮名のkeに似た文字に関して、青空文庫が「こうしよう」と申し合わせる必要はなくなると思います。

こう申し上げていることに対しても、土屋さんのご納得はえられないものと思います。

その際は、
・小異を残して協力していけないか。あるいは、
・ご自身で、作業方針の変更を提案していただけないか。
ご検討いただけないでしょうか。

タイトル作業方針について
記事No5400
投稿日: 2012/11/14(Wed) 00:20:06
投稿者土屋
送信:2007/02/24
> --------
作業方針の変更の提案という以前に、青空文庫の(あるいは富田さんの)JISの解釈が間違っている、ということをご理解いただきたい。
自分たちが間違った解釈をしておいて、その間違った解釈にとって不都合なことがあると、JISに誤りがあるだの穴があるだのおっしゃるのはやめて欲しいのです。
この件で、JISに誤りも穴もありません。
ただJISは、片仮名の文字種の中に、大きな「ケ」と小さな「ヶ」を用意することに決めた、という事実があるだけです。
それで誰も困っていないところを見れば、その決定は妥当なものでした。

>まず、「コ・カ・ガ」等と読まれる、片仮名のkeに似た文字の底本における扱いは、現行の方針で、記述できます。

「コ・カ・ガ」等と読まれる大きな「ケ」と、「コ・カ・ガ」等と読まれる小さな「ヶ」が明らかに使い分けられることがあり、現行の方針では不都合です。
例えばウィキペディアの「保土ケ谷区」の記事(2月24日現在)には次の文章があります。
----
※ ここでは保土ケ谷区役所での表記に従って「保土ケ谷区」と表記している。「保土ヶ谷区」の表記もよく用いられる。
----
この文章は、現行の方針では記述できません。

>それがこの作業方針を選択した根拠ではありませんが、OCRの入れてきたまま、仮名漢字変換モジュールが最初に示した候補のママ、無自覚に「ケ/ヶ」が散在している性格の強かったかつてよりは、この方針を選択して以降の方が、底本の状態は正しく記述される割合が高まっています。

それは現行の作業方針が望ましいという理由にはなりません。「底本の大小の通りに入力する」という作業方針を決定し、浸透されていれば、それでも底本の状態は正しく記述されたでしょう。
ファイル末に注記を付する必要がなくなることを考えれば、「大小の通り」という作業方針の方が、作業者の負担は明らかに減ります。

>「ヶ」に音訓を付した理由は、「小書きの「ヶ」を探す人を片仮名の05-86に誘導すること」にあるとの御指摘でした。
>しかしそれでは、「これらは、他の漢字と全く異なる所に配置されていて検索しにくいため、この規格で表現できないと誤って判断される例が少なくない」から、「検索を容易にするために、あえて音訓を設定」したという解説の文言と、結び付きません。
>それが理由であるなら、設定する読みは「ke」で良いでしょう。

「ヶ」が小書き片仮名ケであることは、最初から示されています。「ke」の読みを追加するには及びません。それ以外の「ka」の読み方でも検索できるように音訓を設定したのです。

>同様の措置が、「ヵ」に対して取られていないことも、説明が付きません。

「ヶ」は本来漢字だがJISでは片仮名として扱う、というのが「ヶ」に関する特殊事情です。
「一ヵ月」の「ヵ」が片仮名でないと思われるかもしれない、とおっしゃるのなら、いったい「ヵ」は何なのでしょう。
同様の措置が、「ァィゥェォッャュョ」にも必要だと思われますか?

>文字集合に対する変更は行わず、記号に関する包摂規準の明示にまで手が回らなかったのであれば、「コ・カ・ガ」等と読まれる、片仮名のkeに似た文字をこの規格で表現できるか否か示すためには、特別の規定を設ける必要があったのではないかと思います。
>それをせずに、「ヶ」に対して音訓を設定するということで収めようとした、「まあまあこんなことで」といった態度が、この問題をわかりにくくしていると思います。
>
>こうした、「こんなところでおさめてよ」といった態度は、正誤訂正にはなじまないでしょう。
>問題を解くための必要な対処は、「記号に関する包摂規準の明示」です。
>それが行われれば、おそらく、「コ・カ・ガ」等と読まれる、片仮名のkeに似た文字に関して、青空文庫が「こうしよう」と申し合わせる必要はなくなると思います。

05-17が大きな「ケ」で、05-86が小さな「ヶ」であることは、これ以上ないくらい明示されています。「本来違う字でも、図形概念として区別がなければ同じ符号を与えることがある」ということも規格は宣言しています。これに該当するのは「ケ」だけではありません。
何度も申上げていますが、05-86の小さな「ヶ」が大きな「ケ」を包摂することは、絶対に有り得ません。同じ文字種の中で文字が衝突することは排除されます。

※01-01の丸印「○」と02-94の大きな丸「◯」という例外はありますが、02-94が過去の規格との互換性のために仕方なく残されたものであることは富田さんも御存じの通りです。

>こう申し上げていることに対しても、土屋さんのご納得はえられないものと思います。
>
>その際は、
>・小異を残して協力していけないか。あるいは、
>・ご自身で、作業方針の変更を提案していただけないか。
>ご検討いただけないでしょうか。

私はメーリングリストに参加していませんが、
・私が作業方針の変更の提案を reception@aozora に送ったら、それをメーリング リストに流していただく(提案者が私であることは通知してかまいません)。
・私の追加の説明が必要になったら、私に知らせていただく。
・現時点における、提案の採用、不採用、あるいは修正して採用、の回答をいただく。
 少なくとも回答が得られるように努める。

という条件を承諾いただければ、そうさせていただきます。

タイトル作業方針について
記事No5405
投稿日: 2012/11/19(Mon) 06:13:22
投稿者富田氏
これは、富田倫生氏から送られたメールを、土屋が転載しているものです。

送信:2007/02/26
--------
> 私はメーリングリストに参加していませんが、
> ・私が作業方針の変更の提案を reception@aozora に送ったら、それをメーリングリストに流していただく(提案者が私であることは通知してかまいません)。
> ・私の追加の説明が必要になったら、私に知らせていただく。
> ・現時点における、提案の採用、不採用、あるいは修正して採用、の回答をいただく。
>  少なくとも回答が得られるように努める。
>
> という条件を承諾いただければ、そうさせていただきます。

ご意向、承りました。 二日ほど、ああでもないこうでもないと思いをめぐらせていました。
土屋さんは、メーリングリストにはどうしても参加したくないとお考えで、その理由を私が掴み損ねているのかも知れませんね。

ただ、素直に考えれば、「何かが必要である」と思われた方には、ご自身で問題解決の場に臨み、提案し、共感を得るように働きかけていただくのが筋ではないかとの思いも、拭えません。

作業方針の論議の場は、メーリングリストです。
ここで、現行の方針もおよそ1年、話し合いを続けて決めました。
それ以降も、土屋さんがご提案いただいた形の方針変更が提案されましたが、相談の結果、変えないことに決めました。

そもそもの「筋」に加え、そうした経緯を踏まえると、呼びかけ人グループ、点検グループの誰かが土屋さんのメッセージを取り次ぐことはためらいを覚えます。
土屋さんご自身で提案していただくことは、できないものなのでしょうか?

タイトル作業方針について
記事No5406
投稿日: 2012/11/19(Mon) 06:23:27
投稿者土屋
送信:2007/02/27

>作業方針の論議の場は、メーリングリストです。
>ここで、現行の方針もおよそ1年、話し合いを続けて決めました。
>それ以降も、土屋さんがご提案いただいた形の方針変更が提案されましたが、相談の結果、変えないことに決めました。
>
>そもそもの「筋」に加え、そうした経緯を踏まえると、呼びかけ人グループ、点検グループの誰かが土屋さんのメッセージを取り次ぐことはためらいを覚えます。
>土屋さんご自身で提案していただくことは、できないものなのでしょうか?

この問題の解決まで、限定的にメーリングリストに参加することはオプションとして 残しておきますが、今のままでは私もためらいを覚えます。

(1)方針変更の提案を聞くつもりがあるのか。
現行方針を変えない理由というのが、誰が見ても当然、あるいは仕方がないと思える ものであれば、それを示してくださればいいのではありませんか。
「区点番号5-17と5-86の使い分け指針」に書いてあることを見ても、以前(2004年の7月でした)「こもれび」で、富田さんが投稿された記事にしても、そして今にしても、おっしゃることがことごとく理由になっていないから私も引き下がれずにいるのです。

試みに、一番最後のものだけでも、変更提案を否決した理由というのをお聞かせいただけますか。

理由の如何を問わず、最初から方針変更の提案には聞く耳をもたないというのであれば、私も無駄なことはやめざるを得ません。

(2)富田さんのおっしゃっていることが筋違いではないか。
私は、青空文庫のケヶの使い分け指針の理由が、青空文庫の「外部の」存在であるJISの求めであるといっていることに対し、「外部から」JISにはそんな根拠はないと 批判しているのです。
そういう指摘に対して、答えられないが、続けるならメーリングリストに参加してくれ、というのは、それこそ筋違いではありませんか。

JISに関しては、私はこんなことを言ってきました。
・区点番号5-17は(大きな)片仮名ケ、5-86は小書き片仮名ケ(すなわち「ヶ」)である。これらは図形概念として大小で区別されており、5-86が大きなケを包摂することはあり得ない。
・「こ」「か」「が」と読む大きな「ケ」が、5-17で表せることは、JISが、「異なる文字であっても図形概念として区別が困難なものは、同一区点位置を与えることがある」といっていることで説明できる。
・1997年の改正で、「ケ/ヶ」に関する規定に全く変更はない。
 「ヶ」を「仮名又は漢字に準じるもの」の仲間であることを示す措置などなされていない。

そうではなく現行方針の理由として言っていることが正しいと、納得できる説明はいまだになされていないと考えています。

こう言ってきたのが、仮にJISの委員であったとしても胸を張れる答えを用意しておいてください。現行方針の理由が正しいとおっしゃるのなら。

タイトル作業方針について
記事No5409
投稿日: 2012/11/26(Mon) 23:45:10
投稿者富田氏
これは富田倫生氏から送られたメールを、土屋が転載しているものです。
送信:2007/03/01
--------
> この問題の解決まで、限定的にメーリングリストに参加することはオプションとして
>
> 残しておきますが、今のままでは私もためらいを覚えます。

私自身は、できうれば、メーリングリストでご提案いただくのが望ましいのではと思います。
当然、一時的なご参加で、かまいません。
メーリングリストへのご提案、よろしくご検討ください。

> (1)方針変更の提案を聞くつもりがあるのか。

メーリングリストは、作業方針の論議を、役割の一つとしています。

> 試みに、一番最後のものだけでも、変更提案を否決した理由というのを
> お聞かせいただけますか。

メーリングリストではこれまで、原則として、決は取ってきませんでした。
誰かが明示的に反対しなくなった時点で、方針(もしくは改定した方針)を採用する形ですすめてきました。

前回ある方から、現行の方針への違和感が示された際、その違和感を指示する立場からと、「今のままでよいのではないか」という立場からのコメントが付き、最終的には、変えようとする側からのそれ以上の発言がなくなって、終息しました。

終息に向かう当たりで、私が最後に書いた二つのコメントを、以下に引いておきます。

> (2)富田さんのおっしゃっていることが筋違いではないか。

これに関しては、これまで書いてきたことに付け加えたいことが、なかなか見つかりません。
あえて感想めいたことを書けば、「考え方が違うんだな」と思った時点でもなお、ご返答を続け、メーリングリストでの提案をお願いしているのは、土屋さんを、青空文庫の目標に向かって力を合わせて進む仲間だと思っているからです。

タイトルRe: 作業方針について
記事No5413
投稿日: 2012/11/27(Tue) 00:17:43
投稿者土屋
> あえて感想めいたことを書けば、「考え方が違うんだな」と思った時点でもなお、ご返答を続け、メーリングリストでの提案をお願いしているのは、土屋さんを、青空文庫の目標に向かって力を合わせて進む仲間だと思っているからです。

富田倫生氏が、鈴木厚司さん、ちゃまがさん、田部井荘舟さんらに返答するのを止めたのは、「富田様と考え方が違う者は敵である」という結論に達したからのようです。

タイトル作業方針について(続)
記事No5410
投稿日: 2012/11/26(Mon) 23:51:12
投稿者富田氏
これは、富田倫生氏から送られたメールを、土屋が転載しているものです。一部個人名等を伏せました。
--------
【引用】

Subject: [aozora:4818] Re: ケヶ問題(?)

Kさん、富田です。
お久しぶりです。

この問題を考えはじめるきっかけは、ご指摘の通り、「大小を判別できないときは、どうしよう?」でしたよね。
そこからやがて、「そもそもこの字は、なんなのだろう?」へと関心が向かいました。
そして「「こ」「か」「が」と読まれるものは本来、「个」に由来する符号で、片仮名のケとは異なる起源の文字」と理解されているらしいことを知りました。

続いてその文字を、JIS X 0208で入力する際は、どう扱うのが妥当なのかを検討しました。
0208には、片仮名のケのように見える文字の候補が、二つあります。
5-17と5-86です。
これらには、規格制定時にKATAKANA LETTER KEとKATAKANA LETTER SMALL KEという名前が与えてあって、ともに片仮名に分類してあります。

もし規格が制定時のままであったなら、「本来は片仮名のケとは異なる起源の文字」という知識と符合しないので、ひっかかりが残っただろうとは思うのですが、「底本で大きく見えるものを5-17で、小さく見えるものを5-86で入力する。大きいか小さいかわからない場合は、どっちかで入れて、「大小の判定には自信がない」とでもいったことを書いておく」くらいが、無難な作業方針だったのではないかと思います。

ところが1997年の改訂時に、5-86は「カ」(増補改訂JIS漢字字典によれば「カ・コ」)と読み、本来は漢字なのだという情報が加えられました。
そこで、「「こ」「か」「が」と読まれるものは、JIS X 0208では、5-86で入力するのが妥当だろう」と確認し、作業方針としたというのが、流れだったと思います。

この認識が誤っているのなら、作業方針は検討し直した方がよいと思います。

>あえて底本と異なる表記に改変するというのには、
>どうしても抵抗を感じてしまうのです。

と感じておられるのですね。
ただ「「「こ」「か」「が」と読まれるものが何であるか」を学び、JIS X 0208:1997が、この文字に符合する同定情報をどの区点位置に与えているかを確認した後の私には、むしろ、これを片仮名の5-17で入力することこそが、「底本と異なる表記に改変する」に近しい行為に感じられます。

なお、JIS X 0208の与えてくれる枠組みでは、印刷時には、「个」に由来する符号は大きくつくられる場合もあれば、小さくつくられる場合もあるという要素がうまく取り扱えません。
底本で大きくつくっていた場合は、その旨注記しておこうという作業方針は、この枠組みの不備(あくまで富田の個人的な評価ですが。)を補う意味では、不可欠であるように思います。

タイトルRe: 作業方針について(続)
記事No5412
投稿日: 2012/11/27(Tue) 00:13:44
投稿者土屋
富田倫生氏の言ってることは嘘のかたまりですが、まず一つ。

> 0208には、片仮名のケのように見える文字の候補が、二つあります。
> 5-17と5-86です。
> これらには、規格制定時にKATAKANA LETTER KEとKATAKANA LETTER SMALL KEという名前が与えてあって、ともに片仮名に分類してあります。

「ケ」と「ヶ」の、KATAKANA LETTER KEとKATAKANA LETTER SMALL KEという名前は、1997改訂の時に初めて付けられたものです。
(X 0208としては。その前にUnicodeで文字名称が決められてます)
----
X 0208:1997 解説
3.6.3 文字の名前(本体の5.3)この規格の第3次規格までは,漢字については自体の字形だけを示し、非漢字については,日本語名称を規定するだけである。〜今回の改正では,すべての図形文字について,文字名称を与えることとした。
----
規格制定時から、ともに一貫して片仮名に分類してあることは、その通り。

タイトル作業方針について(続々)
記事No5411
投稿日: 2012/11/26(Mon) 23:57:04
投稿者富田氏
これは、富田倫生氏から送られたメールを、土屋が転載しているものです。一部個人名等を伏せています。
--------
Subject: [aozora:4822] Re: ケヶ問題(?)

Kさん、富田です。

>しかしどうしても、
>>ただ「「こ」「か」「が」と読まれるものが何であるか」を学び、
>>JIS X0208:1997が、この文字に符合する同定情報をどの区点位置に
>>与えているかを確認した後の私には、むしろ、これを片仮名の5-17で
>>入力することこそが、「底本と異なる表記に改変する」に近しい
>>行為に感じられます。
>ということに馴染めないだけなのです。

問題のあの字を、JIS X 0208では何で入れたらよいのだろうかという疑問は、これからも多くの人に生じ続けると思います。

そこで迷ったあげく、「大きい方は5-17で、小さい方は5-86で入れる」と決めたとすれば、「大きく作ったパターンを、片仮名で入力してよいのか?」という疑問が残るでしょう。(5-17で入れるのは、規格票解説「3.7.3.5.1 一意の符号化の要請」で「あり得ない。」とされている行為にあたるのではないかと。)

一方、大きいのも小さいのも5-86で入れると決めた際には、「規格票の例示字体でも、どのフォントをみても、必ず小さくつくってあるこれで、大きいのを入れちゃって、本当に良いんですか?」という問いに対し、自分でその理由を説明せざるを得なくなるでしょう。(5-86を片仮名以外の用字系に移した上で、大小包摂なのだと言う。
あるいは、過去からの経緯があって、この規格は現在、5-86の大小の問題が扱えない状態にあると、規格票自体が言い訳してくれる、といったことが行われていないので。)

自分で引き受けざるをえないこの説明は、「こういう理由でこんなことになってしまっているのだ」という言い訳になるので、話している当人には、「ああ、こんなことになっていなければな〜」という恨みが、聞かされている側には、「ええ、そうなの」という違和感が残り続けると思います。

やはり、1997年の改訂時の対処は、中途半端だったと、私は思います。
でも、あの時の対処がなければ、「「こ」「か」「が」と読む、片仮名のケのように見える文字は、JIS X 0208では符号化できない」という考えすら、根拠をもってしまったのではないでしょうか。
中途半端だったけれど、確実に前進だった改訂時の追加情報にそえば、問題の字は5-86で入れることになる。
そして、「大小」に対する違和感が、対処の中途半端さのゆえに残り続けるのではないでしょうか。

タイトル作業方針について
記事No5415
投稿日: 2012/12/04(Tue) 00:27:42
投稿者土屋
送信:2007/03/05
--------
メーリングリスト登録完了のメールがさきほど届きました。
「ケヶ」の件はそちらに場を移すことになると思いますので、このメールには直接返信いただいても、そうされなくてもかまいません。

中の事情はうかがい知れませんが、外から見ていた限りでは、現行方針を主導したのは富田さんで、その後の変更の提案を止めているのも富田さんのように見えます。したがって、この方針を変えるには、富田さんに変ってもらわねばならないと思っていました。
ですが、どうにも埒が明かないようです。

富田さん、あるいは他の呼びかけ人の方の中から、自ら「変えよう」という声が上がらなかったのは残念ですが、私から近々MLに方針変更を提案しようと思います。

> > (2)富田さんのおっしゃっていることが筋違いではないか。
>
>これに関しては、これまで書いてきたことに付け加えたいことが、なかなか見つかりません。
>あえて感想めいたことを書けば、「考え方が違うんだな」と思った時点でもなお、ご返答を続け、メーリングリストでの提案をお願いしているのは、土屋さんを、青空文庫の目標に向かって力を合わせて進む仲間だと思っているからです。

「考え方が違う」というのがなんのことか分かりませんが、もしJISの解釈のことだとしたら、私はこれを「考え方の違い」と捉えること自体認めません。
JISというのは工業製品を作るための仕様書です。それが好きなように解釈されては、モノを作れませんし、使えません。

付けていただいた、現行案の支持理由を読みましたが、やはり理由になっていません。どこがどうおかしいかは、これまでのやり取りの中で出ていますので繰り返しません。

前回、メーリングリストの運用状況を知らなかったために、だいぶ失礼なことを申上げたと思います。その点はお詫びします。

それでいて、どうして現行案のような結論に至ってしまうのか、その後も内外から現行方針への疑問が起りながら、どうして変らないのかは不思議でたまりませんが。

タイトルケヶの使い分け指針変更の提案
記事No5417
投稿日: 2012/12/11(Tue) 23:59:55
投稿者土屋
送信:2007/03/07
[aozora:5681] ケヶの使い分け指針変更の提案

青空メーリングリストの皆様、はじめまして。土屋隆と申します。

さて、あいさつもそこそこに、
「区点番号5-17と5-86の使い分け指針」の変更を提案します。またか、と皆さん思われるかもしれません。念のため言っておきますと、過去ログの関係すると思われるところ、例えば3919から4483にかけては読んでおります。

後ろに変更案をつけました。現行方針をなぜ変えなければならないかと私が考えているかを示すのによかろうと思ったからで、この通りになることに、今から拘泥しているわけではありません。

長いですが、ポイントは1つだけ。
底本に、「二ケ月」「関ケ原」のように大きく書かれた「ケ」があるとき、5-86の「ヶ」で入力する(現行方針)か、5-17の「ケ」で入力するか(変更案)です。
そこで、細かいところはさておき、この点について変更案に同意していただけるかどうかを伺いたいと思います。

現行方針の問題点は2つに集約されます(といってもこの2つは強く関連しています)。

1つは、「こ・か・が」と読まれる「ケ」と「ヶ」が明らかに使い分けられる例があり、現行方針では対処できないこと。

例えば、ウィキペディアの「保土ケ谷区」の記事には、こんな文章があります(3月7日現在)。

※ ここでは保土ケ谷区役所での表記に従って「保土ケ谷区」と表記している。「保土ヶ谷区」の表記もよく用いられる。

この文章は現行方針では表せません。

もう1つは、「こ・か・が」と読まれる大きな「ケ」を5-86の「ヶ」で入力すべしとする根拠が、JIS X 0208のどこにもないことです。
このことは過去ログでもすでに指摘されており、4431で米田さんがJISについて語っていることが概ね正しいと言えます。

なお、この提案は公開済みのファイルをただちに直せと要求するものではありません。公開済みのファイルの扱いとは切り離して考えていただくようお願いします。

タイトルケヶの使い分け指針変更の提案(続)
記事No5418
投稿日: 2012/12/12(Wed) 00:21:54
投稿者土屋
送信:2007/03/07

区点番号5-17と5-86の使い分け指針

「ケ・ヶ」と見える文字の入力指針
片仮名ケ(のように見える字)は、二ケ所、三ヶ日のように「か」「が」と読まれる字としても使われます。
底本上で、片仮名の「ケ」または「ヶ」と見える文字に関しては、次のように入力してください。

1 大きな「ケ」は、区点番号5-17の「ケ」で入力してください。
2 小書きの「ヶ」は、区点番号5-86の「ヶ」で入力してください。

※底本によっては、片仮名全般が漢字や平仮名と比べて小さめの字で印刷されていることがあります。「ケ・ヶ」の大小は他の片仮名との比較で判断してください。他の字より右寄り(横書きでは下寄り)に印刷されていたら小書きと判断できることもあります。

※一つの作品の中で、使い分けの理由が全くないにもかかわらず、「か」「が」と読まれる「ケ・ヶ」が混在することや、小書きの「ヶ」が使われるべきでないところに現れること(例「チヶット」)があるかもしれません。原則は底本の大小の通りとしますが、修正した方がよいと思われた場合は、reception@aozora.*.* に御相談ください。

--------------------------------------------------------------------------------

解説

上記作業方針を採用する理由は、以下の通りです。

【青空文庫が採用している文字コードからの求め】

青空文庫は、現在のパソコンで広く使えるようになっている、JIS X 0208 という文字コードを用い、この規格の約束事に従って、作品をテキスト化しています。

この規格では、文字の集合の中における各文字の「居場所」として、区点番号(コード・ポイント)というものを割り当てています。

「片仮名ケ」の区点番号は「5-17」です。
「小書き片仮名ケ」(つまり「ヶ」)の区点番号は「5-86」です。

この二つの文字は、図形概念、この場合は文字の大小によって区別されます。したがって、大きな「ケ」を表すには「5-17」、小さな「ヶ」を表すには「5-86」を用いるのが、JIS X 0208 に合致した対処です。

【「ケ」と見える文字の二つのルーツ】

底本上で「ケ」または「ヶ」と見える文字には、異なった字源を持つ、二つの流れがあります。

一方は、「介」の一画を省いた形から起こった、片仮名の「ケ」です。

そしてもう一方が、「个」を源とする流れです。一ケ、二ケ所、三ケ日のように用いられ、それぞれのケースで、「こ」「か」「が」と読み分けられる文字が、ここから生まれました。そしてこれらは一ヶ、二ヶ所、三ヶ日のように、小さめの文字で書かれる場合もあります。

二つは元々は別物でした。しかし今日では片仮名の「ケ」と二ケ所などの「ケ」は、字形としての区別はなくなっています。

参考:

「言葉に関する問答集 総集編」文化庁編、財務省印刷局
            1995(平成7)年3月31日初版
            2001(平成13)年3月21日4刷

「ところで、数詞に続けて物を数えるときには、旧表記では「五ヶ所」「五ヶ条」のように小さく「ヶ」と書くことも行われた。また、固有名詞の場合にも「駒ヶ岳」「槍ヶ岳」「青ヶ島」のように書かれる。
これらは、一般には、片仮名の「ケ」を書いて「カ」または「ガ」と読むのだと意識されているが、本来はそうではない。この「ケ」は片仮名ではなく、漢字の「个」(箇と同字)又は「箇」のタケカンムリの一つを採ったものが符号的に用いられてきたものである。」

「日本国語大辞典 第七巻」小学館
            1974(昭和49)年1月10日第1版第1刷発行
            1987(昭和62)年9月20日第1版第13刷発行

「け【け・ケ】」の項の〔付記〕
〔付記〕片仮名の「ケ」を、物を数える「一カ年・一コ」の「箇」に代用することがあり、近来は「一ケ・二ケ」等を、「イッケ・ニケ」等とよむようにもなった。 また、「君ケ代」「越ケ谷」「八ケ岳」のように連体助詞の「が」にあてることがある。これは前例の「三ケ日(さんがにち)」等の「ケ」の転用である。これらの「ケ」は、もともと「箇」の略体「个」から出たもので、かたかなとは起源を異にするが、字形としては区別はなくなっている。

【JIS X 0208における包摂の考え】
本来片仮名ケとは異なる字である「箇・个」由来の「ケ」を、片仮名ケと同じ区点番号5-17で表すことに疑問をもたれるかもしれません。
JIS X 0208では、「包摂」という考えを取り入れることで、文字の集合の要素数に歯止めをかけています。

参考:JIS X 0208:1997
4.定義
w) 包摂(unification) 複数の字体を区別せずに,それらに同一の区点位置を与えることをいう。
備考 図形文字は図形概念によるものであるので,異なる文字であっても図形概念として区別が困難なものは,この規格では,字体の包摂に準じて同一区点位置を与えることがある。

「片仮名ケ」と「箇・个」由来の「ケ」が同じ区点番号で表せることは、この規定で説明できます。一方、小書きの「ヶ」は、小さめに表されたケとして、図形概念上大きな「ケ」とは区別されます。そのため、小書きの「ヶ」は、大きな「ケ」とは異なる区点番号5-86で表します。

JIS X 0208には漢字の字体の包摂基準が規定されているため、「箇・个」由来の「ケ」が区点番号5-17で表せるというためには、包摂基準として明文化されていなければならないのではないかと思われるかもしれません。漢字の字体の包摂基準は漢字にしか適用されませんが、そのことは非漢字には包摂の考えが全くないということを意味するものではありません。

参考:JIS X 0208:1997の解説3.7.3.3
漢字の包摂基準の規格内への明記(抜粋)
 なお,漢字以外の記号類などの包摂基準も必要ではないかとの意見があった。〜しかし,今回の改正では,これらに対する包摂基準を設定するための十分な論拠を準備することができなかったので,非漢字の包摂基準は,今回の改正では見送った。

非漢字の包摂は漢字と比べるとあいまいですが、青空文庫では「図形概念としての区別が困難」と認められる場合にはそれと見なして入力します。
例:
二重ハイフン→「=」(等号)に包摂と見なす。
バツ印→「×」(乗算記号)に包摂と見なす。

【過去の青空文庫の作業方針】

青空文庫では過去の一時期、「ケ・ヶ」の使い分けについて、「け」と読む片仮名は「ケ」で、「こ」「か」「が」と読む場合は、文字の大小に拠らず「ヶ」で入力するとの作業方針をとっていたことがあります。そして後者の文字が小書きされずに「ケ」のように印刷されていたときは、ファイル末に次のように注記することにしていました。
※底本は、物を数える際や地名などに用いる「ヶ」(区点番号5-86)を、大振りにつくっています。

この過去の作業方針は、底本のできるだけ忠実な再現を目指すという原則に立ち戻って改正されましたが、公開中のファイルには、そのような過去の作業方針に拠って作成されたものがあることを御承知おきください。

以上

タイトルRe: ケヶの使い分け指針変更の提案(続)
記事No5423
投稿日: 2012/12/13(Thu) 19:15:37
投稿者Anonymous Coward
某掲示板にて
http://yro.slashdot.jp/comments.pl?sid=587287&cid=2289673

タイトルRe^2: ケヶの使い分け指針変更の提案(続)
記事No5427
投稿日: 2012/12/15(Sat) 01:47:30
投稿者土屋
せっかく教えてもらったから、コメントしておこうか。

> 著作権切れてるんだから、勝手に改変しようが、ぶった切ろうが勝手じゃないか。

この馬鹿が著作権法を知らないことは、別のAnonymousの指摘の通り。

> というのは追いといて、原文で「ケ」のように見える文字にはカタカナの「ケ」以外に漢字の「箇/個」の略字が存在している。この箇の略字について JIS X 0208 で表現するために「ヶ」を使うのは当然じゃないか?

その当然のことが、
・文部科学省や国立国会図書館などの国家機関
・茨城県龍ケ崎市、横浜市保土ケ谷区などの地方自治体
・朝日新聞、共同通信などのマスコミ
・マイクロソフトなど、かな漢字変換辞書の提供者
・JIS X 0208自身
に伝わらないのは、なぜだろうね?
これらはみな、漢字の「箇/個」の略字を文字コードで表現するのに「ケ」を(「ケ」も)使っている。

> どうせ全部の漢字が表現できなくて舊字體を新字体に置換してたりするんだし「ケ」だけ批判とか頭悪い。

舊字體で書ける字は、置換せずに底本通りに書いてくれと言っている。「ケ」だけを問題にしてるわけじゃない。
底本の「繩」は「縄」ではなく「繩」と書いてくれ。
底本の「ケ」は「ケ」と書いてくれというのも同じこと。

> 「ヶ」はカタカナの小書きのケに思うかもしれないが、伝統的には漢字の略字。

「一ケ月」「関ケ原」の「ケ」も本来は漢字の略字。だがカタカナ「ケ」と字形の区別はなくなっている。

> その意味でフォントによっては大きく「ケ」と同じ大きさで表示しても良いんだよ。

この馬鹿はJIS規格を読んだことがないようだが、区点5-86の「ヶ」を「ケ」と区別できない大きさで表示することは、JIS X 0208の3.3.3で禁止されている。

--------
> 同一性保持権も著作者人格権に含まれるから、勝手に改変すれば違反になる。

> ただし例外があり、例えば漢字の字体の変更などは問題ないとされている。
> 「ケ」「ヶ」の変換であればおそらく問題ないと思う。

底本の「一ヶ月」を「一ケ月」に変換するのだって問題はない。
「変えても問題ない」と言うだけでは、
・そもそも、どうして変えなくちゃいけないの?
・「保土ケ谷区のケは大きなケです」という文章を、どう変えたいの?
という疑問の答えになっていない。

--------
> 青空文庫用に入力する時点で原本からの完璧な再現なんてありえないわけで、そうなるとどこまで改変を許容するかの話。

底本の「ケ」を「ヶ」に改変することを許容する理由はない。
底本の「カ」を「ヵ」に改変するのを認めてないのと同じこと。

> 個人個人のさじ加減の度合いを突き合わせて議論しても、お互い譲る気配がないのなら議論がまとまるわけもなく。

「底本忠実」が青空文庫の原則。
底本の「ケ」を「ケ」で表し、
底本の「ヶ」を「ヶ」で表すことは誰にでもできる。
「個人個人のさじ加減」の出る幕ではない。

> この話だけならまだしも、一事が万事会話がギスギス [nifty.com]しているので、工作員としてもさすがにウンザリ。

こういう人間にウンザリしているのはお互い様。

タイトル名も無き?善意
記事No5420
投稿日: 2012/12/12(Wed) 23:12:53
投稿者土屋
> たられば @tarareba722
> 大事なことなので何度も書きます。「青空文庫」は名も無き入力者・校正者ひとりひとりの善意が積み重なって出来た、日本のWEB空間に咲いたひとつの「奇跡」です。この奇跡を1日でも多く存続させること、それだけでもTPP交渉参加への反対理由になると思っています。

名前はある。
その名前を、入力者・校正者としてファイルに書いてもいる。
そのファイルを、富田倫生が問答無用で書き換えることに激怒している。
勝手に「名も無き者」にするんじゃない。

青空文庫の入力者・校正者が、みな一致して著作権保護延長やTPP交渉参加に反対しているわけでもない、ということも申し上げておく。

タイトル軽薄ブログ
記事No5430
投稿日: 2012/12/16(Sun) 17:37:26
投稿者土屋
http://blogs.yahoo.co.jp/huzisan/archive/2012/12/16
> この中の「一ッ家」というのはこの人だけではなく誰もがやる表記だが、あまりいいものではない。「ッ」は促音表記のためにある。(略)。しかし「一ッ家」は「ひとついえ」であって、「ひとっいえ」と読むことはあり得ない。

あり得ないのだから、促音と混同されることはあり得ないわけで、避ける必要もないでしょう。

> ところが「関ヶ原」とかの「ヶ」ははじめから小字として使われる。つまり促音拗音以外ではじめから小字になるのは「ヶ」という特殊な文字だけである(ほかにもあるが例外的なもので大勢には影響しない、ところが田貫などは例外が原則で、原則は例外だというのだから頭がどうかしている)。だから「一ッ家」などは促音と混同されるから避けるべき表記である。

そうした表記が原則か例外かなんて関係ありません。
底本の表記を、できる限りそのままコピーしてください。
軽薄氏や富田倫生氏が
 「一ッ家」は避けるべき表記である。
 「関ケ原」は避けるべき表記である。
と考え、自分の文章でそうするのは自由ですが、他人の文章をこねくりまわして添削したつもりになるのはお止めなさい。
それだけのことです。

タイトル「青空文庫」はアブナイ
記事No5435
投稿日: 2012/12/23(Sun) 01:34:53
投稿者土屋
「青空文庫」はアブナイ
http://pinokojack.blogspot.jp/2012/12/blog-post_6582.html#!/2012/12/blog-post_6582.html

「青空文庫」は恐ろしい
http://pinokojack.blogspot.jp/2012/12/blog-post_21.html#!/2012/12/blog-post_21.html
--------
私は必ずしもpinokojack氏に全面的に同調はしない。

青空文庫に間違いがあるのは、間違いの一部を生産している者(私)も認める事実だが、原本に忠実かを問題にするのなら、底本と照合した上で指摘しべきであろう。

しかし、この人も指摘する行頭括弧の一字下げや「ケヶ問題」については、入力者・校正者が底本通りに入力しても、富田倫生氏が勝手に改変し、それに抗議すると、俺様が決めたことに問答無用で服従しろ嫌なら出ていけとのたまうわけ。

自分の都合の悪いことは無視という、富田氏の態度は相変わらず。

>富田倫生 @aobeka
>【青空文庫便り】皆さん。青空文庫のファイルには、誤りがあります。具体的に、どこと指定していただければ、確認し、直せます。先立って、底本と照合していただけると助かります。どうぞ、ご指摘を。改善は、私たちの心からの願いです。

タイトルRe: 「青空文庫」はアブナイ
記事No5437
投稿日: 2012/12/25(Tue) 11:46:07
投稿者ブレンドコーヒー
「青空文庫」はアブナイから引用

昨日から、多くの誹謗中傷脅迫メールがきていて、少しまいっています。正直、もう、「青空文庫」とは関わりたくないです。(中略)たぶんこういうのって、教祖様のあずかり知らぬところで末端の信者が勝手に暴走している、ということだと思いますが。それか、アンチ青空文庫の人のいやがらせか。どっちにしろ、かなりひどい内容で、今こうやって冷静ぶって書いてますが、奥歯ギリギリしてます折れそうです。)

こういうのって、この人にかぎったことじゃないです。青空文庫を批判したら、いやがらせや誹謗中傷、脅し、いろいろなことをやってきます。こういう陰湿な恫喝者的サポーターに支えられているということも青空文庫の歴史本に刻み込んで欲しいネ。

タイトルケヶ問題
記事No5440
投稿日: 2013/01/02(Wed) 19:44:49
投稿者土屋
> 富田倫生‏@aobeka
> 【青空文庫便り】@横から失礼。まず文字の実態に即して、片仮名のケのような形で、コ、カ、ガと読み分けるものは、漢字と考えました。次に文字コードに移って、JIS X 0208:1997規格票は、その字を5-86(ヶ)にあてていると読みました。 @titoi2 @koueihei

富田氏だけの異常な解釈で、明白な誤りです。
JISは5-17「ケ」は片仮名ケで、5-86「ヶ」は小書き片仮名ケである、と規定しています。
また、JISは文字の意味や用途を定義しないと宣言しており、
「コ・カ・ガ」と読む用途の字を5-86(ヶ)にあてているという富田氏の解釈は、JISの記述と矛盾します。

JISは工業規格であり、工業製品を作るための仕様書です。JISの規定は、
 5-17のコードが与えられたら、片仮名ケの「ケ」を表示し、
 5-86のコードが与えられたら、小書き片仮名ケの「ヶ」を表示する、そういう装置を作りなさい、
と装置の“メーカー”に求めているのであって、その字を装置の“利用者”がどう使うかは、JISの権限外のことです。
利用者が「一ケ月」「龍ケ崎」と書くことに、JISがケチをつけるということはあり得ません。

> 富田倫生‏@aobeka
> 【青空文庫便り】A作業中に生じたある疑問をきっかけにメーリングリストで検討を重ねる中、こうした立場でこの字をみるべきだろうと考える人が優勢となり、それにそって作業方針をたてました。 http://www.aozora.gr.jp/KOSAKU/small_or_large/guide_line.html … @titoi2 @koueihei

「こうした立場が優勢となった」という見解にも富田氏のごまかしがあるのですが、その話はまたいずれ。

> 富田倫生‏@aobeka
> 【青空文庫便り】B同規格票の「解説 3.14」の記述、 > http://attic.neophilia.co.jp/aozora/task/small_or_large/2007_list.html#nyuryoku … 原案作成委員会WG2芝野耕司委員長の編んだ字典の記述からみて、この方針は間違っていないと私は思います。 http://attic.neophilia.co.jp/aozora/task/small_or_large/2007_list ..... characters … @titoi2 @koueihei

これが富田氏のペテンであることは、何度も繰り返し指摘しています。
http://book.geocities.jp/oroorowalk/ke_noyoni.html

JISの規定ではない「解説」の記述をとり上げて「ヶ」は漢字だと主張し、
JISの規定で「ヶ」を片仮名に分類し、KATAKANA LETTER SMALL KE という名前をつけていることは無視するというのは、ご都合主義というほかありません。

> 富田倫生‏@aobeka
> 【青空文庫便り】Cこれが、青空文庫の「ケヶ問題」と言われているものです。「芝野さんはどう判断しているか直接聞きたい」という求めが反対する人たちからあって、講演をお願いしたりもしました。 http://www.aozora.gr.jp/shibano/ @titoi2 @koueihei
> 富田倫生‏@aobeka
> 【青空文庫便り】D話の流れとしては、JIS X 0208を作る時に、漢字であるものを片仮名においてしまった。1997改訂時にそれは誤りで、漢字は5-86(ヶ)だとした。だから、文字コードとしては、コ、カ、ガと読むものは、「ヶ」。 @titoi2 @koueihei

まるで、芝野氏がそんな話をしたように書いていますが、富田氏の捏造であって、芝野氏はそんなこと全く言っておりません。
芝野氏が言ったことは、芝野氏自身がまとめている通り、
hhttps://sites.google.com/site/shibano/aozora-bunko-kouen-shiryou
Googleの日本語出現頻度データで、「一ヶ月/一ケ月」「阿佐ヶ谷/阿佐ケ谷」のような(ヶ|ケ)を含む用例を抽出したら、
「ヶ」の方が多かったから多数決で「ヶ」の勝ち、ということでしかありません。
芝野氏の話は、JISの規定とも、「底本忠実」の青空文庫の方針とも、何の関係もありません。

> 富田倫生‏@aobeka
> 【青空文庫便り】Eただし、タイポグラフィーの世界では、ケに似た漢字は、並みにも小さくも作られてきた。今も、「大きく」の求めはあるだろうし、こたえるには「ケ」をあてるのだろう。である以上、この字に対する違和感と混乱は、なお続く気がします。 @titoi2 @koueihei

それを混乱というのなら、人によって「フイルム/フィルム」と書くのだって混乱です。
「ケに似た漢字は、並みにも小さくも作られてきた」のは表記の揺れの問題であって、ケヶに限ったことではありません。

> 富田倫生‏@aobeka
> .@titoi2 「いったん名前をつけて分類した以上、その規格における当該文字は、名前の表すものだ」とする立場があろうかと思います。これに関連することを、小林龍生さんが「ユニコード戦記」で書いておられます。文字コード規格における名前とは、「じつは何の意味もない」のだと。

これも小林氏が言ってることをねじまげて、自分の都合のいいように解釈しているだけです。
仮に「ヶ」の「KATAKANA LETTER SMALL KE」という名前に意味がないのだとしても、「片仮名」に分類していること、には規格上の意味はあります。
そうでなければ、JISが
 3-33「A」を「ラテン文字」に分類して「LATIN CAPITAL LETTER A」という名前をつけ、
 6-01「Α」を「ギリシア文字」に分類して「GREEK CAPITAL LETTER ALPHA」という名前をつけていることも
「じつは何の意味もない」ことになり、それも富田氏の主張と矛盾します。

> 富田倫生‏@aobeka
> .@titoi2 青空文庫の論議で、「コ、カ、ガと読み分けるものが、表音文字か? 漢字だろう」という話は出ました。ただ、方針とすると決めたのは、1997規格票が「漢字。この規格では5-86」と書いていると判断したからです。規格のよりどころは規格票だと。しつこくてすみません。

繰り返しますが、JIS規格票にそんなことは一行たりとも書いてありません。富田氏のデマです。

タイトルRe: ケヶ問題
記事No5441
投稿日: 2013/01/02(Wed) 20:02:41
投稿者土屋
> ちいといつ@昼寝部‏@titoi2
> @aobeka ありがとうございます。ヶについては色々な解釈があると思います。ただ、既に片仮名と分類されているコードを用いる上では、本来の意味はともかく片仮名として扱うのが自然だと思います。私のアプリでは漢字として扱えるようにただいま実装中ですが @koueihei

「既に片仮名と分類されているコードを用いる上では、本来の意味はともかく片仮名として扱うのが自然だと思います。」
普通の神経を持っていたら、当然そう思うでしょうね。

> ちいといつ@昼寝部‏@titoi2
> @aobeka ヶが漢字なのか片仮名なのかは解釈次第というのが私の見解です。ならばスタンダードに従っておいたほうがトラブルが少ないというのがソフト屋としての経験論です。ですが、特にこだわりがあるわけでは無いので青空文庫では漢字とみなすという決めがあるなら従います。

一般論として「ヶ」にいろいろな解釈があるとしても、
JISの解釈に「いろいろ」はありません。JISの規定が“解釈次第”だったら標準規格の役割を果たせません。
JISでは「ヶ」は小書き片仮名ケです。この規定は、小さな「ヶ」を表示しなさい、とパソコンやプリンタなどのメーカーに求めているのであって、利用者の用途を制限するものではありません。