文字コード統一スレ 1文字目 / プログラム(PC等)-2ちゃんねる過去ログ倉庫

Tweet Follow us
ロゴtop 辞書 カクテル 科学 Web制作 URL短縮 写真素材 2ch倉庫  more≫ 
バナー
板リスト全部 1- 最新100
1 とりあえず立ててみた 投稿日:05/02/24 00:07:38
プログラムにおける文字コードの取り扱いについて議論する統一スレッド
です。

ほぼ前スレ
【UTF8】文字コード変換【SJIS】
http://pc5.2ch.net/test/read.cgi/tech/1063177450 ロゴ

参考ホームページ
Unicode Home Page
http://www.unicode.org/
Java Character Encodings
http://www.ingrid.org/java/i18n/encoding/
euc.JP: tech docs, BeOS tools
http://euc.jp/
ISO-IR - 2.8.1 Coding systems with Standard return
http://www.itscj.ipsj.or.jp/ISO-IR/2-8-1.htm
ISO-IR - 2.8.2 Coding Systems without Standard return
http://www.itscj.ipsj.or.jp/ISO-IR/2-8-2.htm
475 デフォルトの名無しさん [sage] 投稿日:2005/10/18(火) 11:56:23
Unicode(UTF-8)…ASCIIの拡張
GB18030…GB2312(EUC)の拡張
TRONコード…JIS X 0208(GLに割り当てた場合)の拡張
みんな自分が可愛いんですね(当たり前か)
476 デフォルトの名無しさん [sage] 投稿日:2005/10/18(火) 14:19:29
>>474
登録例は「芦」で「芦田さんは芦屋のお嬢様だ」ときたわけですね。
これは、提案者のAdobeにとっては
> AJ1-6をUnicodeで符号化するために
という目的があるとして、内容は
> Variation Seqeuncesの登録制度の標準化
として異体字を扱うために汎用的に利用できるものと理解していいんでしょうか。
477 デフォルトの名無しさん [sage] 投稿日:2005/10/18(火) 14:49:08
cp932・・・Shift_JISの横領
自分以外が憎いのさ!
478 デフォルトの名無しさん [sage] 投稿日:2005/10/18(火) 15:56:12
>>476
そうみたい。TRの規定を満たせば理論上は誰でも登録できるはず。
具体的な目的がちゃんとあるから、Language Tagみたいに申し訳程度に
規定しといて事実上誰にも使われないようなものにはならないでしょう
>>477
Shift_JISってもともとMicrosoftが作ったんじゃなかったっけ?
後から互換性がないようにJISでシフト符号化文字集合を規定しておいて
「MSのシフトJIS」は附属書1と互換性がないとか言われても困るような。
独自拡張として放っておかれたままのほうがまだマシだったかも
479 デフォルトの名無しさん [sage] 投稿日:2005/10/18(火) 17:21:39 480 デフォルトの名無しさん [sage] 投稿日:2005/10/18(火) 21:10:09
http://ja.wikipedia.org/wiki/%E3%83%8E%E3%83%BC%E3%83%88:Shift_JIS
> シフトJISはアメリカ製ソフトの日本語化に適していたので、

http://www.iana.org/assignments/character-sets でいうところの
JIS_X0201の延長線上で、JIS X 0208の漢字を使うのに適していたので、

とした方が性格だろうな。
半角仮名(JIS X 0201 Kana)のみはそれ以前から使えていたわけだから。
481 デフォルトの名無しさん [sage] 投稿日:2005/10/18(火) 21:11:48
それから、アスキーの担当者が昔語りしているのがどこかにあるはず。
fj.kanjiでもうpされていたような気がする。
482 デフォルトの名無しさん [sage] 投稿日:2005/10/18(火) 21:20:04
>>480
「アメリカ製ソフトの日本語化に適してい」るのは圧倒的にEUCだからなあ。
半角カナの呪縛が大きいんだろうな。

しかし文字コードみてると、互換性を錦の御旗にレガシーなものをひっぱると
後々に禍根を残すだけだねまったく。
483 デフォルトの名無しさん [sage] 投稿日:2005/10/18(火) 21:42:41
当時は階層ディレクトリの区切り文字に \
(つーかISO 646 invariantじゃない文字)を使う変態なOSなんてなかったから
ここまで問題になるとは思っていなかったようだ。
つーかそこはWikipediaだから直接なおしに行けばいい
484 デフォルトの名無しさん [sage] 投稿日:2005/10/18(火) 21:46:36
何に比べて「アメリカ製ソフトの日本語化に適していた」のかが書かれていないんだな。
おそらくJIS X 0208を単独の符号化文字集合として使ってGLに割り当てた場合だろう
(実際PC-9801のテキストVRAMはそんな構造してたし)。
EUCはシフトJISの反省に立って作られた符号化方式だからシフトJISより改善されてる
のはある意味当たり前だ
485 デフォルトの名無しさん [sage] 投稿日:2005/10/18(火) 22:30:33
>>483
'が2byte目に来たらPascalのリテラル文字列で困るんじゃないか?
# Cの\だってそうだけど、あまり一般的でなかったからPacalにした。
# もちろんmulti byte文字を理解しない8bit throughの処理系の話。

>>484
EUCは、ISO 2022が出た時には準備万端だぞ?
JIS X 0208出た時には問題なしだろ。(それどころかC6226の頃かも)
486 デフォルトの名無しさん [sae] 投稿日:2005/10/18(火) 22:33:03
>>484
> 何に比べて「アメリカ製ソフトの日本語化に適していた」のかが書かれていないんだな。

いや、一番重要だったのは、既にあるJIS X 0201 Kanaを、
GRに割り当てたことを仮定しているプログラム/データ資産のはず。

PC-8001上のN-Basicで書かれたプログラムなど。

これを捨てて良ければ、EUC-JP相当のもので良かった。
487 デフォルトの名無しさん [sage] 投稿日:2005/10/18(火) 22:48:43
>>485
GRに割り当てるのが正当化されたのは
もっと後のISO 2022の改訂からじゃなかったっけ?
複数バイト図形文字集合はG0=GLにしか割り当てられなかったはず
488 デフォルトの名無しさん [sage] 投稿日:2005/10/18(火) 22:51:47
すくなくともX 0208より後なのは確実。X 0208とGB 2312のエスケープシーケンス
だけ他の複数バイト図形文字集合より短いのは、まさに当時
> 複数バイト図形文字集合はG0=GLにしか割り当てられなかったはず
だったからで、この制限がなくなってからも互換性のためX 0208の指示シーケンス
は1バイト短いまま。
489 デフォルトの名無しさん [sage] 投稿日:2005/10/18(火) 22:55:31
> 'が2byte目に来たらPascalのリテラル文字列で困るんじゃないか?
'はシフトJISの2バイト目に来ないので困らないと思う。
(ISO 646 invariant云々は不適切だったので忘れてくれ)
つーか当時困らなかったからこれでいいと思って場当たり的に決めて
今になって困ってるわけだろ。
なんかどっかで聞いた話だな。きっと2バイトで足りるに違いな(ucs
490 デフォルトの名無しさん [sage] 投稿日:2005/10/18(火) 23:04:55
JIS C 6228-1975
JIS C 6228-1984 のちにJIS X 0202-1984
JIS X 0202-1991 のちにJIS X 0202:1991
JIS X 0202:1998
491 デフォルトの名無しさん [sage] 投稿日:2005/10/18(火) 23:30:47
> 複数バイト図形文字集合はG0=GLにしか割り当てられなかったはず
なんでそんな仕様だったかというと、単独で使うことを想定してたんだろう。
(たしかそのためにC 6226の1区はASCIIと同じ並びにするという話もあったはずだが
どこ行ったんだ)
ASCIIの文字を全部含んでいればASCIIを使う必要はないと。
現実にはその見通しは甘かったばかりか重複符号化に苦しめられてるわけだが。
492 デフォルトの名無しさん [sage] 投稿日:2005/10/19(水) 00:18:06
>>490
変更があったのなら1984だろうね。1991ってことはないから。
493 デフォルトの名無しさん [sage] 投稿日:2005/10/19(水) 14:24:54
安岡孝一氏が日本での文字コードの歴史を書いている中で、
「シフトJIS の誕生」についても触れている。
きっちりと資料に当たって書かれている所がいい。

「日本における最新文字コード事情」
http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/publications/ISCIE2001.pdf
494 デフォルトの名無しさん [sage] 投稿日:2005/10/19(水) 15:45:23
>>493
文献のところの吉田茂(内閣告示)の吉は、
士と土が混在しているけど、これはオリジナルに合わせてるのかな。
495 デフォルトの名無しさん [sage] 投稿日:2005/10/19(水) 17:50:27
鋭く細かい所に気づくなあ。面白い。確かに使い分けられているね。
http://www.aozora.gr.jp/kanji_table/touyoukanji_hyou/
ここの後の方に、当用漢字表のとき「土」になっている官報の画像版があって
確認できる。その通りにしたんだろう。
当用漢字字体表の時は「士」に変わったわけかな。
吉田茂の「吉」の字のエピソードを確かどこかで読んだけど、
あれは「JIS漢字字典」だったっけ。
496 デフォルトの名無しさん [sage] 投稿日:2005/10/19(水) 18:44:58
「JIS漢字字典」のコラム3、吉田茂の決断だね。
読売新聞社刊「日本語の現場」第二集の逸話だって。
497 デフォルトの名無しさん [sage] 投稿日:2005/10/19(水) 18:50:40
>>495
こんなところに取り込んだ画像があったんだね。
498 デフォルトの名無しさん [sage] 投稿日:2005/10/19(水) 22:56:17
>>492
1991はSSの後の1文字をGRにすることを認める変更じゃないの。
その前年に補助漢字ができてるから。
しかしJIS X 0208改訂のきっちり1年後に必ず後を追うように改訂してるな
499 デフォルトの名無しさん [sage] 投稿日:2005/10/20(木) 01:43:09
> AJ1-6をUnicodeで符号化するために
のソース。
http://www.imug.org/pastevents05.html#Jnames
500 デフォルトの名無しさん [sage] 投稿日:2005/10/20(木) 05:03:27
>>498
SSの後の1文字がGRにできるようになったのは1998年の規格から。
501 デフォルトの名無しさん [sage] 投稿日:2005/10/20(木) 08:59:11
>>499
ソース提供、ありがとう。
TRにないみたいなので、どこかなと思ってた。
502 デフォルトの名無しさん [sage] 投稿日:2005/10/20(木) 20:24:00
>>500
なんと、そんなに新しかったのか。
それまで公式にはEUC-JPのSS2/SS3の使い方はISO 2022に適合してなかったのね。
503 デフォルトの名無しさん [sage] 投稿日:2005/10/20(木) 21:16:31
>>501
さすがにTRにそんなことはモロに書かないよ
表向きの目的を掲げるだけでしょ
504 デフォルトの名無しさん [sage] 投稿日:2005/10/20(木) 22:00:26
あのさ俺の苗字ってハシゴ高なわけだけど

郵便物とか封書とかでハシゴ高印字してくるの
水道局だけなんだ。話はそんだけ
NTTは使ってないだけか?水道局はフォントがあるのか?
郵便局は出せるだろうけど、関係を作る方法が思いつかない
ハシゴ高廃止してもらって構わないんだけど、
通帳とか免許とか1文字だけ手書きなのうんざり
505 デフォルトの名無しさん [sage] 投稿日:2005/10/20(木) 22:27:27
私の名前には巳が含まれるのだが、某証券会社では已が使われていた。
その後その証券会社が吸収されても已のままだったのにさらに吸収されたら正しく巳になった。
さて、字形がおかしかったのか、そもそもコードもおかしかったのか……
506 デフォルトの名無しさん [sage] 投稿日:2005/10/20(木) 22:59:37
聡なんだが、不動産屋と契約したら、
不動産屋の死にかけのババアが勝手に聰で契約書作っていた。
不動産への登録もこっち。
更新の時に、前の人年寄だから漢字違っているけれど、
# くたばったババアはあちこちで勝手に旧字体にしていたらしい。
延長なのでこのままにしてください、ってそのままだったのが、
いつの間にか正しいのに変っていた。しかしこれ文字コード全然関係ない…
507 デフォルトの名無しさん [sage] 投稿日:2005/10/21(金) 00:34:07
旧字旧かな厨氏ね
508 デフォルトの名無しさん [sage] 投稿日:2005/10/21(金) 01:00:54
どこに旧字旧かな厨がいるんだよ
意味もなく煽る藻前が(ry
509 デフォルトの名無しさん [sage] 投稿日:2005/10/21(金) 09:16:13
厨じゃなくて婆な
510 デフォルトの名無しさん [sage] 投稿日:2005/10/21(金) 09:25:39
http://www004.upp.so-net.ne.jp/hitosen/ujina/ujina93.html
> 旧字体を通用字体に変更したい場合は、本籍地の役所で「文字更正の申し出」をすれば、
> 通用字体に変更することが可能です。手続はものすごく簡単です。

「文字更正の申し出」に当てはまらない氏名の変更は、
http://homepage1.nifty.com/lawsection/tisikibako/ujinohenkou.htm
> 家庭裁判所に「氏の変更の許可申立書」を提出します。
511 デフォルトの名無しさん [sage] 投稿日:2005/10/21(金) 10:54:21
登記のための法務局提出書類にサインするとき、司法書士に
「斎」=「齋」、「斉」=「齊」、しかし「斎」≠「斉」、「齋」≠「齊」と言われた。
本当は「齋」なんだけど、めんどくさいから「斎」ですませた。
登記簿は「齋」になってた。
512 デフォルトの名無しさん [sage] 投稿日:2005/10/21(金) 11:21:41
その時、使った実印は、オヤジが作ってたやつで「斉」だったが、
印鑑登録に字体は関係ないということか。
これ文字コードに関係あるのかな。
513 デフォルトの名無しさん [sage] 投稿日:2005/10/21(金) 14:37:59
>>509
しかも既に亡くなっているし。
514 デフォルトの名無しさん [sage] 投稿日:2005/10/21(金) 15:28:49
>>511
字源的には書士の言う通り。
JISとしては四つとも別の字。

>>511は特に"齋藤"とは書いてないが、「JIS漢字字典」の人名音訓を調べると、
済藤、斎藤、剤藤、斉藤、濟藤、齋藤、薺藤、齎藤、齊藤(区点順)
とJISの範疇内でもこれだけのサイトーの別があるらしい。
515 デフォルトの名無しさん [sage] 投稿日:2005/10/21(金) 16:44:53
「人名外字1500V3」フォントの所をみると

●異体字のバリエーションもこんなに豊富です!
・斉藤の「斉」→31種類
516 デフォルトの名無しさん [sage] 投稿日:2005/10/21(金) 22:41:33
>>511
「斎藤」は元来、藤原一門の神事担当職と言ったニュアンスの伝統的な苗字。
「一斉」の「斉」には、「斎藤」の「斎」のような「さい」という音が元々はない。
勿論、「斎」のように神事を扱うという意味合いもない。

>>512
実印は明らかに読みが違うもの以外は苗字がなく名前だけでも大抵のものが登録できる。
例えば「阿久津美莉」さんが「_」なんて実印を作ることもできる。
517 デフォルトの名無しさん [sage] 投稿日:2005/10/21(金) 22:49:44
今昔文字鏡の「斉」は68種。
518 デフォルトの名無しさん [sage] 投稿日:2005/10/21(金) 23:29:36
「斎」と書いて「キンジェー」と読むらしいが、タイの方である期間ヴェジな生活を送るという
華僑由来のイベントがあるらしい。激しくスレ違いだが。
519 デフォルトの名無しさん [sage] 投稿日:2005/10/21(金) 23:30:45
で、その68種類の文字を区別しなければならないんですか?
520 デフォルトの名無しさん [sage] 投稿日:2005/10/22(土) 00:30:21
他人事で済む奴はいつもそう言うんだ
521 デフォルトの名無しさん [sage] 投稿日:2005/10/22(土) 01:16:01
おれには斉以外認識できない
522 デフォルトの名無しさん [sage] 投稿日:2005/10/22(土) 03:02:47
中国語がTraditional ChineseとSimplified Chineseで別個の文字集合になっているように、
日本語もTraditional JapaneseとSimplified Japaneseで別個の文字集合にすればよかったんだ。

といい加減なことを言ってみるテスト。
523 デフォルトの名無しさん [sage] 投稿日:2005/10/22(土) 05:54:04
>>520
むしろ他人事で済まされなかったらたまらんからだろ
済はさんずい+済なのになんで68種類ないんですか? とか
(こたえ: あまり苗字に使われない文字だから)
524 デフォルトの名無しさん [sage] 投稿日:2005/10/22(土) 05:54:47
> さんずい+済
さんずい+斉orz
525 デフォルトの名無しさん [sage] 投稿日:2005/10/22(土) 10:15:32
>>522
ソ連とアメリカが、東日本と西日本に分割していたら、そうなったかもね。


526 デフォルトの名無しさん [sage] 投稿日:2005/10/22(土) 10:42:17
唐突なやつだな。
ソ連なんて地続きの樺太でもさんざんてこずって、北方領土をかすめとるのが
せいぜい、北海道にはとりつけもできなかったんだから分割なんてありえない。
527 デフォルトの名無しさん [sage] 投稿日:2005/10/22(土) 14:40:07
正直「社長の名前を一発で変換できるIME」みたいなしょーもない話だと思う
528 デフォルトの名無しさん [sage] 投稿日:2005/10/22(土) 15:49:02
日本の漢字って中国からパクったわりに発音どれもあってなさそうだよね、
日本らしくする為に名前全部ひらがな表記とかすればいい
529 デフォルトの名無しさん [sage] 投稿日:2005/10/22(土) 18:35:02
バカなのか釣りなのか
530 デフォルトの名無しさん [sage] 投稿日:2005/10/22(土) 23:43:48
>>528
訓読みって知ってる?
531 デフォルトの名無しさん [sage] 投稿日:2005/10/23(日) 09:03:09
中国人も自国の文字のわりに発音どれもあってなさそうだわな。
532 デフォルトの名無しさん [sage] 投稿日:2005/10/23(日) 09:12:33
表意なのに形すら違うからな。
533 デフォルトの名無しさん [sage] 投稿日:2005/10/23(日) 22:11:11
>>530
きっと訓読みがない国の人なんだよ
534 デフォルトの名無しさん [sage] 投稿日:2005/10/24(月) 01:51:29 535 デフォルトの名無しさん [sage] 投稿日:2005/11/06(日) 13:08:33
新人名用漢字の「たまひよ」名前ランキング
http://women.benesse.ne.jp/hakase/sitemap/ranking.htm
536 デフォルトの名無しさん [sage] 投稿日:2005/11/07(月) 20:24:40
人気の漢字を見ると、凜と凛の入力ミス多発の予感
537 デフォルトの名無しさん [sage] 投稿日:2005/11/08(火) 05:32:18
「同一の字種」だからどっちでもいいのでは?
つうかよくわからん「同一の字種」。
538 デフォルトの名無しさん [sage] 投稿日:2005/11/08(火) 09:02:17
「1字種1字体の原則は維持するが、
例外的に1字種について2字体を認めることを排斥するものではない。」
よくわからんねえ。どっちでもいいんだか、区別せよと言うんだか
539 デフォルトの名無しさん [sage] 投稿日:2005/11/08(火) 14:49:15
そもそも凜は凛の正字だからこちらの字体が人名用漢字として登録されたけど、
誰も使わないものだからなし崩しに凛も新人名用漢字として認められるようになった。
IMEから凜を簡単に入力できないというのも大きかったと思われ
540 デフォルトの名無しさん [sage] 投稿日:2005/11/08(火) 16:25:27
    _  ∩
  ( ゚∀゚)彡 包摂!包摂!
  (  ⊂彡
   |   | 
   し ⌒J
541 デフォルトの名無しさん [sage] 投稿日:2005/11/08(火) 16:37:04
でもって、この場合は「康熙字典」の字体の方が
俗字とされる「凛」だったりするわけで、
こっちが広く使われる由来だったりするんだろうか。これも分かりにくいなあ。
542 デフォルトの名無しさん [sage] 投稿日:2005/11/08(火) 17:06:26
http://www.taishukan.co.jp/kanji/qa_shape.html#Q3048
こんな所にQ&Aがあった。
>「凛(りん)」の右下の部分が「示」ではなく「禾」になっている字が、パソコンで出ないのですが、どうしてでしょうか?
543 デフォルトの名無しさん [sage] 投稿日:2005/11/08(火) 17:07:41
http://jvn.jp/jp/JVN%2318282718/006082/index.html
正規化しなきゃしないでIDNの脆弱性だフィッシングだと
何をやっても文句を言われて大変ですなあ
544 デフォルトの名無しさん [sage] 投稿日:2005/11/08(火) 17:12:36
>>542
IMEが変換しない(少なくとも当初の)理由は83JIS以前の機器で字が出ないから
「誤って」使われないようにするためだったと思われ
実際にはJIS(X 0208)に収録されている文字でさえこうなんだから
Shift_JISじゃ出せない文字なんてよほど強力に使用を推進しなきゃ
普及させられるわけないよなあ
545 デフォルトの名無しさん [sage] 投稿日:2005/11/08(火) 18:58:48
もっともだ。この先も、90JISまでのフォントしか持っていない機器がある以上、
Vistaに新フォントが搭載されようが、JISX0213:2004の新しい文字なんて、
デフォルトの設定のままでポンポン出てくるなんて、無理な話だってことね。
546 デフォルトの名無しさん [sage] 投稿日:2005/11/08(火) 22:34:39
MicrosoftはIMEのデフォルト設定で印刷標準字体を優先して出すと言ってるけどね。
「2004JISでカモメの字体が訂正」とか不勉強にもほどがある記事が大真面目で
IT系のニュースサイトにすら掲載されるんだから
どれだけ鷗を使えることが知られていないか分かろうってもんだ
547 デフォルトの名無しさん [sage] 投稿日:2005/11/09(水) 05:14:37
堯槇遙および凛が人名用漢字に追加されたのに瑤と煕が追加されなかったのは
なんで?
548 デフォルトの名無しさん [sage] 投稿日:2005/11/09(水) 05:32:30
南堂さんが圧力をかけなかったから。
549 デフォルトの名無しさん [sage] 投稿日:2005/11/09(水) 06:35:10
妄想を鵜呑みにしてる奴発見
550 デフォルトの名無しさん [sage] 投稿日:2005/11/09(水) 07:31:43
>>547
単純に頻度が足りなかっただけ
551 デフォルトの名無しさん [sage] 投稿日:2005/11/09(水) 07:43:06
何しろ頻度が足りていれば
糞,屍,呪,癌,姦まで追加の検討対象になったくらいだし
552 デフォルトの名無しさん [sage] 投稿日:2005/11/09(水) 08:58:08
パブリックコメントに出したら、糞,屍,呪,癌,姦なんて入れるな!
という批判が多く出たおかげで、やっと削除できたというほどに
「常用平易」なら入れろという最高裁判決に困ってたみたい
553 デフォルトの名無しさん [sage] 投稿日:2005/11/10(木) 01:27:27
俺は「常用平易なら入れろ」に賛成だけどな。
意味的に不適切な字を削除しても無意味なことは
あくま君問題の結末が証明していると思うんだが。
554 デフォルトの名無しさん [sage] 投稿日:2005/11/10(木) 09:58:09
常用平易でも除外されてる文字があるのが謎
555 デフォルトの名無しさん [sage] 投稿日:2005/11/10(木) 16:01:55
南堂さんが(ry
556 デフォルトの名無しさん [sage] 投稿日:2005/11/10(木) 18:43:07
もうそのネタは秋(ry
557 デフォルトの名無しさん [sage] 投稿日:2005/11/10(木) 20:20:28
「糞」や「尻」を入れるんなら同程度に頻度の高い「肛」も入れろ、
第二水準差別するなゴルァという俺のコメントは黙殺されたけどな。
558 デフォルトの名無しさん [sage] 投稿日:2005/11/10(木) 23:51:35
委員「また、『やらないか?』か!」
559 デフォルトの名無しさん [sage] 投稿日:2005/11/11(金) 00:54:57
> 同程度に頻度の高い
の根拠が不明
560 デフォルトの名無しさん [sage] 投稿日:2005/11/11(金) 07:23:31
膣と肛門が同程度の頻度
根拠は不明
561 デフォルトの名無しさん [sage] 投稿日:2005/11/11(金) 13:01:36
>膣と肛門が同程度の頻度
両刀使いだから
562 デフォルトの名無しさん [sage] 投稿日:2005/11/11(金) 14:10:21
多くの文字コードに対応した外国産のWinアプリを使用しているのですがこのアプリで
SJISを指定して「ゾ」の文字を保存すると「ソ」、「 ] 」、16進でいうと 0x83, 0x5c, 0x5d と
3バイトで保存されてしまうのです。SJISの文字コード表でみると「ゾ」は、0x83,0x5d の
ようなのでこれはバグなのでしょうか?メモ帳などでこれを開くと「ソ」、「 ] 」と2文字で
表示されます。
563 デフォルトの名無しさん [sage] 投稿日:2005/11/11(金) 14:18:53
転はどうですか?
564 562 [sage] 投稿日:2005/11/11(金) 16:30:44
>>563 レス遅れました。
「貼」「 ] 」の2文字(3バイト)になりますね。2バイト目が0x5dの文字がダメってことですか。
でも(当たり前かもしれないが)このアプリで読み込めばちゃんと「ゾ」とか「転」とか表示
されるんですよね。そもそも3バイトにエンコードってありなんでしょうか?
565 デフォルトの名無しさん [sage] 投稿日:2005/11/11(金) 16:48:49
どういう訳か知らんが、閉じブラケット ] (0x5d) の手前に
バックスラッシュ \ (0x5c) を入れたいんだろうな

もちろんこんな処理は不正
566 562 [sage] 投稿日:2005/11/11(金) 17:00:49
>>565
なるほど0x5cは \ でしたか。そのアプリが ] の前に \ を入れたい
理由は分かりました。やっぱりアプリのバグのようです。
ありがとうございました。
567 557 投稿日:2005/11/11(金) 23:40:44
厳密に言えば、「尻」が圧倒的に多くて使用度数 3279 回 (1422位)。
続いて「肛」の 811 回 (2208位) と「糞」の 773 回 (2236位) がほとんど
同じ。上位3000位まで取って候補を選定したんだから、ずいぶん上位に
入ってることが分かると思う。
これは、表外漢字字体表の選定にも今回の人名用漢字表の選定でも決定的な
役割を果たした(新)凸版調査の順位そのものなので >>561 の推測は間違い。
ちなみに、人名漢字のパブコメは、数が多すぎて、委員は法務省のまとめを
見ただけで、個別のコメントに目を通してはいないだろうと思う。

さらに言うと、驚くべきことに「膣」(399回、2623位)よりも「腟」(820回、
2197位) の方が多かったりする。それなのに印刷標準字体が「膣」であると
いうことに、この問題を理解する鍵がある。
568 デフォルトの名無しさん [sage] 投稿日:2005/11/12(土) 01:59:37
第二水準差別するなってそういう意味か。
第二水準の文字全部入れろとか言うよくいるアホかと思った
569 デフォルトの名無しさん [sage] 投稿日:2005/11/12(土) 08:56:48
とりあえず「腟」は解体新書を出すときに作られた字だと言う話を思い出した。
570 デフォルトの名無しさん [sage] 投稿日:2005/11/12(土) 09:26:40
腟=肉+室=にくむろか。
エロイな。
571 デフォルトの名無しさん [sage] 投稿日:2005/11/12(土) 11:34:54
>>553
> 意味的に不適切な字を削除しても無意味なことは
> あくま君問題の結末が証明していると思うんだが。
糞・尻が使えなくても久素・史理で「くそ・しり」と読ませるのは
許されるのだから無意味といったこと?
572 デフォルトの名無しさん [sage] 投稿日:2005/11/12(土) 11:39:07
かな文字もあるしな。
573 デフォルトの名無しさん [sage] 投稿日:2005/11/12(土) 11:57:25
ほとんど同意してしまう部分があるけど、
人名用漢字として選定する権限と責任のある仕組みの上では、
漢字は選定できても、読みは制限できないという点で別問題かも
とは思ってしまう。
もっとも人名用漢字の制度を設ける必要あるかないかに直結するかな。
574 デフォルトの名無しさん [sage] 投稿日:2005/11/13(日) 12:07:48
本当は怖い親権の濫用
575 デフォルトの名無しさん [sage] 投稿日:2005/11/13(日) 13:49:27
地名って一水、二水の範囲で網羅してるの?
576 デフォルトの名無しさん [sage] 投稿日:2005/11/13(日) 23:52:13
行政地名は網羅してるけど
地名はそれだけではない罠
577 デフォルトの名無しさん [sage] 投稿日:2005/11/14(月) 02:26:50
年賀状の宛先が書けないケースもあるってこと?
それとも、歴史上の地名とかの話?
578 デフォルトの名無しさん [sage] 投稿日:2005/11/14(月) 07:28:54
大たわ(山+定)とか。JISどころかCJK ExtBにもGT書体にもない。
年賀状に書く必要のある地名なのかどうか知らないけど。
579 デフォルトの名無しさん [sage] 投稿日:2005/11/14(月) 12:37:01
山にはよくあるけど >大たわ
尾根部分だから殆ど人住んでないだろーな。
山小屋なら「○○小屋」で通じるから住所いらないし。
580 デフォルトの名無しさん [sage] 投稿日:2005/11/14(月) 12:59:14
「山偏に定」と書いて「撓」の当て字とかあるな。
こういうの当て字っていうのか?
581 デフォルトの名無しさん [sage] 投稿日:2005/11/14(月) 14:37:34 582 デフォルトの名無しさん [sage] 投稿日:2005/11/14(月) 16:38:54
「タワ」って鞍部(尾根の釣り下がった部分)のことだろ?
要するに「垂れている」ってことなんだけど。(タル、タルミなど)
乢、垰とも書くよな。
道が尾根をクロスして登り下りすると峠になる。
583 デフォルトの名無しさん [sage] 投稿日:2005/11/14(月) 19:29:29
>581
すごいの見付けた

かわだ 西広門田

どーゆー配分だこれ
584 デフォルトの名無しさん [sage] 投稿日:2005/11/14(月) 20:33:41
MS IMEの人名/地名モードもATOK2005も
「かわだ」で変換できるのがさすが。難読地名の代表なのかな。
かな文字より漢字の方が多いんじゃ、ふつう配分できんだろー
585 デフォルトの名無しさん [sage] 投稿日:2005/11/14(月) 22:13:10
流石て…フツウ ヤン...
川渡(カワド)が別の読みの地名とクッツイタという説があったような。
586 デフォルトの名無しさん [sage] 投稿日:2005/11/15(火) 09:44:31
MS IMEの変換モードが「一般」だと「りん」で「凛」は出ても「凜」は出ないから、
パソコンで出ないなんて話になるんだろうけど、
「人名/地名」モードに変えればどっちも出るし、一度「凜」使えば一般モードに戻してもOK。
これもフツウ。それすらしないから「凛」が大杉。
587 デフォルトの名無しさん [sage] 投稿日:2005/11/15(火) 10:40:26
そういうわけで>>539
> なし崩しに凛も新人名用漢字として認められるようになった。
だとすると・・・
588 デフォルトの名無しさん [sage] 投稿日:2005/11/15(火) 23:07:31
JISの地名漏れ多すぎじゃね? こんなもん?
589 デフォルトの名無しさん [sage] 投稿日:2005/11/17(木) 00:13:14
個人的にはこの程度で済んでるんならかなりマシな部類だと思うが…
590 デフォルトの名無しさん [sage] 投稿日:2005/11/19(土) 03:14:33
78JISは「国土行政区画総覧使用漢字」昭和47年版の3251字をすべて収録した。
それ以後にJIS漢字にもないような難しい漢字の地名が新設されたとは思えないから
JIS漢字の地名の漏れはそのままこの資料の漏れと言っていい。
いわゆる「幽霊漢字」の多くもこの資料が典拠だし
591 デフォルトの名無しさん [sage] 投稿日:2005/11/19(土) 03:20:56
だから>>576に書いたように
> 行政地名は網羅してるけど
> 地名はそれだけではない罠
592 デフォルトの名無しさん [sage] 投稿日:2005/11/19(土) 04:10:51
俺もASCIIコード圏に生まれたかったよママン
593 デフォルトの名無しさん 投稿日:2005/11/19(土) 07:59:34
>>590
国土行政区画総覧じゃなくて日本行政区画便覧を使ってたらまた違ってたかもなぁ
594 デフォルトの名無しさん [sage] 投稿日:2005/11/19(土) 10:58:32
>>592
現代において文字コードに困らないのは結局ASCIIだけだしな
ISO-8859-Xたちもそれはそれで化け化けらしいし
595 デフォルトの名無しさん [sage] 投稿日:2005/11/19(土) 13:55:48
>>592
それは、アメリカに生まれたかったということで宜しいか?
#ヒント:ASCIIのフルスペリング

まぁ実際、英語を母国語とする英国でさえ一部文字コードがASCIIではないからねぇ。
596 デフォルトの名無しさん [sage] 投稿日:2005/11/19(土) 18:11:48
ブリテンにはスコットランドもウェールズもあるからね。
597 デフォルトの名無しさん [sage] 投稿日:2005/11/19(土) 18:14:56
ついでに言うとアメリカも今ではスペイン語人口が多い罠。
598 デフォルトの名無しさん [sage] 投稿日:2005/11/19(土) 21:14:44
ASCIIには、ユーロもポンドもないからねえ。
599 デフォルトの名無しさん [sage] 投稿日:2005/11/19(土) 22:05:10
つーかいい加減アメリカもメートル使えよな
いつまでもインチとかフィートとか言ってんじゃねーよ
600 デフォルトの名無しさん [sage] 投稿日:2005/11/20(日) 03:28:00
ASCIIにバックスラッシュが入ったのは、“/\”で and を、“\/”で or を表現したかったALGOL厨の陰謀らしい。
Latin-1に、"oeリガチャ"(フランス語で、「心臓」とかを表すのに使う。超必須)が入らなかったのは、÷を入れたかったドイツの数学者の陰謀らしい。
ちなみに、Latin-1の0xFF (y diaeresis) を使う単語は、仏語に4つしかなく、そのいずれもがほとんど一般には使われないらしい。
601 デフォルトの名無しさん [sage] 投稿日:2005/11/20(日) 03:54:33
つまり0xFFにoeリガチャを割り当てなかったフランス人ワロス、てことでFA?
602 デフォルトの名無しさん [sage] 投稿日:2005/11/20(日) 04:18:55
どこも日本みたいな過ち犯してんのかよ
だせーなー
603 デフォルトの名無しさん [sage] 投稿日:2005/11/20(日) 06:56:21
ISO-8859-1 の元になった DEC のコードでは「oeリガチャ」は確かに×÷の位置に
定義されてるね。「yダイアレシス」は今とは別の位置に定義されていて、大文字
もあったが、アイスランド語が書けるようにしようとか下手に色気を出したので、
アサッテの位置に追いだされたようだ。
604 デフォルトの名無しさん [sage] 投稿日:2005/11/20(日) 08:35:02
そして文字コード指定のない(あるいは欠けてしまった)ISO-8859シリーズは、
日本の場合より悪いことに、コンピュータによる推測が絶望的だったりする。

どいつもこいつも0x20〜0x7Fと0xA0〜0xFFを使うことに変わりはないので、
日本のように「文字コードによってはこのバイトは使わない」ということがない。
(まず使わないだろう、というヒューリスティックな推測はできるけど)


しかしどこの文字コードも主に政治の結果が色濃いのが笑えるなw
605 デフォルトの名無しさん [sage] 投稿日:2005/11/20(日) 08:47:04
Latin-1って名前もあれだよな、ドイツ語入ってんのに。
606 557 [sage] 投稿日:2005/11/20(日) 12:41:23
>>600
最近某所でそんな話を不味いノンアルコールビールを飲みながら聞いたんだが…。
607 デフォルトの名無しさん [sage] 投稿日:2005/11/20(日) 12:57:53
そこでヨーロッパ人にとってはUTF-8サイコー
判定間違えて文字化けもしないぜウホッとなるわけですよ
608 デフォルトの名無しさん [sage] 投稿日:2005/11/20(日) 14:01:01
日本は文字化け先進国
なれって怖いよねあたりまえのように数種扱い続けてる
609 デフォルトの名無しさん [sage] 投稿日:2005/11/20(日) 14:20:19
>>608
漢字ひらがなカタカナalphabetが混在する物を当たり前のように扱ってきたからかもしれんw
610 デフォルトの名無しさん [sage] 投稿日:2005/11/20(日) 14:57:13
>>607
まあそれはユーロ記号の件が一番大きいんだけどな。
それ以前にも何度か混乱していた時期があると聞いたが、どうやって乗り越えたのやら。
611 デフォルトの名無しさん [sage] 投稿日:2005/11/21(月) 23:48:16
責任の一端はTeXにあるという説を提唱してみる。
やつが余計なお世話をしなければ、いかに愚鈍なヤンキーといえども
「あれ、文字、全然足りなくね?」
と即座に気づいたであろう。
612 デフォルトの名無しさん [sage] 投稿日:2005/11/25(金) 03:59:16
ASCIIにバックスラッシュが入ったのは、R.W.Bemerが、ALGOLのand と or を使えるようにしたかったため。
彼のホームページに経緯が詳述してあったけど、1年前に癌で死んでホームページが消されてから、
そのあたりの資料も一切合財が雲散霧消してしまった。
613 デフォルトの名無しさん [sage] 投稿日:2005/11/25(金) 04:13:34
le «ÿ» est utilise en gallois et en vieux francais.
On le recontre encore aujourd'hui dans des toponymes comme «l'Haÿe-les-Roese»,
des noms comme «de Croÿ», «Louÿ», or des expressions comme «kir à l'aÿ».
Cette lettre est extremement rare et son insertion dans ISO 8859-1 est pour le moins insolite.
614 デフォルトの名無しさん [sage] 投稿日:2005/11/25(金) 08:13:17
>>612
URLは? それが本当ならwaybackmachineに残ってそうなものだが。
615 デフォルトの名無しさん [sage] 投稿日:2005/11/25(金) 08:30:02
Character histories: notes on some Ascii code positions
http://www.cs.tut.fi/~jkorpela/latin1/ascii-hist.html

ASCIIの誕生←ここの参考文献[4]に載っているかも。
http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/publications/ASCII.html
616 デフォルトの名無しさん [sage] 投稿日:2005/11/25(金) 21:06:40
>>615
> Character histories: notes on some Ascii code positions
> http://www.cs.tut.fi/~jkorpela/latin1/ascii-hist.html

そっからリンクがあったんだが、ドメイン屋にのっとられてる上に
robots.txtでwayback machineが弾かれてて軒並消滅してた。
617 デフォルトの名無しさん [sage] 投稿日:2005/11/25(金) 21:42:02
作業中だったら言ってくれよ
同じ末路たどってたゴール手前
618 デフォルトの名無しさん 投稿日:2005/11/28(月) 21:23:52
嘆や漢の右側だけの文字って文字コードはあります?できれば、旧字体のがあればいいんですけど...
619 デフォルトの名無しさん [sage] 投稿日:2005/11/29(火) 00:37:17
U+26C29にある。JIS(第4水準)やUnicodeの例示字形では新字体だけど
旧字体も包摂されてるはず
620 デフォルトの名無しさん [sage] 投稿日:2005/11/29(火) 01:12:43
般若心経は全部出るようになったんですかね
621 デフォルトの名無しさん [sage] 投稿日:2005/11/29(火) 07:38:47
もともと般若心経で JIS X 0208 になかった字は「罣」がひとつ
だけで、これは補助漢字にも X 0213 にもはいっているから
とうぜん出るでしょう。

622 デフォルトの名無しさん [sage] 投稿日:2005/11/29(火) 08:00:07
>>621
もうひとつ「埵」も X 0208 になかった字だけれど、
これも補助漢字・X 0213 の両方にある。
623 デフォルトの名無しさん [sage] 投稿日:2005/11/29(火) 09:38:26
もしかして、鳩摩羅什訳だと>>621で、玄奘三蔵訳だと>>622という違い?
624 デフォルトの名無しさん [sage] 投稿日:2005/11/29(火) 17:57:43

圭 これは?あとどうやって出したのその漢字
625 デフォルトの名無しさん [sage] 投稿日:2005/11/29(火) 18:11:20
ヒント:数値文字参照
626 デフォルトの名無しさん [sage] 投稿日:2005/12/01(木) 01:56:19
>>604
ISO-8859シリーズの判別にはEncaが使えるかもしれない。
ttp://trific.ath.cx/software/enca/

EUC-JP,KR,CNとかBig5の区別をするのに各言語の文字
出現頻度を使いたいんだが、どこかにリソースないかな?
日本語のデータはメーリングリストのログ等で準備できるんだが、
中国語、韓国語なんかはgoogleすらできないんだorz
627 デフォルトの名無しさん [sage] 投稿日:2005/12/01(木) 02:11:18
完成記念

観自在菩薩行深般若波羅蜜多時照見五蘊皆空度一切苦厄
舎利子色不異空空不異色色即是空空即是色受想行識亦復如是
舎利子是諸法空相不生不滅不垢不浄不増不減是故空中無色
無受想行識無眼耳鼻舌身意無色声香味触法
無眼界乃至無意識界無無明亦無無明尽乃至無老死亦無老死尽
無苦集滅道無智亦無得以無所得故菩提薩埵依般若波羅蜜多
故心無罣礙無罣礙故無有恐怖遠離一切顛倒夢想究竟涅槃
三世諸仏依般若波羅蜜多故得阿耨多羅三藐三菩提
故知般若波羅蜜多是大神呪是大明呪是無上呪是無等等呪
能除一切苦真実不虚故説般若波羅蜜多呪即説呪曰
羯諦羯諦波羅羯諦波羅僧羯諦菩提娑婆訶


628 626 [sage] 投稿日:2005/12/01(木) 04:38:12
2年以上前に同じことを考えた人がいた。
libcharguessというのでCJKのエンコーディングは判別可能みたい。
開発が停止しているのが残念だが、いちおう使えるのでよしとするw

ttp://sourceforge.net/projects/libcharguess/
629 デフォルトの名無しさん [sage] 投稿日:2005/12/01(木) 09:20:34
呪と咒は異体字だったのか。
630 デフォルトの名無しさん [sage] 投稿日:2005/12/01(木) 12:10:56
般若心経と並んでポピュラーな観音経(普門品第二十五)には「虫偏に元(U+8696)」
があるんだけど、X 0213から漏れてる。

  若惡獸圍遶 利牙爪可怖 念彼觀音力 疾走無邊方
→蚖蛇及蝮蠍 氣毒煙火燃 念彼觀音力 尋聲自迴去
  雲雷鼓掣電 降雹澍大雨 念彼觀音力 應時得消散
             ↑これもX 0213
631 デフォルトの名無しさん [sage] 投稿日:2005/12/02(金) 07:07:45
明治以降の日本で用例が不足してたんだろう
632 デフォルトの名無しさん [sage] 投稿日:2005/12/02(金) 07:44:33
そういや文字コードの順番ってどうやって決めたん?
633 デフォルトの名無しさん [sage] 投稿日:2005/12/02(金) 11:20:55
>>630
ちゃんとはいってる補助漢字サイコー。

仏典関係でいうと「あぬるだ」の「ヌ」がExt-A(3779)で、かつ0213からも
抜けてるんだよなあ。
634 デフォルトの名無しさん [sage] 投稿日:2005/12/02(金) 12:59:17
>>632
第一水準は音読みの順になっている。第2水準は部首順。ほかは知らん。
635 デフォルトの名無しさん [sage] 投稿日:2005/12/02(金) 17:44:38
>>633

兔 という字か。免でも同じか? フォントによって違うな。
636 デフォルトの名無しさん [sage] 投稿日:2005/12/02(金) 18:11:47
>>632>>634
第一水準で1ヶ所だけ順番が狂ってるのはJIS漢字字典にもあるし結構有名?
637 デフォルトの名無しさん [sage] 投稿日:2005/12/02(金) 21:06:04
>>633
仏典・漢籍は補助漢字の方が強い。
638 デフォルトの名無しさん [sage] 投稿日:2005/12/05(月) 12:05:06
「千字文」ももうJISで書けるんでしたっけ。
639 デフォルトの名無しさん [sage] 投稿日:2005/12/06(火) 00:42:50
どのJISよ?

JIS X 0208: 書けない
JIS X 0212: 「清」の左側が「冫」の字がない。「清」でよければ書ける
JIS X 0213: 書ける(書けるように委員が要望したらしい)
JIS X 0221: 書ける
640 デフォルトの名無しさん [sage] 投稿日:2005/12/06(火) 09:34:53
> JIS X 0213: 書ける(書けるように委員が要望したらしい)

http://www.l-h.co.jp/lhcontents/l-hlib/senji_newjis.html
ここを見るとそう思えますね。U+9D7E [鵾] が第4水準に入ってる。
これのテキスト、なかなか良い。
ただ、「祇」がどうも気になる。「祗」の方が適切じゃないかと。
641 デフォルトの名無しさん [sage] 投稿日:2005/12/06(火) 22:52:03
ttp://tar-yan.cocolog-nifty.com/weblog/2005/11/unicode__sip_52b1.html
拡張Bのフリーフォント。たあやんのフォントは昔からお世話になってるけど
ここまでやるとは。
642 デフォルトの名無しさん [sage] 投稿日:2005/12/07(水) 00:29:58
>>640
をいをい「祇」と「祗」は全然別の字だぞ。
偏のネと示は字体の違いに過ぎないしJISでも包摂されてるけど。
まともな研究者ならしめすへんが示で書かれてないから
駄目なんて言ったりしないし「祗」で代用なんてありえない。

人名用漢字に「俺の苗字がない」って騒いでる奴の多くは
結局そういう絵合わせレベルでしか漢字の異同を認識できない素人なんだよなあ
とはいえ行政がそういう素人に合わせた運用してるんだから仕方ないよな
643 デフォルトの名無しさん [sage] 投稿日:2005/12/07(水) 03:27:58
>U+9D7E

JIS X 0213 に「学芸」としか書いてないのがあやしげ :-)

千字文はいろいろテキストがあるし、「祗」と「祇」は古くから混同されて
いるから、「祇」になっているテキストもあるのかも。

智永のを見たら「祗」になっていたが、「清」はさんずいだった。

644 640 [sage] 投稿日:2005/12/07(水) 09:39:28
> 「祇」と「祗」は全然別の字
だから、もしかして違うんじゃないと思ったということなんだけど・・・
岩波文庫版『千字文』の意味解釈からすれば、「祗」がよさげかと。
でも、「祇」になってるテキスト、けっこうあるかもね。
645 640 [sage] 投稿日:2005/12/07(水) 09:55:15
ついでに、
しめすへんが「示」か「ネ」かは、関係ないことです。
つうか、JISX0213:2004フォントで見れば、どっちも「示」でそこに差はない。
646 デフォルトの名無しさん [sage] 投稿日:2005/12/07(水) 12:23:50
そういえば以前、人名用漢字の表で、「祇」が正しいのに元が「示」を使っているせいで
「祗」を入れてしまったものがあったな。
JIS X 0208 の字体で見て、勘違いしたんだろう。表外漢字字体表があれでは仕方ないな。
647 GNU厨 [sage] 投稿日:2005/12/07(水) 16:44:06
>>641
> {転載等の注意}フリーソフト(データ)です。
> 二次配布は作成者にe−mailにて、お問い合わせ下さい。

か。いわゆる自由なフォントではないみたいだな。
648 デフォルトの名無しさん [sage] 投稿日:2005/12/08(木) 01:44:11
神津島村に祗苗島(ただなえじま)って島があるんだけど、
http://www2.kankyo.metro.tokyo.jp/sizen/tyoujuu/hogoku/ichiran.htm
ではわざわざ袛を使ってる。まぁそんだけなんだけども。
649 デフォルトの名無しさん [sage] 投稿日:2005/12/08(木) 01:45:48
貼ってから気づいた。これ衣偏じゃんか
650 デフォルトの名無しさん [sage] 投稿日:2005/12/08(木) 07:34:26
>>649
またレアな字を……

マピオンの表示がちょっと受けた。
ttp://www.mapion.co.jp/c/f?uc=1&grp=all&nl=34/12/14.843&el=139/11/44.769&scl=25000&bid=Mlink
651 デフォルトの名無しさん [sage] 投稿日:2005/12/08(木) 09:00:36
子のスレに隊する朝鮮だな。
652 デフォルトの名無しさん [sage] 投稿日:2005/12/08(木) 09:14:57
どっちでもいいんだという高等な逃げとの解釈もあるかと。
653 デフォルトの名無しさん [sage] 投稿日:2005/12/08(木) 09:20:05
↓島の住民からの一言
654 デフォルトの名無しさん [sage] 投稿日:2005/12/08(木) 10:08:10
京都の祇園へ行くと祇園の「祇」が正字(示氏)ではなく
JIS83の字体(ネ氏)で書いてあるのがいっぱいある。
655 デフォルトの名無しさん [sage] 投稿日:2005/12/08(木) 11:32:59
「新漢語林」で引いたら、祇・祁は「ネ」の方も「示」と同字になってた。
つまり、JIS字体は俗字という扱いと違って、「同等に用いられてきた字体」とされてた。
「ネ」の示偏はかなり古くからあるのかな。
656 デフォルトの名無しさん [sage] 投稿日:2005/12/08(木) 13:04:33
ていうか、楷書だったら「ネ」だろ。
657 デフォルトの名無しさん [sage] 投稿日:2005/12/09(金) 04:32:45
結局しめすへんの話になってる……。

木簡に書かれた漢隷だとだいたい「示」のようだけど、>>656
いうように楷書は昔から「ネ」がふつう。薦季直表(3世紀)の
「神略」の「神」はすでに「ネ」になっている。
ttp://www.nisk.jp/shodokisochishiki/shodojinbutsujiten/img/no03_ph_02_l.jpg
658 デフォルトの名無しさん [sage] 投稿日:2005/12/12(月) 21:05:59
ttp://it.nikkei.co.jp/pc/news/index.aspx?i=2005121203753da
漢字12万字表示可能・東大教授らが世界最多のフォント集
東京大学の坂村健教授らは、約12万字からなる世界最多の漢字フォント集を制作した。
パソコンソフトに応用すれば、普段使わない難しい漢字や古い漢字を
パソコンで簡単に表示できるようになるという。
14日からソフト開発会社などに無償公開する。
659 デフォルトの名無しさん [sage] 投稿日:2005/12/13(火) 00:23:00
懲りない人だ。
660 デフォルトの名無しさん [sage] 投稿日:2005/12/13(火) 23:55:06
まあ、フォントは利用価値もあるからいいんじゃないの?
Unicodeとのmapping tableはあるのかな。
661 デフォルトの名無しさん [sage] 投稿日:2005/12/14(水) 12:30:30
東大・坂村研究室、約35万文字の漢字フォントを無償公開
http://pcweb.mycom.co.jp/news/2005/12/13/023.html
662 デフォルトの名無しさん [sage] 投稿日:2005/12/14(水) 12:51:26
>>661

>「宋明異体字」が34,499字
>「金文釈文文字」661字

を使うことによってどうして

>戸籍データベースの統合

の問題が解決するのか教えてくれ。
663 デフォルトの名無しさん [sage] 投稿日:2005/12/14(水) 15:18:25
文字数にこだわられてもな。
品質ってのも重要なんだけどな。
664 デフォルトの名無しさん [sage] 投稿日:2005/12/15(木) 02:15:55
なんかこう、
かゆい所に手が届かなくてイライラするってカンジだよな。
665 デフォルトの名無しさん 投稿日:2005/12/22(木) 14:40:33
加藤弘一って有名なの?
何か、今授業で文字コード熱く語ってるんだけど。
JIS X 0213を潰した戦犯の一人として芝野に恨まれてるって言ってる。
666 デフォルトの名無しさん [sage] 投稿日:2005/12/22(木) 15:44:04
>>665
南堂センセが有名だというような意味では、確かに有名。
667 デフォルトの名無しさん [sage] 投稿日:2005/12/23(金) 21:13:04
>>665
文字コード界の困ったちゃん。
南堂なみに電波なら害はなかったのだろうが、中途半端にまともなのが
困ったところ。
668 デフォルトの名無しさん [sae] 投稿日:2005/12/23(金) 21:49:19
サイトにあるインタビューにはいいのがあるね。
669 デフォルトの名無しさん [sage] 投稿日:2005/12/24(土) 08:01:14
>>660
GTとUnicodeのマッピングなら
http://www.open-text.com/download.htm
のCODETBL.LZHから作れそうだけど、Extension A/Bに対応する部分はない。
670 デフォルトの名無しさん 投稿日:2005/12/26(月) 00:30:40
Unicode 5.0β
http://www.unicode.org/versions/beta.html

日本に直接影響しそうな変更は今のところなさそうだが、
671 デフォルトの名無しさん [sage] 投稿日:2005/12/26(月) 00:53:03
このスレの住人的に char と wchar_t ってどうなの?
672 デフォルトの名無しさん [sage] 投稿日:2005/12/26(月) 02:18:53
typedef unsigned long long wchar;

#define char const wchar* const* const

673 デフォルトの名無しさん [sage] 投稿日:2005/12/26(月) 04:33:52
>>670
バージョンアップ早いねえ。
674 デフォルトの名無しさん [sage] 投稿日:2005/12/27(火) 00:59:19
>672
俺これでいいよ
union {
char utf8;
char jis;
char euc;
char sjis;
} kyarakuta;

もうこうしない?
全文検索:

新着レスの表示

板リスト 全部 前200次200最新100 リクエスト
プログラミングのおすすめソフト
当サイトの過去ログにリンクする場合は、こちらをお読みください。
read.php ver 06.2.0.1 2010/03/25
OURS◎ USO(Ultra-dynamic Shared Object)


ロゴtop 辞書 カクテル 科学 Web制作 URL短縮 写真素材 2ch倉庫  more≫ 
Copyright © by l'OURS, Update: 2011-09-07 09:20 webmaster@ours.be

カスタム検索
au EZwebDoCoMo i-modeS!
URLをメール
携帯ではご覧になれないページもあります。
158-33