回答受付終了まであと6日 回答を投稿すると知恵コイン15枚が追加されます
大辞林のデータについて。 大学のレポートの一部で、大辞林一冊は何バイト分に...
2015/4/2700:08:39
大辞林のデータについて。
大学のレポートの一部で、大辞林一冊は何バイト分にあたるかという問いが出ました。
私は大辞林の総文字数を概算して、2バイトをかければよいのではないかと思ったのですが、この方法で求めることは可能でしょうか。
もし考え違いや、ほかの方法があるのでしたらアドバイスをお願いしたいです。
- 閲覧数:
- 1,064
- 回答数:
- 4
- お礼:
- 50枚
回答
1〜4件/4件中
- 並び替え:回答日時の
- 新しい順
- |古い順
2015/4/2723:20:20
あなたは大辞林を読んだことはありませんね?
大辞林は文字だけではなく、図表が掲載されています。そのため、単純に文字数をカウントしただけではダメです。図表を画像データ化した分を計算に含める必要があります。
画像データのサイズは以下の計算で求められます
・画像のサイズ×色のビット数(ビット数はこの場合8ビットで十分)
また、日本語は一文字2バイトではダメです。最近の主流である、UTF-8で符号化すると一文字3バイトになります。
つまり、数十ページ分くらい文字数と図表のサイズをカウント・計算して、1ページ辺りの平均データサイズを求めます。1ページのデータサイズが算出できたら、大辞林の総ページ数でかければ大辞林全体のデータサイズが求まります。
レポート頑張ってくださいね!!こーゆーレポートは答えだけではなく、算出式(つまり上の説明)もしっかり書いてくださいね。
2015/4/2723:18:23
これを出題した本人です.
まず,Yahoo!知恵袋のようなナレッジサービスにレポートを質問を投げることはacqua_aquilaさんの自由ですが,その程度によっては不正行為と認定され単位取り消しなどの処分の対象になるリスクがあることにご注意ください.
本課題は唯一の答えを設定しているものではなく,様々な回答を期待して出題したものです.acqua_aquilaさんが考案した総文字数の概算から算出するというやりかたはフェルミ推定という方法ですが,この方向でも答えは出せるものと思います.
boronpotassiumnitrateさんが大体やり方は挙げていますが,acqua_aquilaさんオリジナルの回答を期待します.
なお1点補足しておくと,「情報基礎」第2回テキストで説明されているように全ての漢字を2バイトのみで表すことはできません.
http://klis.tsukuba.ac.jp/jk15/jk/0421s.pdf
m1sosoupさん
2015/4/2723:04:18
便利なページです。ご活用ください。
http://klis.tsukuba.ac.jp/lc/20150427/5397
2015/4/2706:52:36
それで良いと思う。
他の手として・・・、
・ネットで検索してみる(過去のQ&Aとかがあるかも・・?)
・大辞林を出版しているところに問い合わせる
・似たような情報量の電子辞書ソフトの容量を調べる
・「新聞紙1枚が何バイト」とか言ったすでにある情報から類推する
がありそうだが、質問にあるやり方がまっとうなやり方だと思う。
後は、一冊の総文字数の概算のやり方になる。
・サンプルページを無作為に決める
・実際に字数を数える。またはスキャナで画像にして、OCRソフトでテキストに変えて、バイト数を求める。
・その結果を統計処理する(平均値、分散値)
・統計的に推定する。
「大辞林、総文字数」に関する回答受付中の質問
このカテゴリの回答受付中の質問
注目の回答受付中の質問
初めてのいろいろ、心配がいっぱい
回答受付中の質問
- 連携サービス
- ブログ
- textream(掲示板)
- ペット
- Chocotle(動画アプリ)