ここから本文です

回答受付終了まであと6日 回答を投稿すると知恵コイン15枚が追加されます

大辞林のデータについて。 大学のレポートの一部で、大辞林一冊は何バイト分に...

acqua_aquilaさん

2015/4/2700:08:39

大辞林のデータについて。

大学のレポートの一部で、大辞林一冊は何バイト分にあたるかという問いが出ました。

私は大辞林の総文字数を概算して、2バイトをかければよいのではないかと思ったのですが、この方法で求めることは可能でしょうか。
もし考え違いや、ほかの方法があるのでしたらアドバイスをお願いしたいです。

閲覧数:
1,064
回答数:
4
お礼:
50枚

違反報告

回答

1〜4件/4件中

並び替え:回答日時の
新しい順
|古い順

2015/4/2723:20:20

あなたは大辞林を読んだことはありませんね?

大辞林は文字だけではなく、図表が掲載されています。そのため、単純に文字数をカウントしただけではダメです。図表を画像データ化した分を計算に含める必要があります。

画像データのサイズは以下の計算で求められます
・画像のサイズ×色のビット数(ビット数はこの場合8ビットで十分)

また、日本語は一文字2バイトではダメです。最近の主流である、UTF-8で符号化すると一文字3バイトになります。

つまり、数十ページ分くらい文字数と図表のサイズをカウント・計算して、1ページ辺りの平均データサイズを求めます。1ページのデータサイズが算出できたら、大辞林の総ページ数でかければ大辞林全体のデータサイズが求まります。

レポート頑張ってくださいね!!こーゆーレポートは答えだけではなく、算出式(つまり上の説明)もしっかり書いてくださいね。

mitsu_12cさん

2015/4/2723:18:23

これを出題した本人です.

まず,Yahoo!知恵袋のようなナレッジサービスにレポートを質問を投げることはacqua_aquilaさんの自由ですが,その程度によっては不正行為と認定され単位取り消しなどの処分の対象になるリスクがあることにご注意ください.

本課題は唯一の答えを設定しているものではなく,様々な回答を期待して出題したものです.acqua_aquilaさんが考案した総文字数の概算から算出するというやりかたはフェルミ推定という方法ですが,この方向でも答えは出せるものと思います.

boronpotassiumnitrateさんが大体やり方は挙げていますが,acqua_aquilaさんオリジナルの回答を期待します.

なお1点補足しておくと,「情報基礎」第2回テキストで説明されているように全ての漢字を2バイトのみで表すことはできません.
http://klis.tsukuba.ac.jp/jk15/jk/0421s.pdf

m1sosoupさん

2015/4/2723:04:18

便利なページです。ご活用ください。

http://klis.tsukuba.ac.jp/lc/20150427/5397

グレード

カテゴリマスター

2015/4/2706:52:36

それで良いと思う。
他の手として・・・、
・ネットで検索してみる(過去のQ&Aとかがあるかも・・?)
・大辞林を出版しているところに問い合わせる
・似たような情報量の電子辞書ソフトの容量を調べる
・「新聞紙1枚が何バイト」とか言ったすでにある情報から類推する
がありそうだが、質問にあるやり方がまっとうなやり方だと思う。

後は、一冊の総文字数の概算のやり方になる。
・サンプルページを無作為に決める
・実際に字数を数える。またはスキャナで画像にして、OCRソフトでテキストに変えて、バイト数を求める。
・その結果を統計処理する(平均値、分散値)
・統計的に推定する。

みんなで作る知恵袋 悩みや疑問、なんでも気軽にきいちゃおう!

Q&Aをキーワードで検索:

よしもと爆笑コント動画

Yahoo! JAPANは、回答に記載された内容の信ぴょう性、正確性を保証しておりません。
お客様自身の責任と判断で、ご利用ください。
本文はここまでです このページの先頭へ

ID/ニックネームを選択し、「追加する」ボタンを押してください。

閉じる

※知恵コレクションに追加された質問や知恵ノートは選択されたID/ニックネームのMy知恵袋で確認できます。

ほかのID/ニックネームで利用登録する