http://anond.hatelabo.jp/20080718143701
思い出したので、またウィキペディアとはてなキーワードの数を比べてみた。
2008-07-18まで | 2008-11-18まで | 成長率 | ||
Wikipedia | 806134 | 847137 | 5.08% | |
はてなキーワード | 215030 | 224702 | 4.50% | |
Wikipedia ∩ はてなキーワード | 113584 | 119110 | 4.86% | ←共通部分 |
Wikipedia - はてなキーワード | 692550 | 728027 | 5.12% | ←Wikipedia独自の分 |
はてなキーワード - Wikipedia | 101446 | 105600 | 4.09% | ←はてな独自の分 |
ここ3ヶ月のはてなキーワードには、おもに次のような仕様変更があった。
全体的に3ヶ月で5%程度の伸び。「はてなキーワード独自部分」の伸びが弱い。
はてなキーワード 4.50%に対してウィキペディア5.08%と、エントリ総数の成長率の点でははてなキーワードがやや劣る。
はてなキーワードが9千程度増えたうち、はてな独自の分は4千程度と伸びが鈍いのに対して、ウィキペディアは増分4万中3万と独自エントリを順調に増やしている。これはもともとウィキペディア全体のうちはてなキーワードと共有する部分が少ないためでもあるが、独自部分の成長率をみても、ウィキペディアが1ポイント程度上回っている。
はてなダイアリーが公式に出している統計 によると、ここ3ヶ月中に急激な増加や減少はなく、むしろ、一連の仕様変更によってキーワードの作成が活発化した傾向にあることが読み取れる。
このことを合わせて考えるなら、はてなキーワードは活発化したが、同時に収録エントリの傾向がWikipediaに似てきたという現状か。
> curl http://download.wikimedia.org/jawiki/latest/jawiki-latest-all-titles-in-ns0.gz | gzip -d > wiki.txt
> curl http://d.hatena.ne.jp/images/keyword/keywordlist_furigana_with_kid.csv |perl -MEncode -e'while(<>){print encode_utf8 decode q{euc-jp}, $_}'| cut -f2 | sort | uniq > hate.txt
成長率まで入ってくるとちょっと面倒なので、次は多分全自動で計算する
最近、はてなダイアリーキーワードにWikipediaへのリンクがついたのを見て、両者がどれくらい重複しているのか気になって調べてみた。 ダウンロードしてくる http://download.wikimedia.org/ja...
http://anond.hatelabo.jp/20080718143701 思い出したので、またウィキペディアとはてなキーワードの数を比べてみた。 比較結果 2008-07-18でのエントリ数 2008-11-18でのエントリ数 成長率 ...
最近の新規登録で、説明文は空白で下にwikipediaのリンクが出てる「説明待ち」キーワードが目につく気がする。 wikipediaにあってはてなにないキーワードを埋めよう、としてる人がいるん...
皆が同レベルの「無知」で安堵に浸る場所として、「ウィキペディア日本語版」を推奨します。
まずは学術的な書物よりも「ウィキペディア日本語版」が求められる理由から。
最近、はてなキーワードにwikipediaの内容表示されるようになったよな・・・。 と、数日前にきがついたんだけど、、 あれ、他のキーワードはまだなのか・・・?? どういう基準なんだ...
あ、どうやら最近更新したやつにつくみたいだ。。 というわけではないよ。 http://d.hatena.ne.jp/keyword/%b2%e8%cc%cc%a5%b5%a5%a4%a5%ba 自動的につくはずだけれど、見たのがたまたまwikipediaにない...