2013年02月19日
国別twitter統計解析
| Tweet |
要約
2013/02/02から02/06にかけて tweet およびtwitterアカウントのランダムサンプリングを行いその傾向を調べた。
その結果言語別に大きく使われ方が異なるということが分かった。
例えば
・日本語のリツイート率は全ての言語の中で最低である。
・国別(言語別)にtwitterを利用するデバイスの割合が著しく異なる。
・一人あたりのtweet数は日本語が最大ではないかと思われるが、アラビア語の方が大きい可能性は否定できない。
・上位1%のユーザが全体の過半のtweetをしてる。
2012年の統計は、言語別twitterユーザとtweet統計 2012
2013/10の統計
2013/02/02 03:00:00 +0000 〜 2013/02/06 03:00:00 +0000 この96時間のtweetをstreaming API でランダムサンプリング
サンプル率ははっきりとは分かりません。
この間のtweetのIDは 297538590605459457 〜 298988175660052481 ぐらい?
日本語のリツイート率は全ての言語の中で最低である。 唯一、10%を割り込んでる。
数字上はヒンディー語のリツイート率は0%であったが、母集団が小さすぎるので...
最大のリツイート率だったのはタイ語で 38.1%
次がアラビア語で 34.4%
Botの存在比も日本語が 10.3%以上で、全言語中最大です。
次が、韓国語で 5.3% 以上で、Botが1%超えてる言語は、このくらいしかありません。
どこからtweetしたのか。sourceは、全部で5000種以上確認したんですが、実質的には無限にあると思って良いです。
これを見るとスマートフォンの普及率が分かりますよ。
2013/02/02から02/06にかけて tweet およびtwitterアカウントのランダムサンプリングを行いその傾向を調べた。
その結果言語別に大きく使われ方が異なるということが分かった。
例えば
・日本語のリツイート率は全ての言語の中で最低である。
・国別(言語別)にtwitterを利用するデバイスの割合が著しく異なる。
・一人あたりのtweet数は日本語が最大ではないかと思われるが、アラビア語の方が大きい可能性は否定できない。
・上位1%のユーザが全体の過半のtweetをしてる。
2012年の統計は、言語別twitterユーザとtweet統計 2012
2013/10の統計
2013/02/02 03:00:00 +0000 〜 2013/02/06 03:00:00 +0000 この96時間のtweetをstreaming API でランダムサンプリング
サンプル率ははっきりとは分かりません。
この間のtweetのIDは 297538590605459457 〜 298988175660052481 ぐらい?
日本語のリツイート率は全ての言語の中で最低である。 唯一、10%を割り込んでる。
数字上はヒンディー語のリツイート率は0%であったが、母集団が小さすぎるので...
最大のリツイート率だったのはタイ語で 38.1%
次がアラビア語で 34.4%
リツイート数 | 総数 | リツイート率 | ||
en | 33824 | / | 149742 | 0.22588185 |
ja | 3839 | / | 39087 | 0.098216798 |
es | 9366 | / | 35198 | 0.266094664 |
pt | 2594 | / | 13517 | 0.191906488 |
id | 1185 | / | 7604 | 0.155839032 |
ar | 2128 | / | 6194 | 0.343558282 |
fr | 1519 | / | 6145 | 0.24719284 |
tr | 1175 | / | 4715 | 0.249204666 |
ru | 374 | / | 3078 | 0.121507472 |
nl | 536 | / | 3062 | 0.175048988 |
ko | 415 | / | 3019 | 0.137462736 |
it | 561 | / | 1959 | 0.286370597 |
de | 189 | / | 1008 | 0.1875 |
th | 261 | / | 685 | 0.381021898 |
pl | 57 | / | 253 | 0.225296443 |
sv | 67 | / | 219 | 0.305936073 |
ca | 40 | / | 122 | 0.327868852 |
no | 24 | / | 72 | 0.333333333 |
zh-cn | 12 | / | 71 | 0.169014085 |
da | 16 | / | 68 | 0.235294118 |
el | 18 | / | 63 | 0.285714286 |
fil | 15 | / | 62 | 0.241935484 |
fi | 13 | / | 52 | 0.25 |
msa | 9 | / | 44 | 0.204545455 |
zh-tw | 9 | / | 43 | 0.209302326 |
hu | 4 | / | 40 | 0.1 |
cs | 4 | / | 31 | 0.129032258 |
uk | 7 | / | 25 | 0.28 |
he | 6 | / | 25 | 0.24 |
eu | 5 | / | 17 | 0.294117647 |
fa | 1 | / | 9 | 0.111111111 |
hi | 0 | / | 8 | 0 |
計 | 58273 | 276237 | 0.210952914 |
Botの存在比も日本語が 10.3%以上で、全言語中最大です。
次が、韓国語で 5.3% 以上で、Botが1%超えてる言語は、このくらいしかありません。
どこからtweetしたのか。sourceは、全部で5000種以上確認したんですが、実質的には無限にあると思って良いです。
言語 | en | ja | es | pt | id | ar | fr | tr | ru | nl | ko | 言語 |
母集団 | 149742 | 39087 | 35198 | 13517 | 7604 | 6194 | 6145 | 4715 | 3078 | 3062 | 3019 | 母集団 |
web | 26056 | 2874 | 12283 | 8013 | 1272 | 668 | 1808 | 2174 | 1030 | 475 | 291 | web |
Mobile Web | 3938 | 404 | 1107 | 661 | 518 | 113 | 226 | 526 | 337 | 47 | 32 | Mobile Web |
Twitter for iPhone | 44069 | 8237 | 2704 | 798 | 24 | 1395 | 1691 | 412 | 234 | 549 | 157 | Twitter for iPhone |
Twitter for Android | 23664 | 6591 | 6938 | 1467 | 443 | 1435 | 858 | 590 | 262 | 835 | 1744 | Twitter for Android |
Twitter for BlackBerry | 15741 | 10 | 7092 | 70 | 2968 | 1656 | 657 | 208 | 7 | 444 | 3 | Twitter for BlackBerry |
Twitter for iPad | 3395 | 149 | 508 | 158 | 17 | 289 | 142 | 56 | 115 | 120 | 27 | Twitter for iPad |
UberSocial for BlackBerry | 2855 | 1 | 215 | 2 | 416 | 10 | 5 | 3 | 0 | 122 | 0 | UberSocial for BlackBerry |
TweetCaster for Android | 1813 | 61 | 103 | 9 | 219 | 23 | 5 | 2 | 12 | 12 | 36 | TweetCaster for Android |
Echofon | 2255 | 591 | 47 | 18 | 20 | 1 | 14 | 1 | 4 | 34 | 11 | Echofon |
TweetDeck | 2129 | 236 | 413 | 285 | 113 | 9 | 62 | 102 | 13 | 126 | 92 | TweetDeck |
HootSuite | 1452 | 185 | 391 | 34 | 16 | 13 | 22 | 5 | 6 | 9 | 9 | HootSuite |
1558 | 23 | 480 | 374 | 36 | 208 | 116 | 88 | 27 | 10 | 3 | ||
Tumblr | 412 | 5 | 144 | 233 | 1 | 0 | 18 | 7 | 3 | 4 | 1 | Tumblr |
1499 | 36 | 145 | 123 | 12 | 11 | 20 | 20 | 42 | 5 | 1 | ||
Tweetbot for iOS | 908 | 394 | 55 | 4 | 2 | 116 | 21 | 1 | 8 | 9 | 13 | Tweetbot for iOS |
Ask.fm | 314 | 3 | 320 | 478 | 0 | 3 | 44 | 14 | 15 | 6 | 1 | Ask.fm |
twittbot.net | 218 | 2934 | 3 | 0 | 57 | 0 | 0 | 0 | 1 | 0 | 159 | twittbot.net |
BotMaker | 17 | 699 | 0 | 1 | 2 | 0 | 1 | 0 | 0 | 0 | 0 | BotMaker |
EasyBotter | 2 | 412 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | EasyBotter |
これを見るとスマートフォンの普及率が分かりますよ。
日本ではBlackBerryは全然普及してないですが、同じぐらい普及してない国は、ブラジル、ロシア?
BlackBerryがとても普及しているのは、インドネシア? 次に中南米、中東??
インドネシアではiphoneは少ないんでしょうか?
Android普及率がとても高いのは...韓国?次にブラジル? 特に韓国では、tweetの過半がTwitter for
Androidで占められてます。Samsungの影響?
しかしアラビア語のsourceで、Twitter for iPadが4.67%もあるとは??これは全ての言語の中で最大です。
ブラジルではwebからtweetしてる人が過半数ですよ。 ということは、スマートフォン売れそうですよ。
また、あまりそういうことを気にする人は少ないのですが、
35872 / 312111 = 11.5%がdeleteされています。
削除されているtweetが何語であるのかは直ちには分かりません。
しかし、この実際のログを見ると、ユーザが削除したのではなくTwitterが削除しているのではないのかと思うtweetがたくさんあります。IDがとても古いからです。
以上は、コンテンツの統計であって、ユーザの統計ではありません。
ユーザの統計は...
800000000 ユーザアカウント中、0.7060323 のサンプリングに成功、ということは、
2013年2月6日時点で有効なユーザアカウントは、 約 564825840
twitterのIDは使い回しで、誰かがアカウントを削除したら そのIDは別の新規登録者に割り当てられたりします。現在、番号の最前線は、601000000 辺り...?
ユーザのプロフィール(?)にURLを入れられますが、これを使ってるユーザは 78 / 831 = 0.0939
しかしユーザの言語割合を見ると、さっきのtweet統計との乖離が有るような

日本語ユーザはスペイン語,ポルトガル語よりも少ないのにtweet数では上回ってる...ということは、一人当たりのtweetが、利用率が大きいのか?
というわけで、
日本語ユーザだけ、他の言語に比べて一人当たりのtweet数が大きく開いています。
しかし、サンプル数が少ないので上の表には無いですが、アラビア語のtweet数/ユーザ数で計算すると、一人当たり3000tweet以上あることになるので、もしかしたらそちらの方がtweetの集中率は高いかもしれません。

X軸がtweet数順の降順にユーザを並べた軸で、Y軸が数です。
○ 上位1%のユーザだけでtwitter全体の過半数のtweetを創出してる。
○ 上位5%のユーザだけでtwitter全体の90%のtweetを創出してる。
という、物凄いトールヘッド、コンテンツの一極集中が起きてるわけです。
上位とはどれぐらいかというと、
アカウント開設から現在までに1300ツイート超えてたらあなたは上位5%です。
ツイート数が12000超えてたらあなたは上位1%です。
○40%のユーザは0ツイートです。
○70%超のユーザは10ツイート未満です。
というわけで、使ってる人しか使ってないです。
フォロー数と、tweet数、それによるfollower数の相関は...


BlackBerryがとても普及しているのは、インドネシア? 次に中南米、中東??
インドネシアではiphoneは少ないんでしょうか?
Android普及率がとても高いのは...韓国?次にブラジル? 特に韓国では、tweetの過半がTwitter for
Androidで占められてます。Samsungの影響?
しかしアラビア語のsourceで、Twitter for iPadが4.67%もあるとは??これは全ての言語の中で最大です。
ブラジルではwebからtweetしてる人が過半数ですよ。 ということは、スマートフォン売れそうですよ。
また、あまりそういうことを気にする人は少ないのですが、
35872 / 312111 = 11.5%がdeleteされています。
削除されているtweetが何語であるのかは直ちには分かりません。
しかし、この実際のログを見ると、ユーザが削除したのではなくTwitterが削除しているのではないのかと思うtweetがたくさんあります。IDがとても古いからです。
以上は、コンテンツの統計であって、ユーザの統計ではありません。
ユーザの統計は...
800000000 ユーザアカウント中、0.7060323 のサンプリングに成功、ということは、
2013年2月6日時点で有効なユーザアカウントは、 約 564825840
twitterのIDは使い回しで、誰かがアカウントを削除したら そのIDは別の新規登録者に割り当てられたりします。現在、番号の最前線は、601000000 辺り...?
ユーザのプロフィール(?)にURLを入れられますが、これを使ってるユーザは 78 / 831 = 0.0939
しかしユーザの言語割合を見ると、さっきのtweet統計との乖離が有るような
言語 | ユーザ数 | 割合 |
zh-tw | 1 | 0.001203369 |
tr | 12 | 0.014440433 |
sv | 1 | 0.001203369 |
ru | 11 | 0.013237064 |
pt | 46 | 0.055354994 |
no | 2 | 0.002406739 |
nl | 4 | 0.004813478 |
msa | 1 | 0.001203369 |
ko | 9 | 0.010830325 |
ja | 42 | 0.050541516 |
it | 7 | 0.008423586 |
id | 14 | 0.016847172 |
fr | 23 | 0.027677497 |
fil | 1 | 0.001203369 |
es | 107 | 0.128760529 |
en | 527 | 0.634175692 |
de | 8 | 0.009626955 |
ar | 2 | 0.002406739 |
日本語ユーザはスペイン語,ポルトガル語よりも少ないのにtweet数では上回ってる...ということは、一人当たりのtweetが、利用率が大きいのか?
平均tweet数 | 平均follow数 | 平均follower数 | |
en | 278.849162 | 68.55679702 | 74.34078212 |
es | 328.953271 | 75.04672897 | 58.81308411 |
fr | 267.173913 | 20.34782609 | 12.56521739 |
id | 543.1428571 | 73.64285714 | 24.78571429 |
ja | 909 | 35.72093023 | 20.41860465 |
pt | 293.8478261 | 118.0217391 | 43.7173913 |
ru | 279.8181818 | 21.63636364 | 10 |
というわけで、
日本語ユーザだけ、他の言語に比べて一人当たりのtweet数が大きく開いています。
しかし、サンプル数が少ないので上の表には無いですが、アラビア語のtweet数/ユーザ数で計算すると、一人当たり3000tweet以上あることになるので、もしかしたらそちらの方がtweetの集中率は高いかもしれません。
X軸がtweet数順の降順にユーザを並べた軸で、Y軸が数です。
○ 上位1%のユーザだけでtwitter全体の過半数のtweetを創出してる。
○ 上位5%のユーザだけでtwitter全体の90%のtweetを創出してる。
という、物凄いトールヘッド、コンテンツの一極集中が起きてるわけです。
上位とはどれぐらいかというと、
アカウント開設から現在までに1300ツイート超えてたらあなたは上位5%です。
ツイート数が12000超えてたらあなたは上位1%です。
○40%のユーザは0ツイートです。
○70%超のユーザは10ツイート未満です。
というわけで、使ってる人しか使ってないです。
フォロー数と、tweet数、それによるfollower数の相関は...