2013年02月19日

国別twitter統計解析

このエントリーをはてなブックマークに追加
要約

2013/02/02から02/06にかけて tweet およびtwitterアカウントのランダムサンプリングを行いその傾向を調べた。
その結果言語別に大きく使われ方が異なるということが分かった
例えば
・日本語のリツイート率は全ての言語の中で最低である。
・国別(言語別)にtwitterを利用するデバイスの割合が著しく異なる
・一人あたりのtweet数は日本語が最大ではないかと思われるが、アラビア語の方が大きい可能性は否定できない。
・上位1%のユーザが全体の過半のtweetをしてる。













2012年の統計は、言語別twitterユーザとtweet統計 2012

2013/10の統計


2013/02/02 03:00:00 +0000 〜 2013/02/06 03:00:00 +0000 この96時間のtweetをstreaming API でランダムサンプリング
サンプル率ははっきりとは分かりません。
この間のtweetのIDは 297538590605459457 〜 298988175660052481 ぐらい?





日本語のリツイート率は全ての言語の中で最低である。  唯一、10%を割り込んでる。
数字上はヒンディー語のリツイート率は0%であったが、母集団が小さすぎるので...
最大のリツイート率だったのはタイ語で 38.1%
次がアラビア語で 34.4%

リツイート数 総数 リツイート率
en 33824 / 149742 0.22588185
ja 3839 / 39087 0.098216798
es 9366 / 35198 0.266094664
pt 2594 / 13517 0.191906488
id 1185 / 7604 0.155839032
ar 2128 / 6194 0.343558282
fr 1519 / 6145 0.24719284
tr 1175 / 4715 0.249204666
ru 374 / 3078 0.121507472
nl 536 / 3062 0.175048988

ko
415 / 3019 0.137462736
it 561 / 1959 0.286370597
de 189 / 1008 0.1875
th 261 / 685 0.381021898
pl 57 / 253 0.225296443
sv 67 / 219 0.305936073
ca 40 / 122 0.327868852
no 24 / 72 0.333333333
zh-cn 12 / 71 0.169014085
da 16 / 68 0.235294118
el 18 / 63 0.285714286
fil 15 / 62 0.241935484
fi 13 / 52 0.25
msa 9 / 44 0.204545455
zh-tw 9 / 43 0.209302326
hu 4 / 40 0.1
cs 4 / 31 0.129032258
uk 7 / 25 0.28
he 6 / 25 0.24
eu 5 / 17 0.294117647
fa 1 / 9 0.111111111
hi 0 / 8 0
58273 276237 0.210952914





Botの存在比も日本語が 10.3%以上で、全言語中最大です。
次が、韓国語で 5.3% 以上で、Botが1%超えてる言語は、このくらいしかありません。


どこからtweetしたのか。sourceは、全部で5000種以上確認したんですが、実質的には無限にあると思って良いです。
言語 en ja es pt id ar fr tr ru nl ko 言語
母集団 149742 39087 35198 13517 7604 6194 6145 4715 3078 3062 3019 母集団
web 26056 2874 12283 8013 1272 668 1808 2174 1030 475 291 web
Mobile Web 3938 404 1107 661 518 113 226 526 337 47 32 Mobile Web
Twitter for iPhone 44069 8237 2704 798 24 1395 1691 412 234 549 157 Twitter for iPhone
Twitter for Android 23664 6591 6938 1467 443 1435 858 590 262 835 1744 Twitter for Android
Twitter for BlackBerry 15741 10 7092 70 2968 1656 657 208 7 444 3 Twitter for BlackBerry
Twitter for iPad 3395 149 508 158 17 289 142 56 115 120 27 Twitter for iPad
UberSocial for BlackBerry 2855 1 215 2 416 10 5 3 0 122 0 UberSocial for BlackBerry
TweetCaster for Android 1813 61 103 9 219 23 5 2 12 12 36 TweetCaster for Android
Echofon 2255 591 47 18 20 1 14 1 4 34 11 Echofon
TweetDeck 2129 236 413 285 113 9 62 102 13 126 92 TweetDeck
HootSuite 1452 185 391 34 16 13 22 5 6 9 9 HootSuite
Facebook 1558 23 480 374 36 208 116 88 27 10 3 Facebook
Tumblr 412 5 144 233 1 0 18 7 3 4 1 Tumblr
Instagram 1499 36 145 123 12 11 20 20 42 5 1 Instagram
Tweetbot for iOS 908 394 55 4 2 116 21 1 8 9 13 Tweetbot for iOS
Ask.fm 314 3 320 478 0 3 44 14 15 6 1 Ask.fm
twittbot.net 218 2934 3 0 57 0 0 0 1 0 159 twittbot.net
BotMaker 17 699 0 1 2 0 1 0 0 0 0 BotMaker
EasyBotter 2 412 0 0 0 0 0 0 0 0 1 EasyBotter

これを見るとスマートフォンの普及率が分かりますよ。


日本ではBlackBerryは全然普及してないですが、同じぐらい普及してない国は、ブラジル、ロシア?
BlackBerryがとても普及しているのは、インドネシア? 次に中南米、中東??
インドネシアではiphoneは少ないんでしょうか?
Android普及率がとても高いのは...韓国?次にブラジル? 特に韓国では、tweetの過半がTwitter for
Androidで占められてます
。Samsungの影響?
しかしアラビア語のsourceで、Twitter for iPadが4.67%もあるとは??これは全ての言語の中で最大です。
ブラジルではwebからtweetしてる人が過半数ですよ。 ということは、スマートフォン売れそうですよ。




また、あまりそういうことを気にする人は少ないのですが、
35872 / 312111 = 11.5%がdeleteされています。
削除されているtweetが何語であるのかは直ちには分かりません。
しかし、この実際のログを見ると、ユーザが削除したのではなくTwitterが削除しているのではないのかと思うtweetがたくさんあります。IDがとても古いからです。


以上は、コンテンツの統計であって、ユーザの統計ではありません。


ユーザの統計は...





800000000 ユーザアカウント中、0.7060323 のサンプリングに成功、ということは、
2013年2月6日時点で有効なユーザアカウントは、 約 564825840


twitterのIDは使い回しで、誰かがアカウントを削除したら そのIDは別の新規登録者に割り当てられたりします。現在、番号の最前線は、601000000 辺り...?


ユーザのプロフィール(?)にURLを入れられますが、これを使ってるユーザは 78 / 831 = 0.0939


しかしユーザの言語割合を見ると、さっきのtweet統計との乖離が有るような
言語 ユーザ数 割合
zh-tw 1 0.001203369
tr 12 0.014440433
sv 1 0.001203369
ru 11 0.013237064
pt 46 0.055354994
no 2 0.002406739
nl 4 0.004813478
msa 1 0.001203369
ko 9 0.010830325
ja 42 0.050541516
it 7 0.008423586
id 14 0.016847172
fr 23 0.027677497
fil 1 0.001203369
es 107 0.128760529
en 527 0.634175692
de 8 0.009626955
ar 2 0.002406739

twitter20132

日本語ユーザはスペイン語,ポルトガル語よりも少ないのにtweet数では上回ってる...ということは、一人当たりのtweetが、利用率が大きいのか?

平均tweet数 平均follow数 平均follower数
en 278.849162  68.55679702 74.34078212
es 328.953271  75.04672897 58.81308411
fr 267.173913  20.34782609 12.56521739
id 543.1428571  73.64285714 24.78571429
ja 909  35.72093023 20.41860465
pt 293.8478261  118.0217391 43.7173913
ru 279.8181818  21.63636364 10


というわけで、
日本語ユーザだけ、他の言語に比べて一人当たりのtweet数が大きく開いています。
しかし、サンプル数が少ないので上の表には無いですが、アラビア語のtweet数/ユーザ数で計算すると、一人当たり3000tweet以上あることになるので、もしかしたらそちらの方がtweetの集中率は高いかもしれません。

twitter20131

X軸がtweet数順の降順にユーザを並べた軸で、Y軸が数です。


上位1%のユーザだけでtwitter全体の過半数のtweetを創出してる。
○ 上位5%のユーザだけでtwitter全体の90%のtweetを創出してる。

という、物凄いトールヘッド、コンテンツの一極集中が起きてるわけです。

上位とはどれぐらいかというと、
アカウント開設から現在までに1300ツイート超えてたらあなたは上位5%です。
ツイート数が12000超えてたらあなたは上位1%です。

40%のユーザは0ツイートです。
70%超のユーザは10ツイート未満です。

というわけで、使ってる人しか使ってないです。




フォロー数と、tweet数、それによるfollower数の相関は...
twitter20133
twitter20134


tak_tak0 at 01:32コメント(0)トラックバック(0)研究  | マーケティング この記事をクリップ!

トラックバックURL

コメントする

名前:
URL:
  情報を記憶: 評価:  顔   星
 
 
 
adsense
Categories
サイト内検索
にほんブログ村 科学ブログへ
にほんブログ村

amazon
Profile
Archives
gremz
blogchart
QRコード
QRコード
Recent Comments