統計解析の授業で「何でも好きなデータを統計解析する」という課題を出されてテーマが決まらず途方にくれていたところ、
@kivantium 女性キャラのバストとpixivのR-18率との相関関係とかどうッスか
— こおろぎ (@saigyouji07) May 12, 2015という素晴らしい提案をいただいたので調べてみました。
データ
2014年くらいに放送されたアニメのうちBDの売上を参考に独断と偏見で選んだアニメのうち主要女性キャラのスリーサイズが公開されているものについて、バストサイズとキャラクター名のタグがついたPixivイラストのうちR-18タグがついている割合を調べました。スリーサイズの設定があるアニメが少なかったので、収集できたデータは33件です。
anime,isHeroine,name,B,ratio,R18,total chunikoi,1,小鳥遊六花,78,0.111,620,5588 chunikoi,0,丹生谷森夏,86,0.228,387,1699 chunikoi,0,五月七日くみん,89,0.185,98,531 chunikoi,0,凸守早苗,72,0.103,145,1413 lovelive,1,高坂穂乃果,78,0.048,538,11103 lovelive,0,絢瀬絵里,88,0.066,750,11365 lovelive,0,南ことり,80,0.049,698,14265 lovelive,0,園田海未,76,0.050,552,11070 lovelive,0,星空凛,75,0.029,348,12146 lovelive,0,西木野真姫,78,0.044,877,19986 lovelive,0,東條希,90,0.080,1037,12925 lovelive,0,小泉花陽,82,0.028,275,9685 lovelive,0,矢澤にこ,74,0.041,893,21898 sao,1,アスナ,80,0.115,1089,9481 sao,0,リーファ,85,0.229,270,1181 sao,0,シノン,74,0.067,139,2085 fate,1,セイバー,73,0.060,1638,27391 fate,0,遠坂凛,77,0.076,531,6947 fate,0,間桐桜,85,0.090,395,4405 ore_twi,1,津辺愛香,72,0.122,24,196 ore_twi,0,神堂慧理那,69,0.167,8,48 ore_twi,0,トゥアール,90,0.236,25,106 saenai,1,加藤恵,84,0.044,27,612 saenai,0,澤村・スペンサー・英梨々,80,0.038,20,521 saenai,0,霞ヶ丘詩羽,89,0.085,40,468 litbus,1,棗鈴,77,0.038,89,2320 litbus,0,神北小毬,83,0.035,66,1879 litbus,0,来ヶ谷唯湖,90,0.072,53,734 litbus,0,三枝葉留佳,81,0.025,32,1259 litbus,0,能美クドリャフカ,69,0.058,181,3120 litbus,0,西園美魚,75,0.057,51,897 jinsei,0,鈴木いくみ,73,0.160,13,81 nogame,0,ステファニー・ドーラ,89,0.162,42,260
- chunikoi=中二病でも恋がしたい
- lovelive=ラブライブ
- sao=ソードアートオンライン
- fate=Fate/stay night[Unlimited Blade Works]
- ore_twi=俺、ツインテールになります
- saenai=冴えない彼女の育て方
- litbus=リトルバスターズ!
- jinsei=人生相談テレビアニメーション「人生」
- nogame=ノーゲーム・ノーライフ
相関検定
data <- read.csv("chara.txt", header=T) #読み込み cor.test(data$B, data$ratio) #相関検定 plot(data$B, data$ratio, xlab="バストサイズ", ylab="R-18タグの割合") #点の表示 f <- lsfit(data$B, data$ratio) #最小2乗法による直線 abline(f) #直線の表示
結果
相関係数は0.28, p値は0.10なので帰無仮説を受容して相関が無いという結論になりました。
感想
同一アニメ間では相関がいくらかありそうな感じがしますが、アニメ間での差の方が大きく相関を打ち消してしまう印象でした。
仮に相関があったとしても、ヒロインのバストサイズは標準的に、サブキャラは印象を強めるためにバストサイズを大きめに設定する傾向があって、ヒロインは多くの人がイラストを投稿して相対的にR-18率が下がるが、サブキャラは一般の投稿が少なく相対的に商業でR-18を書く人の割合が上がるという因果関係があるのではないかという気もします。
また、バスト80を軸とする放物線の方がフィッティングとして適切ではないかという指摘がありました。「貧乳はステータス」と言われることを考えるとバストが小さくなるほどR-18率が上がる可能性も否定できません。しかし、放物線近似での統計検定の方法が分からなかったので今後の課題としておきます。
より多くのデータを集める・異なる手法を使うなどすればまた違う結論が出るかもしれないので是非ツッコミをいただければと思います。