Python
スクレイピング
BeautifulSoup
スケベ
女性用AV

【スケベ】女性用アダルト動画のデータを分析して、女性から評価が高いアダルト動画をデータ分析してみた

こんにちは、スケベサイエンティストのDai (@never_be_a_pm)です。

世の中の男性、アダルトビデオから間違った性の知識を得がち問題

さて、よく女性からこんな意見を聞きます。

「世の男性はアダルド動画を見すぎている。そこで変な知識をつけてしまって、気持ち良いSEXをすることができない」

確かに、世の男性は女性が喜ぶ正しいSEXをよく理解しておりません。特に経験が足りない童貞にとっては、学びたくても経験から学べないという、深刻な問題を抱えています。そう、エンジニア未経験者がエンジニアとして転職したいのに、業務経験がないので難しいのと同じ構造です。

その結果、日本では年間6万人以上の童貞が、いきなり陰部に手を突っ込んでいると報告されています。

これは非常に社会的な問題なのではないかと思います。そして、もし女性が喜ぶSEXを男性が知ることができたら、童貞もSEXできるし、女性も喜んで童貞とSEXできます。

女性が喜ぶSEXとは何か分かれば、童貞にもチャンスがあるのではないか?

女性が喜ぶSEXが分かれば、童貞にも可能性が出てきます。もし女性がどういう人をセクシーと感じるのかが分かれば、我々童貞はその動画を見て、正しい知識をもとに脱童貞できるかもしれません。

そこで今回は、女性が喜ぶSEXとは何かを調査してみることにしました。今回は、女性用AVを取り扱っている、女性用エロサイトのデータを分析してみました。

調査の方法

女性のための無料アダルト動画ラブエッチLoveH 女の子向けAV というサイトのデータをスクレイピングしました。 http://loveh.org/

このサイトでは、一つの動画に対して、いいねを押すことと、複数のタグを追加することができます。
そこで、このサイトからは以下の情報を取得することにしました。

  • 動画名
  • いいね数
  • タグ名(※複数の場合は空白スペースで連結)

データの取得

以下のコードでスクレイピングしました。
PythonのBeautiful SoupとRequestsを利用して、すべての動画を取得しました。

import pandas as pd 
import requests
from bs4 import BeautifulSoup # BeautifulSoupのインポート

# データフレームの作成

columns = ["title", "likes", "tag_name"]
df = pd.DataFrame(columns = columns)
df
base_url = "http://loveh.org/?paged="
page_num = 1
max_page_num = 183

# 最後のページまで実行する

if __name__ == '__main__':
  while page_num < max_page_num:
    res = requests.get(base_url+ str(page_num))
    soup = BeautifulSoup(res.text, 'html.parser') # BeautifulSoupの初期化
    tags = soup.select("div#entrybox")
    for tag in tags:
        try:
          title = tag.select("h2.entrytitle")[0]. get_text() # タイトル
          like = tag.select("div.likenumberin")[0].get_text().replace("Like", "").rstrip() # いいね数
          # タグ名を取得する。複数ある場合はリスト化して、文字列を結合する
          tag_name = ""
          tmp_tags = tag.select("span.tagdesign")
          for tmp_tag in tmp_tags:
            tag_name += tmp_tag.get_text() + " "
          print(tag_name)
          se = pd.Series([title, like, tag_name],columns)
          df = df.append(se, ignore_index=True)
          print(se)
        except Exception as e:
          print ()
    page_num +=1
    print("{} th page DONE".format(page_num))
    df.to_csv("all_videos.csv")

データの前処理

一つのビデオに対して、複数のタグがついているときは分割して行を追加しました。
また、以下のerovideoのようなタグのように、タグにXVIDEOSなどの動画取得先を指定したものは除外しました。

title likes tag_name
0 鈴木一徹/橘ひなた 彼氏に振られて泥酔した可愛い女の子をホテルに運んで睡眠レイプ!性欲の限り... 895 erovideo
1 鈴木一徹/橘ひなた 彼氏に振られて泥酔した可愛い女の子をホテルに運んで睡眠レイプ!性欲の限り... 895 イケメン
2 鈴木一徹/橘ひなた 彼氏に振られて泥酔した可愛い女の子をホテルに運んで睡眠レイプ!性欲の限り... 895 橘ひなた
3 鈴木一徹/橘ひなた 彼氏に振られて泥酔した可愛い女の子をホテルに運んで睡眠レイプ!性欲の限り... 895 鈴木一徹
4 大島丈/真田春香 エッチなBODYの巨乳美人お姉さんとベテランAV男優が明るいホテルの部屋で... 450 大島丈

もっとも多いタグは?

このWebサイトの全てのビデオを取得し、タグを全て取得しました。
それらのタグをグルーピングし、そのタグの合計を算出し、並べてみました。
それがこちらのグラフになります。

image.png

こちらがもっとも多かったもののランキングとなります。
男性向けのAVではない、イケメン, マッサージ , レズ などがありました。ほかにも欄外ですが、スローセックスも上位にあったので、ソフトセックスを期待している人が多いのかもしれません。

一方、女性向けAVのタグで、人妻、中出し、無理やりというキーワードの出現数が多いことに驚きでした。
余談ですが、「SEX無し」というタグもあり、「アダルト動画とは何か」「男性性と女性性の違いとは何か」という哲学的な問いが生まれました。

  1. 人妻
  2. 中出し
  3. イケメン
  4. マッサージ
  5. ラブラブエッチ
  6. レズ
  7. 小田切ジュン
  8. 鈴木一徹
  9. 無理やり
  10. 貞松大輔

特に人気のあるタグ

次に、タグごとの人気がわかるように、タグのいいね数の平均値と、個数をみて見ることにしました。
平均いいね数は80程度となりました。箱ひげ図でみると以下のように、ほとんどが低評価となっていて、一部突出しているタグがあるということがわかりました。

image.png

いいねの平均値が高いものを並べてみます。

tag_name mean count
千堂ゆりあ 1329.0 1
可愛みくり 1309.0 1
椎名彩 996.0 1
今井かのん 800.0 1
相内しおり 762.0 1

どうやら個数が1つなので、平均されずに高く選ばれている可能性がありそうです。
散布図にしてみると以下のようなグラフになりました。横軸に個数、縦軸に平均値をプロットしました。
やはり、個数が1つで、評価が高いビデオがあるようでした。

image.png

そこで、タグが30個以上存在するタグで、平均値が高いものを並べてみた結果がこちらです。

image.png

なるほど、スローセックスが高く評価されていることがわかります。

タグを50個以上存在するものに限定すると、以下のようなものになりました。

  • 鈴木一徹
  • イケメン
  • ラブラブエッチ
  • ドラマ仕立て

image.png

鈴木一徹とは

image.png

・・・・・・・・

結論

大多数はイケメンとドラマティックにラブラブエッチでスローセックスがしたいので、僕らには希望がないことがわかりました。
淡い期待を持たせてしまって、大変申し訳ございませんでした。現場からは以上です。

今後もスケベKaggleは続けていこうと思うので、興味を持ってくださった方、日本スケベサイエンティスト協会のご入会ご希望の方はこちらのアカウントをフォローお願いします。

https://twitter.com/never_be_a_pm