見出し画像

名取さなの”おはツイ”の時刻は予測できるのか【夏休みの自由研究】

――――――
Note : データ収集が手作業であるため、データそのものおよび解析結果には誤りを含む可能性があります。あくまで「やってみた」という記事であり、当方には名取さなに対してお寝坊さんをはじめとする悪評広める意思はないことをご承知おきください。むしろよく早起きしてると思います。
――――――

はじめに

名取さなはTwitterにて「#名取がおはようする時絵がついてくる」というハッシュタグを用い、毎朝起床後にツイートを行っている(以下おはツイと呼ぶ)。

このおはツイは起床後にイラストを制作し投稿していると言及がある。

本研究ではおはツイ時刻の予測機をランダムフォレストで作成し、解析結果をまとめた。

ランダムフォレストとは下図のような決定木と呼ばれる予測モデルを、たくさん用意して予測の精度を上昇させる手法である。
データを読み込んで法則を見出し、法則からデータを予測すると読み替えてもおおむね問題ない。

画像
決定木のイメージ

結果:予測性能

おはツイ時刻予測機の性能としてはクロスバリデーションで評価したところ98分程度の誤差で予測できるようになった。(これじゃあ"早い"、"普通"、"寝坊"くらいしか判別できないんじゃ。。。)(でも1日1440分あるうちの7%程度だしそこそこか。。。?)

画像
用いたデータセットのおはツイ時刻

ちなみに収集したデータのおはツイ時刻はこのくらい散らばっている。

結果:重要特徴量

また、名取さなのおはツイを予測するのに重要な指標の割合は次のようになった。

画像
ランダムフォレストの特徴量重要度の割合

このグラフは名取さなのおはツイの予測を行うにあたって、各特徴量の寄与度を表している。

簡単に解釈すると、"前日のおはツイ時刻"と"前日最終ツイート時刻"とっても重要である。これらは覚醒時間、つまり起きてから寝るまでの時間の近似した値であることから直感ともかけ離れていないことがうかがえる。
その次には""(正確にはの照らされ具合)に注目することでおはツイ時刻の予測に役立つことになっている。

これらの重要特徴量について、おはツイ時刻に対してどのような影響を与えているかをさらに詳しく解析する。
SHAPを用い、まずは最重要特徴量である”前日おはツイ時刻”をグラフ化し見てみる。

特徴量解析:"前日おはツイ時刻"

画像
SHAPによる”前日おはツイ時刻”の影響解析

横軸が"前日おはツイ時刻"を分のみで表示したもの(例. 8時10分 = 8 × 60 + 10 = 490 [分])で、縦軸がSHAP値である。散布図の近似曲線をLOWESSを用いて描画している。
SHAP値が正の値であれば目的変数(ここではおはツイ時刻)を大きくする影響があり、SHAP値が負の値であれは目的変数を小さくする影響がある。また、SHAP値の絶対値が大きいほど影響度合いが大きくなる。

ここで特徴量について解釈すると、”前日おはツイ時刻"が小さいほどSHAP値が小さくなる。つまり、前日早起きだと翌日も早起きになりやすいという当たり前の生活リズムの話をしている。逆説的に名取さなは生活リズムが乱れまくってはいないともいえる。

特徴量解析:"前日最終ツイート時刻"

画像
SHAPによる”前日最終ツイート時刻”の影響解析

”前日最終ツイート時刻”についてもグラフ化する。まず、図の右部分は深夜にツイートしているとおはツイ時刻が遅くなるという夜更かしの話をしている。一方で、"最終ツイ時刻"が500~800(8時~13時程度)の午前中付近にもSHAP値が大きくなるサンプルが散見される。これは、午後にツイートしてなくても翌日起床が遅くなるパターンがあることを示唆しており、ツイートをしていなくても起きているし、夜更かしした時並に翌日のおはツイ時刻が遅くなることもあることを示している。

特徴量解析:"月"

画像
SHAPによる”月”の影響解析

最後に”月”の影響についてもグラフ化した。この月齢というパラメータは正確には月の照らされ具合を示しており、0 ~ 100 [%]の照らされている面積を値の範囲としている。つまりグラフに置いたアイコンのように0は新月で100は満月、50は上弦下弦を問わない半月を示す。
”月”の影響は先述の2つの特徴量に比べるとSHAP値の絶対値が小さいため影響度はある程度小さいが、それなりに素直な近似曲線が引けていることからもおはツイ予測に役立てることができる。解釈としては単純に月が出ていないと早起き傾向、月が出ていると遅起き傾向があると読み解くことができる。

満月になると(配信をするなどして夜更かしした結果)おはツイが遅くなる…妙だな…(名探偵並感)

おわりに

本研究では名取さなの「#名取がおはようする時絵がついてくる」の投稿時刻を予測するためのランダムフォレストを作成した。そしてランダムフォレストの特徴量を解析することにより、おはツイ時刻への寄与度を考察した。
月の満ち欠けに影響を受けるのってなんかカッコいいと思った。

さて、ここで気になるのは直近のビッグイベントであるところの名取さな 2nd Live「独ゼン者」の前日のだろう。

キービジュアルの衣装がかなりカッコカワイイと話題の2ndライブは2025年の11月13日らしい。この前日の11月12日はなんと下弦の半月であり、本研究の解析結果的には何とも言えない感じなのだ!

本研究ではもうちょっと突飛な結果になるかとも思ったが、意外と起きた時間と寝た時間が重要というまっとうな結果になったのが心残りだが、少しでも面白く読めていれば幸いである。

名取関連研究


いいなと思ったら応援しよう!

コメント

コメントするには、 ログイン または 会員登録 をお願いします。
名取さなの”おはツイ”の時刻は予測できるのか【夏休みの自由研究】|みくじ
word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word

mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1