読者です 読者をやめる 読者になる 読者になる

agbt - anime, game, book, task -

アニメやゲームや本や仕事など。

はてブ人気記事の判定アルゴリズムについて

t(ビジネス) t(ブログ)

今回は、はてブの「人気」に表示されるアルゴリズムについて。

 

先月「はてなブログ」を始めるとき、せっかくなら「はてなブックマーク」の人気記事に載れるレベルを目指そうと漠然と思っていました。目標がないと動かないタイプのため。

でも、書けば必ず読んでもらえるほどネットの世界は甘くない、良いものを書けば必ずしも当たるわけではない・・・それがネットの世界。ネットメディアの運営などを通じて、そのあたりは痛感していました(良い記事を書けていたかどうかは別として)

 

というわけで。

このたび知人の会社と協力して「はてブ」についていろいろ調べてみました。

きっかけとなったのは、こちらのエントリー。

 

 

今回は、こちらの記事内容を踏まえて、個人的に「はてブ」について調べたアレコレを共有できればと思います。

 

仮説1:3ブクマで新着エントリーに掲載される

はてブ」には、ジャンルごとに「新着」「人気」の2つのカテゴリがあります。後者はよく「ホッテントリ」などとも呼ばれますね。上記エントリーによれば、3ブクマされると「新着」カテゴリに、そこからさらに伸びると「人気」カテゴリに移るようです。

 

個人的に、この動きはその通りだと思います。

というのも、この「3ブクマ」という数字、わりと特別な意味を持っていることがユーザーにも示唆されています。それは「ブクマ」するときに表示される以下の画面からも分かります。

 

20151112163405

 

ご覧の通り、2ブクマまでは右上のユーザー数の表示が黒いままですが、3ユーザー目としてブクマすると赤い太字に変換されます。

筆者はこれを初めて目にしたとき、3usersになにか特別な意味でもあるのか? と思い、調べていたら上記エントリーにぶつかりました。実際、2ブクマで「新着」に表示されている記事を見かけた記憶はありません。

 

仮説2:短時間のうちにブクマされる必要がある

また、単に3ブクマされれば良いというわけではなく、そのタイミングが重要そうです。と言うのも、ブクマ数が同じ2つの記事が「人気」と「新着」で分かれている光景は、よく目にするからです。どこかのジャンルの「人気」と「新着」のエントリーを眺めていると、おそらくわりとすぐ見当たると思います。

 

たとえば、昨晩の20:00〜23:59に掲載された「暮らし」の「人気」と「新着」エントリーについて見てみたところ、以下のようなケースが見られました。

 

  • ブログA:初ブクマ・20:00台 - 16ブクマ - 人気カテゴリ
  • ブログB:初ブクマ・20:00台 - 16ブクマ - 新着カテゴリ
  • ブログC:初ブクマ・20:00台 - 37ブクマ - 新着カテゴリ

 

ブクマ数だけで言えば、ブログCの記事は「人気」カテゴリに入っているはずです。ですが、そうはなっていません。このことから、はてブ「人気」カテゴリに選出されるには「ブクマ数」もそうですが「ブクマされるタイミング」が重要だと分かります。

 

つまり「人気」カテゴリに自分の記事を上げるためには、記事の質も当然ですが、読者がいつ自分のブログに訪れているのかを見極める必要もあるということですね。どれだけクオリティの高い記事でも、知ってもらえなければ意味がありません。

 

仮説3:15〜20分以内に3ブクマで「新着」カテゴリ入り

では、具体的にどれくらいの時間に3ブクマされれば良いのでしょうか?

これは以前、仕事先の皆さんとメディアに協力してもらい(というか仕事外の暇潰しで)実験してみましたが、正直よく分かりませんでした。

ただし、あまりに短時間のうちに一気にブクマがつくと、スパムだと判断されるらしく、はてブのページが「noindex|nofollow」扱いとなります。

 

20151112164206

 

画像の右下をご覧いただくと、赤背景に白抜き文字で「noindex」「nofollow」と書いてあります。これはFirefoxのアドオンで、開いたページが「noindex」「nofollow」だと、こんな感じで赤く表示されます。

 

noindexとnofollowについては、以下の説明を引用させていただきます。

 

noindexとは

noindex は、メタタグと呼ばれるものの一つで、サイト内のあるページを検索エンジンにインデックスさせないために使う。サイトの検索順位が決まるまでのプロセスは、「①クロール → ②インデックス → ③ランキング」の3つのステップがあるが、noindex はこのうち、2番目のインデックスで止めるということだ。

そして、noindex が設定されたページは、検索結果には表示されなくなる。

(参照:バズ部「noindexの使い方」より)

 

nofollowとは

nofollowって何よ、という方に簡単に解説しておくと、「nofollow指定されたリンク先にPageRankを渡さない」「nofollow指定されたリンクをクロールの対象リストから除外する」というものです。簡単にいえばSEO上そのリンクの価値がなくなるということですね。

(参照:SEO HACKS 公式ブログ「外部サイトへのリンクには漏れなく”nofollow”とか、いい加減やめませんか」より)

 

noindexはメタタグ、nofollowはアンカーリンクに記述するようです。噛み砕くと、前者は「検索エンジンさん、このページは検索結果に出さないでね」ということ。後者は「このリンクからウチのサイトに飛んでこないでね」ということでしょうか。

後者の使われ方としては「このサイトをリンクするとウチのサイトの評価が落ちる」というサイト(アフィサイトなど)をリンクするときに記述するようです。こうすることで、googleに「あ、このサイト、アフィサイトなんかリンクしてやがる! 評価下げてやれ!」とならないように対策しているのでしょう。

 

なんか難しいですが、簡単に「はてブ」のページが人目に触れなくなる程度の認識で良いでしょう。おそらく身内で一斉にブクマしてホッテントリに突っこまれるという事態を避けている(ブクマスパム対策)のだと思います。

 

仮説4:IPアドレスとか拾われてるっぽい

ただ、ここで一つ疑問。

もし「短時間で一気にブクマ数が伸びたら、noindex|nofollow」(以下、便宜上「BANされた」と表記します)だとすると、多くの人気記事がその犠牲になっているでしょう。

となると、単純に「短時間にブクマ数が伸びた」ことが原因とは考えにくいです。ですが、実際、短時間のうちに一気にブクマするとBANされるので、ほかに要因があるということですね。

 

知人と一緒に考えた結果、考えられるのは「IPアドレス」でした。

つまり「同じIPアドレスから一気にブクマするとBANされる」というわけですね。たしかにそのときはオフィス内のwifiを使っていたので、全員が同じIPアドレスからブクマしていました。もしIPアドレスを拾っているのだとすれば、ここから「あ、こいつら身内で自分たちの記事をホッテントリにつっこもうとしてやがるな!」と判明します。

 

となると、会社でメディアを運営されており、ホッテントリ入りを狙っている皆さんは注意が必要かもしれませんね。多くの社員が「会社のために」とブクマしまくったら、逆に「はてな」からBANされたとなっては、泣くに泣けません。善意で起こした行動が最悪の結果を招くという・・・。

 

仮説5:1ブクマ目から3ブクマ目までの時間が重要

これは「過去に掲載して、ブクマがついていない記事をブクマしたら、どうなるのか?」と思い、実験してみました。

先に紹介したBANされた記事ですが、これは10月の下旬に掲載され、最初にブクマしたのは11月初旬でした。つまりあいだが1週間くらい空いています。

そして、最初にブクマしてからおよそ10分以内にみんなで一斉にブクマ。結果として「新着」カテゴリに表示されました(そのあとわりとすぐにBANされました)

 

このことから、過去に1ブクマもついていない記事であれば、やろうと思えばいまからでも「新着」カテゴリに入る可能性があるということですね(もちろん、身内でブクマを増やすのはBAN対象となるので、止めておきましょう)

 

仮説6:1時間以内に5ブクマで「人気」カテゴリ入り(?)

仮説7:メディアの大きさは関係ない

今朝方「暮らし」のカテゴリで、はてなニュースの記事とリクナビNEXTの記事が、5ブクマでホッテントリ入りを果たしていました。

両記事は11時05分前後に掲載されており、筆者がホッテントリ入りを確認したのが、11時40分頃。30分以内に5ブクマされると「人気」カテゴリにストレートに入るのでしょうか。あるいは大手サイトであることが影響しているのでしょうか。

このあたりについては、まだ不明なところが多いです。ただ、大手メディア(ロケットニュースやねとらぼ、日経ビジネスオンラインなど)の5ブクマ以上を獲得した記事でも「新着」に載りっぱなしなのを確認しているので、メディアの大きさ(PV数など)や知名度は関係ないと思われます。

ちなみに、その後、はてなニュースの記事はホッテントリに入り続け、リクナビNEXTの記事は「人気」カテゴリの下の方にある「新着エントリー」の行に移動されていました。

 

仮説8:starの数に特に意味はなさそう

そのままですが、starの数は特に意味はなさそうです。これは単純にユーザー間のコミュニケーションツールとして使われることだけ想定しているのだと思います(となると、色の違いってなんだろうとも思うのですが・・・)

 

仮説9:初動を逃すと「人気」には上がれない(?)

「新着」カテゴリから「人気」カテゴリに移される基準ですが、正直まだ分かりません。

以前に5記事ほど人気エントリーに掲載されたのですが、最終的なブクマ数は15〜45くらいまでと幅広いです。
そのときの所感なのですが、おおよそ「1ブクマ目から1時間以内に5〜10ブクマを超えると「人気」に移る」のではないかなと考えています(1時間5ブクマと先に書いていますが、正直10くらいは見ておいた方が良い気がします)

 

ただ、「初動」を逃すと「人気」カテゴリには移れないというのは、わりと信憑性があるのではないかと考えています。初動とは先述した「15〜20分以内に3ブクマされて、新着に入ること」です。

 

仮説10:新着→人気の移動には条件が(最低)2つ

こう考えるに至った理由は「ブクマ数が人気記事レベルなのに、新着に残りつづけている記事」があるからです。

 

本日の「暮らし」カテゴリのなかに、ブクマ数が20〜40規模であるにも関わらず「新着」カテゴリに入っている記事が複数見つかりました。

このことから「いくらブクマを獲得しても、人気記事に移動できない」条件づけが存在するものと思われます。

 

「人気」カテゴリを目指すには、2つの壁を超える必要があると考えられます。

 

  • 条件1. 1ブクマ目から15〜20分以内に3ブクマまでいくこと → 「新着」に表示される
  • 条件2. そこから30分以内(条件1.と合わせて約45〜60分以内)に10ブクマ超までいくこと → 「人気」に移動される

 

条件1. を逃すと、たとえ条件2を満たしても「新着」止まりなのではないかと。

 

その他

ほかにも「人気と新着の境界に7ブクマの記事が多いのはなぜ?」など、いくつか不思議な事象を確認したのですが、なにも分析できていないので、今回は割愛します。また暇なときにでも調べてみて、なにか気づいたことがあったらご報告してみようかなと思います。

 

2015/11/12 17:56 追記

2ブクマされると、トップページにある「はてなブログからの新着」の部分に掲載されます。これも確認済みです。

 

20151112175752

 

ここですね。なにか追記がありましたら、またちょこちょこ書いていければと思います。

 

2015/11/12 18:24 追記

本エントリーが【 9ブクマ 】で「人気」カテゴリに並びました。皆さん本当にありがとうございます。

1ブクマ目が17:36のため、60分経過していませんでした。よって、30分以内に判定が為されていたことが分かります。先述した「30分以内に5ブクマ」「60分以内に10ブクマ」のうち、前者の条件の方が信憑性が高そうです(別に第三の条件があるような気もしますが)

 

20151112182718

 

2015/11/12 18:34 追記

記事投下のタイミングについてブコメいただいていたので、個人的に考えていることを簡単にコメント。

 

いただいたブコメにあります通り、読者がいつブログを読んでいるのかを分析するのは非常に大切だと思います。また、もう一つ「投下した記事のジャンルに関心のある読者がネットにいる時間」も重要だと考えています。

たとえば、はてブの「テクノロジー」ジャンルに該当する記事を投下する場合、筆者は22:00〜23:00ごろが良いのではないかと考えています。同ジャンルの記事だと、深夜帯にもわりとブクマがつく印象です。

 

また、深夜間際に投稿すると、新着カテゴリに掲載される時間が長くなるメリットもあると思います。

深夜にブログをアップする人はあまりいません。よって、日付が変わるころに投稿して「新着」カテゴリに入れば、次の日の朝まで新着に残りつづけられます(理論上は)

 

逆に「暮らし」や「学び」といった記事は、17:00〜18:00が良いのではないかと。17:00は早い会社はすでに退勤時刻です。その帰りにスマホを使用する方も多いでしょう。

 

2015/11/12 18:43 追記

はてなスターについてもブコメをいただきました。本当にありがとうございます。スターについてはまだ知らないことが多すぎるので、ぜひ色々と調べてみたいです。

 

2015/11/12 18:55 追記

「人気」カテゴリの4行目に並んでいたのが、3行目→2行目と移動してきました(トップの1記事を除く)。確認したタイミングを振り返りますと、どうやら30分単位で判定が為されているものと思われます。

 

2015/11/12 20:54 追記

ブクマスパムに関するコメントをいただきました。本調査は一緒に仕事をしている企業の知人に頼んで筆者のブログの一部記事を用いて行っております。また、法人メディアと個人ブログにおける差を調べるために、同メディアのある記事に集中的にブクマしたのは事実です(それが上記のBANされた記事になります)

 

数年前の記事がいきなり新着に上がるというご報告をいただきました。このブログはまだ1ヶ月も経っていないので、正直そこまで調べきる力がございません。なにか分かることがあれば、またご連絡できればと思います。共有ありがとうございます。

 

2ブクマでも新着に載っているのを見かけた方からご報告をいただきました。ありがとうございます。現状、筆者の方で確認できているのは、トップにある「はてなブログからの新着」に掲載されるまでです。どうやら、まだ気づけていない判定条件があるようです。

 

2015/11/12 22:00 追記

互助会に関するコメントをいただきました。ありがとうございます。

はてブには以前、フィルターがあったそうですね。いつも同じ人からブクマされているブログの記事は、いくらブクマを集めてもホッテントリに入らないような仕組みだったそうです。これが撤廃された理由は調べてみても判然としなかったのですが、思うに「偶然そうなってしまって不利益を被る」可能性を考慮したのではないかと思います。

 

筆者も、互助会は正直、あまり好ましいあり方だとは考えていません。記事の力ではなく、ブクマ数で底上げしているような印象を受けるからです。実際、いまのはてブですと、ブクマ数とキャッチなタイトルだけで、自分のブログやサイトに人を呼ぶことはできるのではないかと思います(もちろん、キャッチなタイトルを考えるのも、それはそれで大変な作業ですが)

 

今回、はてブの仕組みを仮説なりに調べ、たとえば「記事を投下するタイミングが重要なんだな」など、少しでも気づきを提供できればと思っておりましたが、場合によって互助会促進になりかねない点までは、追記するまで踏みこめておりませんでしたので、改めて追記させていただきました。ご指摘ありがとうございました。

 

また、互助会を可視化されたことがある方から、記事のご紹介をいただきました。非常に興味深い内容でしたので、こちらでも共有させていただきます。

 

 

2015/11/15 23:15 追記

ブコメにて、運営さんが「はてブ」をどう考えて運用しているのか感じ取れる記事をご紹介いただきました。本当にありがとうございます。

 

 

「ユーザーが面白いと思った記事をちゃんと表に出す」というのが、一貫した考え方のようですね。結果として、それがフィルタの廃止などにもつながったのでしょうか。

余談ですが、この記事を読んで、自分がこれまで感じていた「行き過ぎた互助会に対するモヤモヤ」が少し明確になりました。なんだか「割りこみ乗車」されたときに感じるモヤモヤに近かったです(理由をうまく言語化できないのですが・・・)

 

また、はてブより検索を見込めるワードを重視した方が良いというブコメもいただきました。ありがとうございます。筆者も、その意見に賛成です。しっかり「誰に対して」「どんなことを」「どのレベルで」「どんな風に」伝えていきたいのか、そのあたりをしっかり考え抜くことが、結果的に互助会を通して手に入れたいもの(筆者はそれをPVだと考えております)も多く手に入ると思います。

なかなかそうならないのは、おそらく「はてブ」というコミュニティが存在することで、そこでのPVを見込める記事を書こうという発想になってしまうのではないかと考えています。

 

2015/11/15 23:45 追記

S/N比についてブコメいただきました。ありがとうございます。

今回の記事ですが、皆さんがそれぞれのブログをより活性化する気づきを与えられればと思い、書かせていただきました。たとえば、投稿時間を精査すれば、それまで埋もれてしまっていた良記事が、もしかしたら多くの人に読んでもらえるようになるかもしれない(ブクマされることによって)、そうした流れを期待していました。

ですが、記事全体が「こうやってブクマすれば、新着や人気に載りやすいよ」といった見え方になってしまっているのは、まさに反省点です。ご指摘いただき、本当にありがとうございます。

ただ、掲載後の記事を大きく改稿することは相応しい対応ではないと思いますため、こちらに追記する形で、筆者の意図を掲載させていただければと思います。重ね重ねになりますが、コメントありがとうございました。

 

2015/11/16 00:20 追記

「追記多すぎワラタw」ありがとうございます! 我ながら暇なものだと恥ずかしく思っております(苦笑)ブコメからも自分にとって貴重な意見を多々いただいており、備忘として残していければと、ひたすら追記しております(なんだかTASみたいです)

フィルタをなくしたのは、そういう意図もあるのかもしれないのですね。個人的にも今後よりユーザーが使いやすくなることを願っております。