CodeIQ MAGAZINECodeIQ MAGAZINE

CodeIQ MAGAZINECodeIQ MAGAZINE

はてなのサイト判定アルゴリズムを使って開発したアドテク「BrandSafe はてな」は何を目指す?

2015.07.24 Category:注目ビジネス・技術トレンド Tag: ,

  • このエントリーをはてなブックマークに追加
hatena

「はてなブックマーク」のサイト判定アルゴリズムをもとに開発された「BrandSafe はてな」。不適切な広告掲載先ページを瞬時に自動判定し、広告配信を抑制するアドベリフィケーション機能だ。

はてなの技術は、このアドテクノロジーにどのように活かされているのだろうか。この開発にあたったエンジニアと事業開発マネージャーに話を聞いた。
by 馬場美由紀 (CodeIQ中の人)

不適切なサイトに広告は出せない。広告主のブランド保護が課題に

ネット広告を支えるアドテクノロジーは、いま急速な進化を遂げている。例えば、広告在庫の買い付けから配信、ターゲティングなどを一括して管理できる広告配信プラットフォームが整備されてきた。媒体側(DSP)と配信側(SSP)がリアルタイム入札(RTB)を行い、最も良い条件で広告の売買を行う。

これまでのように、サイトの広告枠ごとに広告を配信する仕組みに比べ、RTBは広告一表示ごとに価格を決めることができ、また、ユーザーの行動履歴や属性をもとに適切なターゲットへ配信することが可能だ。

だがこれだけでは、広告主はどこに自社のバナー広告が出ているのかがわからない、わかったとしても配信後になってしまう。数千万を超える広告配信先サイトの中には、広告を掲載することで逆に企業のブランド毀損が発生するようなサイトが含まれることがある。

例えば、家庭用掃除機の広告が知らない間にアダルトサイトに登場していたのでは、ブランドイメージは台無しだ。だが、現実的にはこれらの不適切サイトを全て目視で事前チェックすることは不可能だ。そのため、アドベリフィケーションと呼ばれる技術が欧米を中心に発展してきた。

▲アドテクノロジーについて語る 株式会社はてな ビジネス開発本部 事業開発部 マネージャー 大久保亮太氏

アドベリフィケーションとは、広告が広告主のイメージ低下を招くようなサイトに配信されていないか、ユーザーが認識できる場所に適切に掲載されているかなどを確認して配信をコントロールする技術だ。

しかし、欧米の技術は、日本特有のネットカルチャーに対応していないなどの問題があり、国内市場での普及は遅れていた。実際、海外技術をそのまま日本のサイトに適用すると、カテゴリー的に分類できないサイトが多数発生するなど遺漏も目立った。

一方で、近年は違法サイトの広告収入に対し警察も監視を強めており、日本の現状にフィットするアドベリフィケーションへの期待感は高まっている。そこに登場したのが、はてなとDSP企業フリークアウトが共同で開発した日本発アドベリフィケーションサービス「BrandSafe はてな for FreakOut」である。

はてなのサイト判定アルゴリズムを基に構築

アドベリフィケーション技術の基本は、不適切なWebページを分類して、フィルタリングすること。手動では無理なので、ルールベースや機械学習エンジンを使うことになるが、そこで活きてくるのが、はてなが培ってきた「はてなブックマーク」の技術だ。

はてなブックマークをきっかけに、TwitterやFacebookなどのソーシャルメディアに拡散されやすくなることから、不正な掲載を目的としたスパム投稿も多く、はてなは長期に渡ってこの問題への対策と改善に取り組んできた。

▲「BrandSafeはてな for FreakOut」開発担当 株式会社はてな ディレクター 山家雄介氏

今回の「BrandSafeはてな」は、スパム対策などに使われているサイト判定アルゴリズムを基に構築されている。日本特有のネットスラング(隠語)への対応を強化することで、違法アップロードやアダルトサイトだけでなく、「2chまとめ」も判定できる。

広告主の指定する不適切ページを判別することで、広告買付は抑制され、結果的に広告主は自社のブランドを毀損する可能性を減らすことができる。

また、2chまとめでよくみられる、誤クリックを誘発するような掲載面には広告を配信しないようにすることができるため、広告主は広告効果を最大化することが期待される。

「リクエストに対する返信は50ミリ秒以内」の掟

はてなが自社の技術をアドテクに投入し、事業化するのは初めてのこと。最初のプロトタイプ設計から関わった山家雄介氏は開発時の課題をこう語る。

「DSP事業者としては、不適切ページを精度よく判定できることはセールスポイントになりますが、その技術を仕込むことでRTBのスピードが落ちてしまっては意味がありません。一般的に、RTBでは入札リクエストに対する返信を50ミリ秒以内で行わなければならないとされています。今回のフリークアウトさんからの要求仕様もそうでした」

ところが、最初のプロトではその要件を満たせなかった。当初はDSP(フリークアウト)のデータセンター側にアドベリフィケーション・サーバーを設置し、リクエストが発生するたびにはてな側とサーバー間通信を行うようにしていた。この通信がボトルネックになっていたのだ。

「そこでシステムのアーキテクチャを変更することにしました。まず、フリークアウトさんからあらかじめ一定時間内のサイト情報のリクエストを受けて、はてな側でURLの正規化を行った上で、独自のサイト判定アルゴリズムで2chまとめ、違法ダウンロード、アダルト、炎上などに分類して判定しておきます。この判定結果をDSPに返し、DSPはそれをデータとして保持しておくことで、より高速にサイトの判定が行えるようにしました」

判定エンジンのチューニングによる精度の向上も、今回の重要なポイントだ。

「判定エンジンをチューニングするにあたっては、AdaBoostと呼ばれる考え方を採用しました。超強力な分類器を一つ置くのではなく、一定の強さを持った分類器を複数、最適な重みで組み合わせることで、全体としては精度を高めるという考え方です。例えば前の分類器が誤判定した入力については、後の分類器では重みを上げて学習する、というようにします。こうすると計算も実装も簡単になり、精度も向上します」

ポストビット方式では市場に受け入れてもらえない

「BrandSafe はてな」の開発メンバーの多くは京都オフィスにいる。フリークアウト側にもエンジニアはいて、その間をつなぐ必要がある。営業サイドでその役割を担ったのが、事業開発部マネージャーの大久保亮太氏だ。

「私自身はエンジニアではないのですが、どういう機能を実装すべきかの仕様策定から関わっています。例えば、最初はポストビット方式でいこうという話だったんです。ポストビットとは、入札を終えた後に広告出稿ページの判定を行い、もしそこが不適切だと判断された場合は、ブランドロゴのないバナーを表示したり、白枠のままにしておくというもの。ポストビット方式なら、DSPとはてなのシステムをそんなに密につなげなくてもいい。システム構築も比較的簡単です」

ただ、ポストビット方式の場合、入札は終わっているので、たとえ広告出稿がされなくても、広告主には広告料の請求が行ってしまう。市場ニーズとして受け入れられるだろうか、という議論がすぐに起こった。

「やはりポストではなく、プレビット。入札の直前にページ判定できたほうがいいよね、ということになりました。開発側は大変になりますが、やはり多くの企業に使ってもらいたいですから」

市場や顧客のニーズと自社の開発側の技術をどうマッチングさせるかは、システム開発企業では常に頭の痛くなる問題ではある。

「でも、今回はそんなにギャップは感じなかったですね。そもそも、フリークアウトさんには優秀なエンジニアが多く、かつDSPは他の事業者とコラボするのに慣れている。他社との共同開発は当たり前のようなんです。それぞれのエンジニアはSkypeで綿密な打合わせを重ねていましたし、技術的には難しいことへのチャレンジだったけれども、決して無理難題をふっかけられたということはなかったですね」(大久保氏)

「会社の収益に貢献」「社会的に良いことをしている」という実感

「インターネットを良くしたい」は、はてなの企業理念でもある。「BrandSafe はてな」の開発中に、山家氏の頭を常に占めていたのもこの思いだった。

「Webを利用していて、素敵な広告が適切なサイトに掲載されていればユーザーは嬉しい。インターネット広告を良くすることは、ユーザーの体験も良くすることにつながります。BrandSafeの開発を通して、私の中には社会的に良いことをしているという感覚がずっとありました」

アドテクエンジニアはやりがいのある仕事だ、と山家氏は言う。

「アドテクがいいのは、エンジニアの技術力が直接、会社の売上げや収益に反映されることじゃないですかね。例えば、50ミリ秒内にビットを終わらせるという壁。この壁を突破できるのはエンジニアしかいない。自分の技術のクオリティが、そのままダイレクトにサービス向上につながり、プロダクトが売れていく。そういう実感が、他のエンジニアに比べても多いんじゃないかと思うんです」

はてなが始めたアドテク「BrandSafe はてな for FreakOut」。フリークアウトの発表によれば、2014年8月のリリース後、約半年で導入広告主数は50社を突破。累計で24億以上のインプレッションを配信したという。山家氏、大久保氏らの努力は、確かな手応えで報われつつあるのだ。

──執筆:広重隆樹/撮影:刑部友康

【リクナビNEXTジャーナルで公開中!】
はてなの営業は考える。広告企画は数値以上に「ユーザー経験がどれだけ豊かになったか」が大切なんだと。

オウンドメディア構築ツール「はてなブログMedia」など最近の商材を軸に、はてなビジネス開発本部・営業部長の高野政法氏に、その格闘を聞いた。

記事を読む

自分の書いたコードを誰かに評価されたいエンジニアは、けっこう多い?

ITエンジニアのための実務スキル評価サービス『CodeIQ』で出題されている「コード銀行」問題に挑戦すると、あなたのコードが評価されます。

評価(1)出題者からの評価  ⇒評価フィードバック例を見る

  • 企業ではたらくという観点からあなたのコードをチェックします
  • フィードバックされた観点をふまえてコードを書くと世の中の企業にとって「いいコード」が書けるようになります

評価(2)企業からの評価  ⇒評価フィードバック例を見る

  • 「あなたと一緒にはたらきたい」という企業からスカウトが届きます
  • あなたのコードが社会でどこまで通用するか、リアルな評価が得られます

興味を持った方はこちらからチャレンジを!

  • このエントリーをはてなブックマークに追加

■関連記事

今週のPickUPレポート

新着記事

週間ランキング

CodeIQとは

CodeIQ(コードアイキュー)とは、自分の実力を知りたいITエンジニア向けの、実務スキル評価サービスです。

CodeIQご利用にあたって
関連サイト
codeiq

リクルートグループサイトへ