エンジニアtype - エンジニアのシゴト人生を考えるWebマガジン
  • TOP
  • キーパーソン
  • 旬ネタ
  • コラボ
  • ノウハウ
  • 女子部
  • キャリア

SmartNewsが考える「良質な情報」とは?〜MAU400万を支えるアルゴリズムの進化を紐解く

2014/12/04公開

 
「私たちはアルゴリズムの力を信じている」と語るSmartNews代表取締役社長の浜本階生氏

「私たちはアルゴリズムの力を信じている」と語るSmartNews代表取締役社長の浜本階生氏

金融の世界では、デイトレーディングの7割がプログラムによって行われているとされる。流通業界では、eコマースの商品レコメンデーション機能を、やはりプログラムが担っている。機械学習や自然言語処理といったアルゴリズムの活用事例は、さまざまな分野へと広がりを見せている。

ジャーナリズムの世界もまた、その例に漏れない。先日「スマホポータル構想」を発表した『グノシー』のようなキュレーションアプリはもちろん、既存のメディアでも、データジャーナリズムや株価データに基づいた記事の自動生成など、アルゴリズムを活用したジャーナリズムのあり方を模索し始めている。

12月1日に初の事業戦略発表イベントを開催した『SmartNews』も、「マシンラーニングカンパニー」を自称する新興メディアの雄だ。「スマートエンジン」と名づけた情報解析基盤を武器に、日米で月間400万人のアクティブユーザーを獲得(12月1日時点)するなど、飛ぶ鳥を落とす勢いで成長を続けている。

「私たちが目指すのは良質な情報を必要な人に届けること。そして『良質な情報とは何か』という難題を解くために、原則として人を介さないアルゴリズムの改善に日々取り組んでいる。世界中の有益な情報を中立、多様な立場で世界中の人に届けることができるのは、スケーラビリティをもつアルゴリズムだけだと考えている」

スマートエンジンを独力で開発した代表取締役の浜本階生氏は、イベントで『SmartNews』の基本理念をそう表現した。

良質な情報とは何か――。ジャーナリズムにかかわるすべての人間が直面するこの難問を解くのに、アルゴリズムはどのような形で寄与できるのか。基調講演後に行われた個別セッション「アルゴリズムが果たすジャーナリズムへの貢献」に、SmartNews陣営が考えるその答えを探った。

アルゴリズムが得意なのは「大量のデータを高速処理すること」

『SmartNews』におけるアルゴリズム活用の概念図

『SmartNews』におけるアルゴリズム活用の概念図

セッションには、それぞれ技術顧問、外部スタッフとしてSmartNewsのアルゴリズム開発に携わる東北大学大学院情報科学研究科准教授の岡崎直観氏とPreferred Infrastructureの德永拓之氏、そしてSmartNews社員で、アルゴリズム改善の中心を担う中路紘平氏の3氏が登壇した。

人工知能学会前会長の山口高平氏も以前、弊誌の取材に対して話していた通り、アルゴリズムには現状、人間と比べて得意な部分があれば、苦手とする部分もある。ニュース配信という分野に限った場合も同様で、登壇した3氏がアルゴリズムが得意な部分として共通して挙げたのは、「大量のデータを高速に処理する」ことだ。

具体的には、大量の記事にカテゴリを付与する、記事中から人名などの情報を抽出する、レコメンデーション、「いいね!」や「シェア」といった人間のシンプルな行動から記事の人気度を測る、など。

これはどれも人間にも可能な仕事だが、記事が「大量」になると話は別。最大の違いは「アルゴリズムは疲れないこと」(徳永氏)というわけだ。

『SmartNews』のアルゴリズムも現状はこうした考えに基づいて、Web上をクロールして大量の記事を集め、それをカテゴリなどに分類し、最後に記事の重要度を判定して配置を決めるという役割を担っている。

一方で、おおまかにいって「それ以外」の部分は、アルゴリズムが苦手とするところ。一つ一つの記事をより深く理解したり、意味関係を理解したりすることは難しく、株価のデータから記事を生成するといった一部の単純な例を除けば、自然言語や文章を生成することもできていないという。

アルゴリズムとメディア人脈の複合技で、個々人への最適化にも挑む

「多くの人に良質な情報を届ける上で、アルゴリズムにできることはまだまだある」と話すSmartNewsの中路氏

「多くの人に良質な情報を届ける上で、アルゴリズムにできることはまだまだある」と話すSmartNewsの中路氏

しかし、現状で難しいからといって、アルゴリズムがそうした役割を担えないと結論づけているわけではない。

中路氏は「意味理解や文章生成が現状できていないのは、そういったことをまだ、アルゴリズムが得意とする『大量データの高速処理』という形に落とし込めていないからという側面もある」と強調する。

基調講演の中で浜本氏が触れていたように、実際、SmartNewsではすでに、文章が持つ表現の曖昧性や表記の揺れを解消して、より高度な理解をしようとする「一歩先」の固有表現抽出技術の開発にも取り組んでいるという。

「良質な記事」を「必要な人に届ける」というSmartNewsの理念に従えば、アルゴリズムがジャーナリズムに貢献できることはまだまだある、と中路氏は続ける。

「コンテンツの質・量を高めるという意味では、例えばスコアボードから野球の結果記事を自動生成できるようになれば、書く人の負担を減らし、より質の高いコンテンツを生み出す助けとなれるかもしれない。一方で多くの人に届けるという意味では、日本語の記事が自動的に海外で読めるようになれば『幅』が広がるし、個々人に合ったものを届けられるようになれば『深さ』を出すことができる」

個々人の趣味に最適化された記事の提供という意味では、同じニュースアプリの『グノシー』を連想させるかもしれない。この点については中路氏は慎重な姿勢も見せており、「海外ではフィルターバブルの問題などが活発に議論されている。ナイーブに一つのアルゴリズムでの解決を目指すのではなく、いくつかのアルゴリズムの複合技で取り組んだ方がいい面もある」(中路氏)と話している。

アットマーク・アイティ創業者の藤村厚夫氏、元ハフィントンポスト編集長の松浦茂樹氏ら、既存のメディア業界から人を集めているのも、彼らが持つ問題意識を受け取り、それをいかにアルゴリズムに落とし込むかに挑戦しているからだという。

「いかに届けるか」も最適化するレイアウトアルゴリズム

『SmartNews』の記事と広告の表示ロジックの概念図

『SmartNews』の記事と広告の表示ロジックの概念図

「記事を届ける際に、コンテンツ本来の価値を損なわないこともすごく重要と考えている」と中路氏。記事を「いかに届けるか」は、記事を集めることと同じかそれ以上に『SmartNews』がこだわり、アルゴリズムを活用している点だ。

「レイアウトアルゴリズム」は、その分かりやすい例の一つ。

Web上をクロールしてDLされた各記事は、それぞれが持つ「画像」、「テキスト」、「記事スコア」といった情報を基にリスト化され、どこの位置に表示されるかが決定される。

それに従ってレイアウト全体の高さが決まり、最後に画像の表示サイズが動的に変更される。これらの動きがすべてアルゴリズムによって自動的に行われる。

今回のイベントでは収益化のためのモバイルニュース広告事業が新たにスタートすることも発表されたが、「Ads as Contents」のコンセプトが示す通り、基本的な考え方は、広告も記事も同じ。

DLされた時点では別々にリスト化された記事と広告は、アルゴリズムによって1個の直列したコンテンツリストにマージされ、ロジカルにレイアウトが決められる。

ほかにも、形態素解析により品詞を判定し、見出しの改行位置を決めるなど、「いかに届けるか」へのこだわりはさまざまな形で表現されている。こういった部分もアルゴリズムの改善により、どんどん進化できるというのが、『SmartNews』の考えのようだ。

アルゴリズムが記事を「作る」日は来るのか

『SmartNews』のアルゴリズム開発は、浜本氏の個人的なプロジェクトから始まった

『SmartNews』のアルゴリズム開発は、浜本氏の個人的なプロジェクトから始まった

スマートエンジンは、まだSmartNewsという会社もなかった当時、浜本氏の個人的なプロジェクトとしてスタートした。自宅の部屋に10台のサーバを並べ、「クローリングマニア」と称される浜本氏が1人で、大量のWebデータを解析していた。「エアコンと電子レンジを同時に付けると電源が落ちるような、深刻な欠陥を抱えた環境でした」(浜本氏)

しかし、それから数年のうちに、スマートエンジンの安定性は飛躍的に向上し、研究開発は圧倒的に進んだ。社員60人の企業となり、海外展開やさまざまな新事業を立ち上げた今も、SmartNewsがその中心に据えているのはアルゴリズムの改善だ。

現状は記事を「見つけ」、「届ける」ところに特化して使われているアルゴリズムが、難しいとされている「作る」領域にまで本格的に踏み込む日が、いずれやってくるのだろうか。

取材・文・撮影/鈴木陸夫(編集部)




編集部からのお知らせ

エンジニアに人気の求人

エンジニアtype姉妹サイト