ビッグデータ

情報システムのトピックス-PR-

情報処理学会デジタルプラクティス

ITpro

大規模リアルタイム解析エンジンJubatusの創り方

2014/06/27
岡野原大輔／海野裕也＝Preferred Infrastructure、熊崎宏樹／小田哲＝NTT （筆者執筆記事一覧）

記事一覧へ >>

　NTT PF研（現ソフトウェアイノベーションセンタ SIC）と株式会社Preferred Infrastructure（PFI）は2011年に大規模リアルタイム解析エンジンJubatusをオープンソースソフトウェア（OSS）として公開し、現在様々なビッグデータ活用の現場での利用検証を進めている．本稿ではJubatusの公開までの経緯、及びその過程でどのような試行錯誤、判断があったかについて述べる．特にJubatusはリアルタイム、分散並列、そして深い解析という三つの目標をまず掲げ、その実現に向けて様々な試行錯誤を行った．この目標を実現する際に、どのような選択肢があり現在の構成を採用していったかについて述べる．また、Jubatusは異なる強みを持った複数の企業が共同で企画／研究／開発を行い、その成果をOSSとして公開するという新しい研究開発の形をとって開発されている．こうした連携の背景や、そのメリットなどについて言及する．

1. Jubatus開発の背景

　Jubatus（ユバタス）はNTTソフトウェアイノベーションセンタ（以下NTT SIC）とPreferred Infrastructure（以下PFI）が2011年より研究開発を開始し、2011年10月よりOSS（オープンソースソフトウェア）として公開[1]、その後も開発を継続しているプロジェクトである．

1.1 現在のビッグデータ解析

　21世紀に入り、あらゆる分野で巨大なデータが生まれるようになった．こうしたデータはサイズが非常に大きい、生成速度が速い、データが多様であるといった特徴があり、これらをビッグデータと呼ぶ．

　元々ビッグデータ解析はウェブ業界で生まれ、特にGoogleやAmazonなどは大量のデータを蓄積し、データを活用し、ビジネス上の競争優位性を高めていった．例えば、広告配信の最適化や、検索エンジンのランキングの最適化、ECサイトのレコメンデーションなどである．

　こうしたビッグデータを活用しようという動きは、ウェブ業界から他の領域に広がりつつある．例えば、自動車、工場、病院、農業、製造業、エネルギーといった分野においては大量のデータが今後生成されると考えられ、これらのデータ活用を行うことで新たなビジネス開発や課題克服につなげられると期待されている．

　新しい種類のセンサの開発や通信技術の開発、データ蓄積のための基盤、クラウド技術の整備が進むにつれ、ビッグデータ解析における課題は、データの収集・蓄積から、データをいかに解析し活用するかに移りつつある．

1.2 リアルタイム化するビッグデータ

1 2 3 4 5 次ページ>> END

ツイート

連載新着記事一覧へ >>

金融分野におけるビッグデータ分析(2014/06/20)
楽天におけるビッグデータとその収集・解析基盤の構築(2014/06/13)

今週のトピックス-PR-

Twitter Facebook

この記事に対するつぶやき　（自分もつぶやく）

@nikkeibpITpro

この記事に対するfacebookコメント

nikkeibpITpro

コメント機能について

▲ ページトップ

ITpro NOW

情報システムの最新記事>>一覧

Twitterもチェック

@nikkeibpITproをフォローする

ITpro Active 昨日読まれた記事

Focus

ITproまとめ

記事カテゴリ

イベントINFO -PR-

特番/イベント

最新号

注目の書籍

好評発売中！

もはや「AV端末」! Xperia最新機種をフルに使いこなすためのガイドブック

｜ITproについて｜アクセス履歴の利用について｜ITproへのお問い合わせ・ご意見｜広告について｜サイトマップ｜日経BP書店｜
｜著作権・リンクについて｜個人情報保護方針/ネットにおける情報収集/個人情報の共同利用について｜利用規約｜ID統合について｜

Copyright © 1995-2014 Nikkei Business Publications, Inc. All rights reserved.
このページに掲載されている記事・写真・図表などの無断転載を禁じます。著作権は日経BP社、またはその情報提供者に帰属します。
掲載している情報は、記事執筆時点のものです。