Yahoo! ビッグデータインサイト

見えなかったものが見えてくる。ビッグデータ分析で収益拡大!

データ分析の課題「遅い・高い・難しい」を解決!

ヤフー株式会社 Treasure Data, Inc IDCフロンティア
ビッグデータの収集・保存・分析をワンストップで提供するクラウド型のデータマネジメントサービス(DMS)

SERVICE

必要なのはデータだけ。ビッグデータの収集・蓄積・分析をワンストップで実現できる分析基盤。

大規模な設備投資も基盤開発もインフラ運用も不要!従来とは全く異なるスピードでビッグデータ分析が始められる!
国外持ち出し不可の機密データも安心して保管できる国産クラウドサービスです。

RAPID START

RAPID START

初期投資ゼロ・長期契約不要。サンプルデータで、簡単かつ無料で始められる!導入からわずか数週間でデータ分析を開始できます。
有償利用は1ヶ月から。

SIMPLE

SIMPLE

データを送れば分析できる。データ収集、蓄積、分析のためのインフラをそれぞれ構築し、管理する複雑さはありません。

SECURE

SECURE

インターネットでのデータの送受信はSSL暗号化を実施。さらにオプションで閉域網での接続が可能。データは分散保存され、国内データセンターに蓄積するため、国外持ち出し不可の機密データも安心して保管可能です。

FOCUS

FOCUS

ビッグデータの分析に必要なインフラ構築も、日々増加するデータ量への対応も不要だから、限られた人的リソースを分析に特化させることが可能です。

ビッグデータ分析に必要な基盤がトータルで揃う

データ分析の基盤構築にあたり、他の製品やサービスを組み合わせる必要はありません。
クラウドだから、データ容量や処理性能を気にせず使え、インフラから解放されます。
エンジニアはデータ収集に集中できるのでスピーディに分析にとりかかれます。加えて、お客様のBIツールと連携させることで、エンジニアでなくともデータ分析が可能になります。

収集・蓄積・分析をワンストップにサポート

*1:オープンソースに関する操作・設定などのお問い合わせは含まれていません。ご希望の方には別途有償サービスをご案内させていただきます。
*2:プライベート回線は、別途当社のプライベートコネクトサービスのご契約が必要となります。

分析基盤インフラはIDCフロンティアデータセンター内の
クラウド基盤で稼働し、24時間365日監視しています。

MERIT

ご利用メリット

高速並列処理

従来型RDBでは時間がかかる大容量データを短時間で出力できる分散フレームワークを採用。データ圧縮やデータ集計に強いカラム型データベースにより従来型RDBの10倍以上の性能*を実現。

*2014年7月当社調べ。


スケーラビリティ

データを処理するサーバーのCPUは8コアから最大で32コアまでバースト可能。データウェアハウスのクラウドサービスだからCPU/メモリやストレージのキャパシティを気にせず使える。

無料から始められる

重要性は高くても費用対効果を求められるデータ分析は、まずは無料のスタータープランから。 有償プランも1ヶ月単位で使える月額制だから初期投資のリスク無し。


親和性

世の中で広く普及している ログコレクタ“Fluentd”の開発元
Treasure Data, Inc.の データウェアハウスサービス。データ収集・蓄積・分析がシームレスにつながる。

SQL互換

使い慣れたSQLライクな言語でバッチやアドホッククエリによる大容量データの分析が可能。APIやGUIからレポーティングやBIツールなどへの連携も。

スキーマレス

従来型のデータベースではリスクの高いスキーマ変更も、スキーマ変更なくダイナミックにデータを処理可能。とにかくデータを収集し、データを見ながらスキーマを考える従来とは逆のアプローチが可能。



一般的なHadoopと比較して非常に高速

一般的なHadoop
Treasure Data Serviceのhadoop

スキーマレスDB採用により、データ投入・変更前のスキーマ設計
(テーブル定義)が不要

データ投入前のスキーマ設計が不要
新たな属性のデータ追加前ののスキーマ設計が不要

既存の資産・知識を活かして、従来のRDBとは全く異なる
アーキテクチャの分析基盤を使うことができます。

通常のhadoop
データウェアハウスはオープンソースとして広く普及している ログコレクタ“Fluentd”を開発するTreasure Data, Inc.が開発。Fluentdのrpmパッケージのtd-agentを使えば、データ収集・蓄積・分析の3要素がシームレスにつながります。
一般的なHadoop
Hadoopを使いこなす知識・経験は不要。使い慣れたSQLライクな言語で大量データの分析が可能。GUIから簡単にHiveによるバッチクエリやPrestoによるアドホッククエリ(提供予定)の実行も可能です。
通常のHadoop
分析結果はサービス内のテーブル保存に加え、外部のシステムへのデータ出力が可能です。

また、JDBC/ODBC*をサポートし、BIや解析ツールなどのお客様のシステムからの接続も可能です。
・Pentaho、Jaspersoft、R、Metric Insights、Chartio、Indiceeなど

だから、ビックデータの収集・保存・分析が数分で完了。
データベースやHadoopの専門家でなくとも使用できます。

ビックデータの収集・保存・分析が数分で完了

EXAMPLE

バッチ型・アドホック型分析の活用例

バッチ型クエリ
アドホック型クエリ
オンライン広告

定時レポーティング

顧客向けの定時パフォーマンスレポーティング

配信最適化

接続しているアドネットワークのパフォーマンスをリアルタイム集計

集計結果から広告配信のロジックをリアルタイムに最適化

WEB/Social

定時レポーティング

社内 / 子会社 / 経営層向けの定期パフォーマンスレポーティング

サポート業務効率化

ユーザーからのサポートリクエストに応じてその場でデータを集計

サポートのレスポンス・対応を効率化し、ユーザーの満足度向上

リテール

定時レポーティング

PoS・Webサイト解析システム・タッチパネルシステムから上がってくるデータの定期レポーティング

即時バスケット分析

商品開発のミーティングの中で、過去データを参照
データを元にした商品開発活動を開始

SERVICE PLAN

料金プラン

表示価格は税抜きです。

基本サービス

  スタータープラン(無料) スタンダード プレミアム
特長

サンプルデータを使ったチュートリアルでサービスを体験できるプランです。導入前のテスト環境としてご利用いただけます。

HiveやPigによるバッチクエリを実行できる標準プランです。大容量データを短時間で集計し、定期のレポート作成などに最適です。

バッチクエリに加え、Presto*1によるアドホッククエリを実行できるプランです。インメモリ処理による瞬時のデータ分析が可能です。

最低利用期間 - 1ヶ月
初期費用 0円
月額料金 0円 353,000円 856,000円
アドホック解析(Presto)*2
同時実行可能クエリ数
0 0 3クエリ
バッチクエリ数 60回/月 無制限
レコード数 1億5千万
(1,000万/月)
150億
(10億/月)
600億
(40億/月)
コア数 専用 0 8 16
バースト 1 32 64
ユーザーアカウント 無制限

*1: Prestoとは、オープンソースのSQL対応分散クエリエンジンです。特に数百GBを超える大規模データに対してもインタラクティブなレスポンスを数秒で返します。

*2: アドホック解析は、Prestoを利用したデータ解析向けクエリエンジンTreasure Query Accelerator(TQA)を利用します。TQAは、バッチ型クエリエンジンと比較して10倍から50倍の高速処理が可能です。

追加オプション

項目 追加単位 月額料金 対象プラン
スターター スタンダード プレミアム
レコード数 150億レコード(10億/月) 53,500円 ×
コア数 専用 8 256,800円 ×
バースト 32
アドホック解析
同時実行可能クエリ数
2 256,800円 ×

「Yahoo! ビッグデータインサイト」は、企業のビッグデータを収集・保管し、短時間で容易に分析できる米国トレジャーデータ社のクラウド型DMS「トレジャーデータサービス」を用いており、
IDCフロンティアのクラウドコンピューティングとクラウドストレージを活用しています。

記載されいてる会社名、製品名は、各社の登録商標または商標です。