カスタム検索
表示順:
Relevance
Relevance
Date
ウェブ
 
 
 

Apache Kafkaに対応したSQLエンジン「KSQL」リリース、ストリームデータをSQLで継続的に処理。Confluentがオープンソースで

2017年9月5日

Apache Kafkaを用いたリアルタイムデータ処理の商用サービスを提供しているConfluentは、Apache Kafkaに対応したオープンソースのSQLエンジン「KSQL」のデベロッパープレビューをリリースしました

Introducing KSQL

Apache Kafkaはスケーラビリティに優れ、大量のデータをリアルタイムに処理できるソフトウェアです。さまざまなアプリケーションから送られてくるログや大量のセンサーなどから生成されるデータなど、リアルタイムに送信されてくるストリームデータをいったんKafkaで受け止め、それをまとめてHadoopなどの分析エンジンに渡してデータの分析を行う、といった形で使われます。

KSQLは、このKafkaに対応したSQLエンジン。これによりJavaやPythonで複雑な処理を記述しなくとも、ストリームデータを柔軟に加工できるようになります。

SQLとKSQLの違いとは?

一般的なリレーショナルデータベースでは、ある時点で固定されたデータであるテーブルに対してSQLを実行すると、結果のデータが出力され、それで実行が終了しますが、Kafkaに対応したKSQLでは、ストリームデータに対して継続的にKSQLが実行され、結果データが継続的に出力されます。

Introducing KSQL: Open Source Streaming SQL for Apache Kafka」では、KSQLの動作を次のように説明しています。

what it does do is continuous transformations— that is, stream processing. For example, imagine that I have a stream of clicks from users and a table of account information about those users being continuously updated. KSQL allows me to model this stream of clicks, and table of users, and join the two together. Even though one of those two things is infinite.

KSQLが行うのは、継続的な変換 -- それがストリーム処理だ。例えば、ユーザーからのクリックデータがストリームデータで、一方でこれらのユーザーの情報がつねに最新情報にアップデートされつづけるユーザーアカウントテーブルがあるとする。KSQLは、このクリックのストリームデータとユーザーテーブルをモデルとし、ふたつをジョインできる。たとえそのいずれかが無限に続くデータだったとしてもだ。

KSQLの利用用途として、ログデータを実際のサービスに紐づけることで、リアルタイムにモニタリングしつつサービスごとの反応速度を監視したり、アノマリーデータ(特異的なデータ)の発見や、オンラインでのデータ統合などが挙げられています。


follow us in feedly

タグ : Apache Kafka



≪前の記事
米オラクルがSolaris関連の従業員をほぼ全員レイオフしたとの報道

カテゴリ



Blogger in Chief

photo of jniino Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

人気記事ランキング

  1. 米オラクルがSolaris関連の従業員をほぼ全員レイオフしたとの報道
  2. [速報]VMware Cloud on AWS、本日より提供開始。AWSのベアメタルでVMware環境を提供。VMworld 2017 US
  3. 自然言語からSQLクエリを機械学習で生成、業務データベースが言葉で検索できるように。セールスフォース・ドットコムがAIの研究成果を公開
  4. アップルとアクセンチュアが提携、アクセンチュアの専門部隊とアップルのエンジニアが協力。iOSアプリを業務システムやIoTプラットフォームと連係強化へ
  5. [速報]VMware、vSphere上にコンテナ環境を自動構築する「Pivotal Container Service」発表。Google Container Engineとのポータビリティ実現。VMworld 2017 US
  6. オープンソースのシステム監視ツール「Zabbix 3.4」リリース。ウィジェット化されたダッシュボード、バルクメトリクス収集やアラートの並列処理なども追加
  7. OpenStack、16番目のリリース「OpenStack Pike」リリース。Python 3.5サポート、etcd統合、ストレージボリュームの動的拡張、スナップショット時点への復帰など
  8. Google、「App Engine firewall」発表。IPアドレスなどのルールを設定できるマネージドなファイアウォールサービス
  9. VMwareとPivotal、KubernetesなどをホストするCloud Native Computing Foundationに参加。Kubernetesに追い風
  10. 経産省、IT人材のさまざまな属性別給与水準に関する初の大規模な公的調査の結果公表。職種別の平均年収トップはコンサルタント。年収が高いほど残業と勉強時間が長く


新着記事 10本


PR - Books


fig

fig

fig