はじめに
今回から3回に渡って,
- Impala概要
(今回) - クエリ実行時の並列化の仕組み
(第18回) - I/
O処理における高速化の仕組み (第19回)
Impalaの特徴のすべてをお伝えできるわけではありませんが,
今回は,
Impala開発の背景
これまでの連載内でも触れられてきましたが,
Hadoopは,
Hiveは,
このような状況は期待する特性の齟齬によるものであったため,
Impalaの特長
一般に,
上記のような背景で開発されたImpalaは,
- アドホッククエリに特化すべく,
MapReduceやSparkなどの汎用エンジンを用いずに記述された並列SQL処理エンジン - I/
O先読みやランタイムコード生成をはじめとする種々の方式による高効率性
第18回ではおもに1. について,