基幹業務もHadoopで!! -ローソンにおける店舗発注業務へのHadoop + Hive導入とその取り組みについて-

1. 基幹業務もHadoopで!! Hadoop / Spark Conference 2016 Future Architect Keigo Suda ローソンにおける店舗発注業務への Hadoop + Hive導入とその取り組みについて

2. 本発表を通してお伝えしたいこと Enterprise 基幹領域でのHadoop活用シーンへのヒント  どういった課題をクリアするために？  どんなことを検討/対応する必要がある？ ※資料は後ほど公開致します

3. 目に焼き付けておきなさい。 Hadoopを使うってそういうことよ (綺麗なことばかりじゃないのよ)

4. 自己紹介＊須田桂伍(2012年入社) ＊ Technology Innovation Group シニアコンサルタント＊インフラエンジニア～ソフトウェアアーキテクト＊最近はビッグデータ領域(情報系～基幹系)どっぷり最近はQiita記事に技術ネタ投稿してます直近の生きる目標(人生のマイルストン)

5. Outline Introduction Architecture Team Development Conclusion

6. Our Company

7. フューチャーアーキテクト株式会社（英文表記：Future Architect, Inc.）設立上場資本金代表者売上高社員数オフィス： 1989年11月28日： 2002年6月東証1部： 14億21百万円：代表取締役会長 CEO 金丸恭文：連結344億24百万円、単体197億27百万円（2014年12月期）：連結1,587名、単体783名（2014年12月末日現在）：大崎（本社）、大阪、鹿児島、福岡

8. Introduction

9. 店舗発注業務のセンター化発注時に利用するマスタ作成をセンタ集約  店舗毎に行われていたマスタデータ作成処理を集約  店舗からはAPI経由でマスタデータを参照

10. 店舗発注業務の裏側ローソン全業務で利用されるマスタデータを日次バッチで最新化 1 最新化された全業務マスタデータの更新差分を各店舗へファイル連携店舗へ更新分データのファイル連携 2 本部センターファイル連携基盤ストアコンピュータデータ反映発注端末商品を発注しますね更新データ全業務マスタデータ日次バッチ処理最新化 1 2 3 4 全業務マスタデータの最新化処理連携されたファイルデータを各店舗にあるストコン内のDBへ反映する。 3 最新化されたマスタデータをもとに発注業務を実施発注時の商品データ参照4 更新分データのDB反映処理

11. 店舗発注業務の裏側ローソン全業務で利用されるマスタデータを日次バッチで最新化 1 最新化された全業務マスタデータの更新差分を各店舗へファイル連携店舗へ更新分データのファイル連携 2 本部センターファイル連携基盤ストアコンピュータデータ反映発注端末商品を発注しますね更新データ全業務マスタデータ日次バッチ処理最新化 1 2 3 4 全業務マスタデータの最新化処理連携されたファイルデータを各店舗にあるストコン内のDBへ反映する。 3 最新化されたマスタデータをもとに発注業務を実施発注時の商品データ参照4 更新分データのDB反映処理これまでは処理負荷を各店舗に分散していたイメージ

12. 機能のセンター集約店舗DB 発注業務データ参照加工処理加工処理取込処理取込処理発注端末発注端末発注端末発注端末発注端末発注端末発注端末 API API API API API API API 全店舗分の発注業務に利用するマスタデータをバッチ処理(日次)で作成全業務マスタDBから店舗毎に必要なマスタデータの更新差分をファイルで連携これまで店舗毎に配信されていた全店舗分の更新差分ファイルを連携受信用DB 公開用DB 1. 全業務マスタDBから各店舗へ更新差分ファイルを配信 2. 店舗毎にDBへ差分反映後、発注利用マスタデータを作成 3. 作成されたマスタデータは発注業務時に発注端末から参照 1. 全業務マスタDBから全店舗分の更新差分ファイルを配信 2. 受信用DBへ差分反映後、全店舗分の発注利用マスタデータを作成 3. 作成されたマスタデータはREST APIで公開し、発注端末より参照データ参照発注業務 Before After

13. しかしその壁も高い・・・店舗数増加への考慮ピーク時の処理多重度限られたバッチウィンドウ膨大なレコード件数

14. 18 20% 80% 全店舗分の処理ピークが重なる

15. 19 発注商品マスタ～10億レコード PLUマスタ～7億レコード商品マスタ～5億約70マスタテーブル(数十億レコード)

16. ～1.5時間店舗へのデータ公開バッチ処理開始約4時間リラン

17. Distributed Architecture?

18. Get Really Excited @ Midnight

19. Volume Complexity Small Medium ~ Specially Complex Simple Complex ~ Enterprise Web Complex Business Logic データ観点でざくっと考えてみる(私見) Very Large

20. Contains Business Logic… Much Various

21. データ観点でざくっと考えてみる(私見) Volume Complexity Very Large Specially Complex Simple Complex ~Complex Business Logic Large Web

22. 機能のセンター集約店舗DB 発注業務データ参照加工処理加工処理取込処理取込処理発注端末発注端末発注端末発注端末発注端末発注端末発注端末 API API API API API API API 全店舗分の発注業務に利用するマスタデータをバッチ処理(日次)で作成全業務マスタDBから店舗毎に必要なマスタデータの更新差分をファイルで連携これまで店舗毎に配信されていた全店舗分の更新差分ファイルを連携受信用DB 公開用DB 1. 全業務マスタDBから各店舗へ更新差分ファイルを配信 2. 店舗毎にDBへ差分反映後、発注利用マスタデータを作成 3. 作成されたマスタデータは発注業務時に発注端末から参照 1. 全業務マスタDBから全店舗分の更新差分ファイルを配信 2. 受信用DBへ差分反映後、全店舗分の発注利用マスタデータを作成 3. 作成されたマスタデータはREST APIで公開し、発注端末より参照データ参照発注業務 Before After

23. 候補サービス EMR Redshift RDS (AmazonEMR)

24. アーキテクチャ案 WITH EMR WITH Redshift WITH RDS 取込フェーズ加工フェーズ参照フェーズ Data Imort Data Export SQL Batch MapReduce Storede Procedure & SQL Batch Data Imort Data Export

25. ざっと比較してみる EMR 分散処理による高スループットアーキテクチャ Redshift RDS(MySQL) ノード追加によるリソース拡張豊富なHadoopエコシステムシステム拡張性耐障害性 (ノード障害時) 処理特性費用調整コアノード障害ならば処理継続可能分散処理による高スループットアーキテクチャノード追加によるリソース拡張同時実行クエリ数の制約コスト面で大量ノードで組めないので 1台失った時のインパクトでかい更新処理がマスタサーバに集中リードレプリカにより参照処理のみスケール可能マスター障害時はスレーブのマスタ昇格まで処理受付不可コアノードのインスタンスタイプが豊富&台数による微調整が可能インスタンスタイプが少ない&台数による微調整が難しいそもそも参照しかスケールしないしな・・・

26. ざっと比較してみる EMR 分散処理による高スループットアーキテクチャ Redshift RDS(MySQL) ノード追加によるリソース拡張豊富なHadoopエコシステムシステム拡張性耐障害性 (ノード障害時) 処理特性費用調整コアノード障害ならば処理継続可能分散処理による高スループットアーキテクチャノード追加によるリソース拡張同時実行クエリ数の制約更新処理がマスタサーバに集中リードレプリカにより参照処理のみスケール可能マスター障害時はスレーブのマスタ昇格まで処理受付不可コアノードのインスタンスタイプが豊富&台数による微調整が可能インスタンスタイプが少ない&台数による微調整が難しいそもそも参照しかスケールしないしな・・・コスト面で大量ノードで組めないので 1台失った時のインパクトでかい

27. やってみた

28. 36 20% 80% 全店舗分の処理ピークが重なる

29. 37 発注商品マスタ～10億レコード PLUマスタ～7億レコード商品マスタ～5億約70マスタテーブル(数十億レコード)

30. やってみたクラスタへのデータロードマスタデータ作成インポート (全件) SQLバッチ(HiveQL) クラスタからのデータオフロード平均：約60分平均：約16分平均：約16分平均：約90分コアノード：~30台エクスポート (全件)

31. やってみた

32. Architecture Overview

33. アーキテクチャ全体像全業務マスタDB EMRクラスタ受信用DB ファイル連携用バケットファイル取込サーバ SQLバッチ(HiveQL) 公開用DB APIサーバ過去データ蓄積用バケットアップロード画像データ REST API ・・・バイナリ配置用バケットバイナリデータはS3パスを返却し直接取得させる発注端末発注端末

34. 3フェーズアーキテクチャ EMRはあくまで処理エンジン!! 得意な処理に専念させるための役割分担と機能配置データ永続化層データ整合性の担保前処理の実施データは永続化させないデータ加工に専念データ永続化層データ公開/参照受信用DB 公開用DBEMRクラスタ

35. Processing

36. アーキテクチャ全体像全業務マスタDB EMRクラスタ受信用DB ファイル連携用バケットファイル取込サーバ SQLバッチ(HiveQL) 公開用DB APIサーバ過去データ蓄積用バケットアップロード画像データ REST API ・・・バイナリ配置用バケットバイナリデータはS3パスを返却し直接取得させる発注端末発注端末

37. 加工処理の設計ポイントクラスタ構成様々な更新処理処理の分散設計処理リランワークフロー

38. 46 20% 80% 全店舗分の処理ピークが重なるクラスタ構成様々な更新処理処理の分散設計処理リランワークフロー

39. 47 20% 80% 全店舗分の処理ピークが重なるピーク時用クラスタ常時用クラスタクラスタ構成様々な更新処理処理の分散設計処理リランワークフロー

40. クラスタ構成常時処理ピーク時処理 UPSERT INSERT クラスタ起動クラスタ停止対象テーブルを差分更新対象テーブルを洗い替え(日付断面) クラスタ構成様々な更新処理処理の分散設計処理リランワークフロー受信用DB 公開用DBEMRクラスタ受信用DB 公開用DB EMRクラスタ

41. 49 20% 80% 全店舗分の処理ピークが重なるピーク時用クラスタ常時用クラスタクラスタ構成様々な更新処理処理の分散設計処理リランワークフロー

42. 様々な更新処理更新サーバ常時用クラスタテーブル全体の部分更新が必要な処理を担当ピンポイントな更新処理を担当対象データ種のファイルが到着/反映クラスタ構成様々な更新処理処理の分散設計処理リランワークフロー公開用DB 受信用DB より速い反映が必要なデータ更新を担当

43. 処理の分散設計マスタ作成の処理粒度をどう調整するかどの粒度でマスタ作成処理(HiveQL)を並列に走らせるか店舗毎にいっぺんにドーン複数店舗をまとまりにしていっぺんにドーン全店舗分をいっぺんにドーン・・・・・・クラスタ構成様々な更新処理処理の分散設計処理リランワークフロー

44. 処理の分散設計店舗毎にいっぺんにドーン複数店舗をまとまりにしていっぺんにドーン全店舗分をいっぺんにドーン・・・・・・リソース不足リソース不足スループット抜群クラスタ構成様々な更新処理処理の分散設計処理リランワークフローマスタ作成の処理粒度をどう調整するかどの粒度でマスタ作成処理(HiveQL)を並列に走らせるか

45. 処理の分散設計マスタA 分割後マスタA 分割後マスタA 分割後マスタA ・・・マスタB 分割後マスタB 分割後マスタB 分割後マスタB 発注商品マスタ発注商品マスタ発注商品マスタ発注商品マスタマスタA マスタB ・・・・・・ SQL SQL SQL SQL SQL SQL 発注商品マスタ発注商品マスタ店舗コードをもとにハッシュ分散 500店舗単位で分割され後続に続くクラスタ構成様々な更新処理処理の分散設計処理リランワークフロー・・・・・・全店舗分 500店舗単位公開用DBEMRクラスタ受信用DB

46. 店舗コードによる振分&パーティショニング・・・ 500店舗毎に36分割ハッシュ分散UDF クラスタ構成様々な更新処理処理の分散設計処理リランワークフロー

47. 店舗コードによる振分&パーティショニング・・・ハッシュ分散UDF 店舗コードでのパーティショニング (Dynamic Partitioning) クラスタ構成様々な更新処理処理の分散設計処理リランワークフロー 500店舗毎に36分割 1つのテーブルにハッシュで散った複数店舗分のデータが入っている結合時には必ず店舗コードが必要

48. 処理リランインポート (全件) SQLバッチ(HiveQL) エクスポート (全件) リトライ/リカバリリトライ/リカバリリトライ/リカバリ・・・ワーク1 ワークN アウトプットインプット HiveQL 各処理単位で冪等にさせるマスタ作成処理も割り切って頭からリカバリできる設計リトライ/リカバリクラスタ構成様々な更新処理処理の分散設計処理リランワークフロー公開用DB受信用DB 1マスタ作成処理=1SQLファイル中間ワークの状態管理はしない

49. ワークフロー処理命令はSDK経由で実行 EMRのStepではあくまでクラスタのプロビジョニング(Chefで実行)にのみに特化コアマスター・・・処理実行スクリプト HiveQL 実行スクリプト HiveQL ワークフローサーバコアコアコア SDK hive -f ${HIVEQL_FILE} ¥ --hivevar PG_ID=${PG_ID} ¥ --hivevar VERSION_YMD=${VERSION_YMD} ¥ --hivevar TEMPO_GROUP_CD=${TEMPO_GROUP_CD} ¥ >> ${LOG_FILE} 2>1 クラスタ構成様々な更新処理処理の分散設計処理リランワークフロー

50. おまけ：Sqoopではまった話 MySQLへのダイレクトエクスポートで日本語が文字化けクラスタ構成様々な更新処理処理の分散設計処理リランワークフローこらっ(^ ^)

51. Team Development

52. いつも通りの開発を!! 開発者にミドルウェア(Hadoop)の存在を意識させない仕組みづくりチーム開発ですっごく考えたことどう品質をどう担保するかどう開発生産性をあげるか＊ RDBでの開発に慣れたエンジニアでもいつも通りの開発ができる＊ Hadoop/Hiveのクセを意識せずに開発ができる＊ HiveQLの品質担保をいかに効率的に実施していくか＊ Hiveのチェック制約の弱さをどのようにカバーするか

53. チーム開発の全体像起動時に開発DB からデータをステップでインポートコーディングはHue エディタにて実施 HiveQLは単体テスト &回帰テストを実施コーディング規約をもとした開発/レビュー開発者

54. チーム開発の全体像起動時に開発DB からデータをステップでインポートコーディングはHue エディタにて実施 HiveQLは単体テスト &回帰テストを実施コーディング規約をもとした開発/レビュー開発者

55. Hiveでのコーディング MapReduceを意識させない規約づくり開発者間の品質のばらつきを押さえるべく、ポイントは規約化

56. HiveのユニットテストとCI Hiveだってしっかりテストしなきゃ!! HiveQL Test PG Input Data Output Data 回帰開発日次で定期実行エクセルでテストデータを管理しながらのコーディング Hiveのチェック制約機能の弱さを頻繁なテストでフォロー

57. Hiveリソースによる区分・定数管理区分値/定数管理もHiveで!! 設計書を正とした管理(納品資料駆動開発!!) 区分/定数管理表 hiverc HiveQL

58. パラメータも同様に管理区分/定数管理表 hiverc Hiveパラメータ&UDF登録もエクセルで! 下回りの設定も設計書を正とした管理(Infrastructure as 納品資料!!)

59. Need More Consideration

60. 今後より検討が必要なポイントクラスタ起動 Blue Green クラスタのメンテをどうするか発注商品マスタ作成ジョブ優先的に処理をさせたいリソーススケジューリングどうしよ EMRのレイヤでどう対応できるかがポイントクラスタのメンテや業務の重要度に応じたリソーススケジューリング

61. Conclusion

62. まとめ：基幹領域の適用シーンをもう一度考える  基幹領域だからといってHadoopを避ける理由はない(選択肢はRDBだけじゃない)  全てをHadoopで置き換えるのではなく、まずは重たいバッチ処理を部分的に切り出すようなはじめ方でノウハウをためるのがいいかも  Hadoop(HDFS)をベースとしてエコシステムは進化しているので、導入したHadoop基盤をベースに様々なワークロードに対応可能 Enterprise

基幹業務もHadoopで!! -ローソンにおける店舗発注業務への Hadoop + Hive導入と その取り組みについて-

Keigo Suda