1. (C) Recruit Technologies Co.,Ltd. All rights reserved.
ビッグデータ処理データベースの全体像と使い分け
2018年version
2018/9/21
株式会社リクルートテクノロジーズ
データテクノロジーラボ部
渡部徹太郎
db tech showcase Tokyo 2018
47. (C) Recruit Technologies Co.,Ltd. All rights reserved.
Amazon Redshift
特徴
RedShiftの裏にS3のデータをフィルタするSpectrum Layerを用し、IOのスルー
プットを向上
ロングクエリとショートクエリを機械学習を用いて分離し、全体最適化
46
Spectrum
Layer
(不可視領域)
Data
Catalog
L C
C
C
SQL
S3 Get
S
S
S
S
・
・
・
S3
RedShift
48. (C) Recruit Technologies Co.,Ltd. All rights reserved.
Google BigQuery
BigQueryとは
GoogleがSQL on Hadoopを進化させて作ったDWH
クエリ課金
処理が高速
• H/Wの最適化
• 独自の通信プロトコル
• クエリ毎に動的なリソース割当
47
分散ストレージ Colossus File System
シャード シャード シャード シャード シャード
ミキサー ミキサー ミキサー
ルート
ミキサー
参考)オライリー・ジャパン社「BigQuery」