Bigtableの特性とスキーマ設計について

Bigtableについて調べてみました。

Bigtableとは
他のDBと比較
Bigtableのアーキテクチャ
スキーマ設計
- KEYの作り方
- カラムファミリー
所感

Bigtableとは

GCPプロダクトのNoSQLデータベースで大規模データをミリセックレベルの低レイテンシーで処理したい場合適切です。

他のDBと比較

活用用途と金額を他のGCPプロダクトのDBと比較してみます。
f:id:casekblog:20190916162520p:plain:w500

大規模データを扱う場合、価格は以下となります。
Cloud Spanner > Bigtable > BigQuery
f:id:casekblog:20190916163509p:plain:w500
Cloud Spanner では高価で10 万 QPS の対応に、Bigtable では 10 ノードで十分ですが、Cloud Spanner では最大 150 ノードが必要です。Cloud Spannerのメリットとしてはトランザクションをサポートしている点です。
BigtableやBigqueryはトランザクションをサポートしていません。トランザクション処理が必要かつ大規模データを扱う場合はCloud Spannerも有益だと思います。CloudSQLはGCPのフルマネージドなMySQLやPostgreSQLです。数百GB程度のデータに対して適切なDBとなります。
cloud.google.com

Bigtableのアーキテクチャ

Bigtableはノード間で処理を分散し高速化を実現します。データはcolossusと呼ばれるストレージで管理され、ノードはこのcolossusのポインタを元に検索処理します。このアーキテクチャのメリットとしてはデータをノードに保存していないのでノードに問題が発生しても他のノードで対応することができることです。GCPプロダクトのDataprocでもHDFSにデータ保存するのではなくGCSにデータを保存して実行することが推奨されています。
基本的な考え方としてサーバとストレージは分けるのが主な考え方のようです。
f:id:casekblog:20190916160954p:plain:w500