PROGRAMING
PR

[REDSHIFT] ノード毎の使用量を取得

ycsg113XYZ
記事内に商品プロモーションを含む場合があります
スポンサーリンク

REDSHIFTのノード毎の使用量って?

REDSHIFTでテーブルにDISTKEYを設定しますが、その設定したDISTKEYがうまくいっているのかどうか、ちゃんと分散されているのかどうか気になることありますよねー

そんな時に各ノード毎の使用量を取得するSQLがあります!

以下のSQLに調べたい [テーブル名] をセットし実行!

1select node, max(name) as name, sum(rows) as rows
2from stv_slices m
3join stv_tbl_perm s on m.slice = s.slice
4where name = '[テーブル名]'
5group by node
6order by node;

実行すると、以下のように結果が返ってきます。

------+----------------+------
0 | xxtablenamexxx | 144
1 | xxtablenamexxx | 144
2 | xxtablenamexxx | 144
3 | xxtablenamexxx | 144
4 | xxtablenamexxx | 144
5 | xxtablenamexxx | 144
6 | xxtablenamexxx | 144
7 | xxtablenamexxx | 144
8 | xxtablenamexxx | 144
9 | xxtablenamexxx | 144
10 | xxtablenamexxx | 144
11 | xxtablenamexxx | 144
12 | xxtablenamexxx | 144
13 | xxtablenamexxx | 144
14 | xxtablenamexxx | 144
15 | xxtablenamexxx | 144
(16 行)

上記の例は16ノードある場合の例です。rowsの数が全て同じなのでうまく分散されてるぜ!ってな判断です。
逆にここの数字がバラバラで偏っている場合はDISTKEYを見直したほうが良いっつうことになります。

スポンサーリンク
ABOUT ME
ひろし
ひろし
都内在中のなんちゃってSE。ギリギリPG。の私が管理者のひろしです。 日々夜遅くまで仕事に追われています。 今日は早く帰りたい・・・
スポンサーリンク
記事URLをコピーしました