Teradata Table Skew Insight – how it can be misleading
Teradata Table Skew Insight - How It Can Be Misleading | DWHPRO
概要
- Teradataのskewには2種類ある
- PIの問題によるデータ件数の偏り
- 保存されているデータサイズによる偏り
- dbc.tableSizeVの集計では、(PIの問題によるデータ件数の偏りを検出できないので)6割程度のskewしか検出できない
- 例えば、TBBLCが有効な環境の場合、アクセスの多いシリンダだけが未圧縮のままになり、あとは圧縮されるので、件数が全AMPで均一であっても、Diskの使用量にはばらつきが出ることがある
- データ件数の偏りは、HASHAMP/HASHBUCKET/HASHROW関数を組み合わせて、AMPごとのデータ件数をカウントして検出することができる
- TBBLCを使うなら、skewを避けるために、自分のデータがどんな感じでアクセスされているかを、前もって知っておく必要がある
語彙
- uniform: 均一な。