Teradata Table Skew Insight – how it can be misleading

Teradata Table Skew Insight - How It Can Be Misleading | DWHPRO

概要
  • Teradataのskewには2種類ある
    • PIの問題によるデータ件数の偏り
    • 保存されているデータサイズによる偏り
  • dbc.tableSizeVの集計では、(PIの問題によるデータ件数の偏りを検出できないので)6割程度のskewしか検出できない
  • 例えば、TBBLCが有効な環境の場合、アクセスの多いシリンダだけが未圧縮のままになり、あとは圧縮されるので、件数が全AMPで均一であっても、Diskの使用量にはばらつきが出ることがある
  • データ件数の偏りは、HASHAMP/HASHBUCKET/HASHROW関数を組み合わせて、AMPごとのデータ件数をカウントして検出することができる
  • TBBLCを使うなら、skewを避けるために、自分のデータがどんな感じでアクセスされているかを、前もって知っておく必要がある
語彙
  • uniform: 均一な。