by shigemk2

当面は技術的なことしか書かない

DataDog system.cpu.stolen

ゲスト OS がリソース要求を行ったにもかかわらず、CPU リソースを割り当ててもらえなかった時間の割合

そもそもsteal値というものはこういったもので、vmstatを使えばsteal値は取れる(右端のst)。stの値が大きければsteal値が高いし、値が小さければsteal値が小さい(指定された利用率以上にCPUを利用できない)

Linux での CPU 使用率の steal (st) 値 - 元RX-7乗りの適当な日々

system.cpu.stolenでは、このsteal値を表示する。特にt2系のEC2インスタンスだと、ハイパーバイザーがEC2のリソース要求を拒否してリソースが割り当てられないので、steal値が上がる。

Understanding AWS stolen CPU and how it affects your apps | Datadog

DataDog的にも、この値が高かったらEC2のスペックを上げるか再デプロイするかするように言ってる。