読者です 読者をやめる 読者になる 読者になる

長生村本郷Engineers'Blog

千葉県長生村本郷育ちのエンジニアが書いているブログ

負荷監視とその原因調査

Linux

概要

新卒向けの説明として簡単な備忘録です。

-Item- -Explain-
%user ユーザー空間での CPU 使用率
%system カーネル空間での CPU 使用率
%iowait I/O 待ち時間の割合
%idle I/O 待ち以外で CPU が何もしていない時間の割合

ある日の Zabbix + Grafana のCPU関連のグラフから原因を調査する。

f:id:kenzo0107:20160921223252p:plain

① %iowait が飛び抜けて高い

  • %iowait 高
  • %user 低
  • %system 低

原因

スワップが大量に発生している可能性がある。

調査手順

1. SwapIn & SwapOut 確認

$ sar -W

2. システム全体のメモリ使用状況

$ free

3. メモリ使用率順でソート後メモリを消費しているプロセスを特定する

$ top
  • Shift+p: CPU使用率順にソート
  • Shift+m: メモリ使用率順にソート
実際の原因

定期的に同時刻に発生した為
crontab -l でクーロン設定確認したら
誰も知らないバッチが動いていた汗

② %userが飛び抜けて高い

  • %iowait 低
  • %user 高
  • %system 低

原因

CPU使用率が高い。

調査手順

1. CPU使用率の高い順にソートしてプロセス特定

$ top 

ほんの一部分ですが参考になれば何よりです。 以上です。