Linuxでディスク消費量をディレクトリ別にチェックする

Linuxでディスク消費量をディレクトリ別にチェックする

記事一覧Linuxでディスク消費量をディレクトリ別にチェックする

Web サーバなどを運用していると、サイトへのアクセスが増えてくるのはうれしいものですが、そうなると通常の想定以上に膨れ上がってくるのがログファイルやキャッシュなどの容量です。

これまでは 1 日 500KB くらいだったものが、10 倍や 100 倍に増えていくことは珍しくありません。もちろん、ログの出力を最低限のものにフィルタリングしたり、ログのローテートやアーカイブする期間を調整することで対処できることもあるでしょう。

しかし、このように原因がログやキャッシュだと分かっている場合はいいのですが、何がディスクを多く消費しているのか分からないケースも多々あります。単純に df コマンドでパーティション全体の消費量だけ見ていても特定はできません。

duコマンドでディレクトリ内のファイル容量を表示

そこで du コマンドを使うのですが、-sh のオプションを付けることで、そこそこ見やすい形式でディレクトリ別のディスク消費量が確認できます。例えば、ルートディレクトリ直下ならこんな感じ。

$ du -sh /*

7.2M    /bin
7.6M    /etc
17M     /home
184K    /root
190M    /tmp
1.7G    /usr
16G     /var

特定のディレクトリ配下を検索

今回の場合は /var 以下が多いので、さらに詳細に確認してみます。-s オプションを付けなければ下の階層まで細かく確認できるのですが、ディレクトリが多いと大変なので、1 階層ずつ調べていくのがいいと思います。

$ du -sh /var/*

207M    /var/cache
38M     /var/lib
12G     /var/log
3.4G    /var/run
1.6M    /var/www

実はこのサーバは Web サーバとして稼働していて、nginx やアプリケーションのログは /var/log 以下に、nginx のページキャッシュは /var/run 以下に出力されています。よって、それらの消費量が多いのが明らかです。

運用を想定したディスク管理

もちろん業務となれば、実運用前からこの辺の設計はして、想定されるディスク容量の見積もりやディスク容量の監視(閾値以上でアラートなど)、各ログ出力の調整やログローテート(バックアップや退避)などなど、もろもろ検討するので、ディスク容量の圧迫でオドオドするケースは少ないかもしれません。

プライベートだと目的が先行して、運用部分が若干疎かになる傾向はあるので、この辺も意識しながらサーバ運用していきたいですね。ちなみに、今回調べる要因となったのは、アプリケーションのデバッグログの大量出力でした。

$ du -sh /var/log/*

12G     /var/log/app
67M     /var/log/nginx

アプリケーション側のログ出力を見直すのと同時に、このログは現在はデバッグの時にしか使っていなかったので、サーバ上からも数日前のログはバッサリと削除しちゃいます。

$ find . -type f -ctime +3 | xargs rm

参考カテゴリ

オススメ記事

最新の投稿やよく見られているのオススメ記事一覧です。

標準出力と標準エラー出力をパイプに渡す

よく、標準出力先をファイルにリダイレクトすることはありますが、意外に標準エラー出力は使う機会がありません。しかし、やはりツールやパッケージ製品になると標準エラー出力も活用されているようです。でも、...

Linux(FreeBSD)

>>記事を確認する

主要無料ブログ5つに対する自動投稿PHPプログラム

アメブロへ楽天APIなどの情報を自動で投稿する の反響が良かったので、どうせならアメブロ以外の無料ブログの XML-RPC を使った自動投稿も紹介したいと思います。これには FC2BlogManager.php というライブ...

PHP

>>記事を確認する

snmpでデバイスの情報を取得

snmpでデバイスの情報を取得するコマンドです。これを元に、ディスクIOなどのMIB値を探します。 $ snmpwalk -v 2c -c {SNMPGROUPNAME} localhost 1.3.6.1.4.1.2021.13.15.1.1.2 (結果の一部) UCD-DIS...

Linux(FreeBSD)

>>記事を確認する

awkで指定したカラム以降をprint表示する

前回、awk で最後のカラム以外を表示してみましたが、今回は指定したカラム以降のカラムを全部表示したいと思います。 例えば、7 個の文字列がカンマで区切られているファイルがあるとしたら、3 番目のカラム...

awk / シェル

>>記事を確認する

CentOSでRedisサーバを使う

冗長化した Web サーバなどで、セッションの管理や、セッションや特定のユーザーに紐付く一時データを管理するのに memcache を使う場面は多いと思います。 その memcache の中でも主流なのが memcached です...

Linux(FreeBSD) / CentOS / Redis

>>記事を確認する

新しいぐるなびAPIで飲食店の店舗情報取得

過去に作成した「ぐるなびAPI」のプログラムや、ぐるなびの Web Service が新しくなったこともあり、API からの情報取得プログラムを書き換えてみました。 以前の記事は下記になります。 ・ ぐるなびAPIで...

WebAPI

>>記事を確認する

NginxのFastCGIキャッシュで白い画面がキャッシュされる

以前から、トップページにアクセスすると、レスポンスステータスは 200 で返ってくるのに、画面に何も表示されない現象が稀に見受けられたので調査してみました。 さすがに機会損失にも繋がるということで、...

Nginx

>>記事を確認する

Laravel5.4の認証ユーザーのパスワードハッシュについて

Laravel で用意されている認証モジュールを利用する際、ユーザーモデル(User.php)経由で登録されるパスワードのハッシュ方法について調べてみました。 Laravel 上ではパスワード文字列を bcrypt() のヘルパー...

PHP / Laravel

>>記事を確認する

Laravel5.4のコントローラコンストラクタでAuth::user()が取得できない

Laravel5.4 で認証を通したアクセスに対して、コントローラのコンストラクタでユーザモデルの値を取得しようと思ったら、なぜか Auth::user() の値が取得できなくて悩みました。 public function __construc...

PHP / PHPフレームワーク / Laravel

>>記事を確認する

NginxのHSTS(HTTP Strict-Transport-Security)の設定

「Let's Encrypt」のおかげで、全サイト SSL 化していますが、これまで nginx の設定では、http のアクセスがあった場合に https に 301 リダイレクトさせていました。 この場合、Googlebot に http のアク...

セキュリティ / Nginx / SSL

>>記事を確認する