Nginxのアクセスログは目的意識を持って取ろう!という話
アクセスログは全部取るべし
ググると全部取っていない人が目立ちますが、
それでは取得する意味が無い。
実践的なアクセスログの活用方法を語りたい。
1、画像直リンクを見破る
画像のアクセスログこそ取得が必須。
画像は取得しない設定にする人が多いですが、
それをすると画像直リンクが全くわからなくなります。
こればかりはlogでしかわからない。
実際、これで直リンクを何度も発見しています。
問題無いところはそのままですが、悪質なやつはIPアドレスを拒否。
この作業は定期的にやります。
今はいろいろなサービスがあるので、
リファラーが無い直リンクを全て拒否するのは怖い。
手動で確認して対処するのが一番です。
2、スクレイピングを見破る
サイトによってはかなりスクレイピングされる。
特にアンテナサイトはよくやられるので確認は必須。
いろいろと偽装されているのでin/outデータが狂ってしまう。
IPアドレスは偽装できないので見破るのは簡単です。
こちらも件数が多く目立つとわかりやすいので、
画像のログ取得はやはり大事です。
3、存在しないURLへのアクセスを知る
404となるURLのアクセスログこそ大事。
こちらも取得しない設定にする人が多いですが、意味がわからない。
404となるのはおおよそはハッキング目的のアクセスです。
どのように攻撃されているのかを知ることができる。
特に注意したいのがSQLインジェクション。
「1=1」とかを付けてのアクセスがとても多い。
「本当に問題ないか?」と再確認して安心できます。
実際、これで対策が不十分だったことに気づけたことがあります。
完全に忘れてた…と冷や汗もの。
ここが一番大事。
別途クエリだけ取得するようにしてもいい。
まとめ
目的をしっかり意識。
個人的にはアクセスログは不正を見抜くことが主目的です。
週に一度はIPアドレス等で集計して確認したい。
自分はダウンロードして普通に置換して見ています。
容量とか負荷とか気にせず全部取得しよう。
自作なプログラムを作ればわかる。この恐ろしさ…