今早發覺 server 掛了, 想說藉機研究一下怎麼調查死因。
首先看 /var/log/message, 發現 syslogd 很好心的每隔 20 分鐘會寫入 "MARK", 表示它還活著。藉此可以推論出什麼時候開始出現異常。最後找到一串 oom-killer 的 log, google 後知道它是 out-of-memory killer, 是 kernel 用來釋放記憶體的機制, 透過某種推算, 砍掉一些 process 以釋放記憶體。oom-killer 有顯示 free 後的 swap space, 才發覺原來有人跑程式把 swap 也吃完了。真相大白, 圓滿收工。機器多掛幾次, 系統管理的功力又提昇了幾分。這就是在跌倒中成長嗎?
訂閱:
張貼留言 (Atom)
在 Fedora 下裝 id-utils
Fedora 似乎因為執行檔撞名,而沒有提供 id-utils 的套件 ,但這是使用 gj 的必要套件,只好自己編。從官網抓好 tarball ,解開來編譯 (./configure && make)就是了。 但編譯後會遇到錯誤: ./stdio.h:10...
-
find -uid 可以找目錄下特定使用者有的檔案, 反過來不知怎麼找。 今天靈機一動, 想到可以這麼搞, 不夠直接, 至少能用就是了: ls -lR DIR | grep "^[-rw]\{10\} " | grep -v USER 2011-01-...
-
昨天意外發現 rsync 有 -z 的參數, 可以壓縮再傳。好奇它的效果就試了一下, 結果得到出人意外的結論: 有時候直接全部重新複製還比較快........, 雖然是很明顯的事實, 用慣 rsync 後到沒想到這點。 簡易的測試環境如下: 原始檔案: 一堆目錄合起來 7G...
-
以使用 LevelDB 為例。 抓好並編好相關檔案,編譯方式見第三方函式庫附的說明: $ ls include/ # header files leveldb/ $ ls out-shared/libleveldb.so* # shared library out-sha...
沒有留言:
張貼留言