fcamel 技術隨手記: 刪除大量檔案的方法

2010年12月10日星期五

刪除大量檔案的方法

當一個目錄內有上百萬、千萬個檔案時, rm -rf 會慢到很糟糕的地步, 而且砍檔案時會吃掉一堆 IO, 做其它事只要一開檔、關檔, 就會頓一下。

上網查了各種說法, 要驗證何者的說法最合理, 需要讀 rm 的原始碼和 benchmark, 所以就不提了。有人提到一次 rm 多個檔案會比每個檔案都執行一次 rm 快, 減少 fork 和 execute 的時間, 這到是很合理。不確定在要刪除目錄的情況下, rm -rf DIR 和批次砍掉 DIR 下的檔案, 何者較快。

後來發現以前寫的《/bin/rm: argument list too long 的解法和原因》滿有用的, 我可以用 find + xargs 只砍部份檔案, 分多次砍完。這個作法的另一好處是, 可以在沒人用的時候放著讓它砍部份檔案 (像是先砍 a*, 再砍 b*, ...), 方便分階段處理, 只要每次砍檔案的時間不長, 不會和人使用的時間重疊到, 就沒問題了。

3 則留言:

Gea-Suan Lin2010年12月10日清晨7:13
You should be able to use "find ... -delete" to delete files.
回覆刪除
回覆
slzzp2010年12月10日上午10:09
argument list too long 在不同的 freebsd/shell 也會有不同的命令列長度限制
回覆刪除
回覆
fcamel2010年12月10日晚上8:43
對哦, 上篇就有人回 "find ... -delete", 這回還是忘了試, 大概是覺得命令串起來比較屌, 不自覺就想用串命令的作法......
回覆刪除
回覆

新增留言

fcamel 技術隨手記

2010年12月10日星期五

刪除大量檔案的方法

3 則留言:

在 Fedora 下裝 id-utils

搜尋此網誌

2010年12月10日 星期五

刪除大量檔案的方法

3 則留言:

在 Fedora 下裝 id-utils

2010年12月10日星期五