dd (Unix)

本頁使用了標題或全文手工轉換
維基百科,自由的百科全書

dd是一個Unix類Unix系統上的命令,主要功能為轉換和複製檔案。[1]

在Unix上,硬件的裝置驅動(如硬碟)和特殊裝置檔案(如/dev/zero/dev/random)就像普通檔案一樣,出現在檔案系統中;只要在各自的驅動程式中實現了對應的功能,dd也可以讀取自和/或寫入到這些檔案。這樣,dd也可以用在備份硬件的引導磁區、取得一定數量的亂數據等任務中。dd程式也可以在複製時處理數據,例如轉換位元組序、或在ASCIIEBCDIC編碼間互換。[2]

dd的名字可能來源於IBM工作控制語言(JCL)中的DD陳述式,[3]意為「Data Description」(數據描述)的縮寫。[4]該命令的陳述式與JCL中的相似,而與其他Unix命令較不同,因此這可能是個玩笑。[3]另一種解釋是「cc」(根據命令自身的描述,為「convert and copy」(轉換和複製))已經被C語言編譯器(C compiler)所佔。[來源請求]

dd命令由單一UNIX規範的一部分,IEEE標準1003.1-2008所規定。

用法

dd命令列陳述式與其他的Unix程式不同,因為它的命令列選項格式為选项=,而不是更標準的--选项 值-选项=dd預設從標準輸入中讀取,並寫入到標準輸出中,但可以用選項if(input file,輸入檔案)和of(output file,輸出檔案)改變。

由於作業系統的不同,用法會有出入。另外,dd的一些特定功能取決於電腦系統的能力,例如直接訪問記憶體。向執行中的dd行程傳送SIGINFO訊號(Linux上為USR1)可以使它將I/O統計資訊列印到標準錯誤一次,然後繼續複製(注意在OS X上,訊號可能導致行程終止)。dd可以從鍵盤中讀取標準輸入。到達檔案結尾時,dd將會退出。訊號和EOF是由軟件決定。例如,移植到Windows的Unix工具使用不同的EOF:Cygwin使用<ctrl-d> (通常的Unix EOF),而MKS工具箱使用<ctrl-z>(通常的Windows EOF)。

正如Unix哲學一樣,dd只做好一件事(並被認為做得「好」)。與複雜的和高度抽象的實用程式不同,除了為不同的選項做底層決定,dd沒有其它的演算法。一般在每一次執行時,會改變dd的選項以分步處理一個電腦問題。

輸出訊息

Linux上GNU coreutils提供的變種沒有描述執行結束時,dd輸出到標準輸出訊息的格式。然而,其他的實現描述了它,例如BSD上的。

「記錄讀入」和「記錄寫出」行顯示了已完整傳輸的塊數+不完整的塊數,例如物理媒介以不完整的塊結尾,或是一個物理錯誤使得一個完整的塊無法被讀取。

塊大小

是衡量一次讀取、寫入和轉換位元組的單位。命令列選項可以為輸入/讀取(ibs)和輸出/寫入(obs)指定一個不同的塊大小,儘管塊大小(bs)選項會覆蓋ibsobs選項。輸入和輸出的預設塊大小為512位元組(傳統的磁碟塊及POSIX規定的「塊」大小)複製的count選項、讀取的skip選項和寫入的seek選項都是以塊為單位。轉換操作也受「轉換塊大小」(cbs)影響。

dd的一些用途中,塊大小可能會影響表現。例如,當轉換硬碟中數據時,較小的塊大小通常會導致更多的位元組被轉換。發出許多小塊的讀取是一種開銷的浪費,且可能會對執行效能有負面影響。較大的塊大小可能會提高複製速度。但是,由於要複製的位元組量是由bs×count給出的,因此不可能在一次dd命令中複製素數個位元組,除非使用兩個糟糕選項之一:bs=N count=1(消耗記憶體)或bs=1 count=N(大量讀請求開銷)。替代程式(見下文)允許指定位元組,而不是塊。在用作網絡傳輸時,根據使用的網絡協定,塊大小可能會與大小衝突。

提供給塊大小的值會被解釋成十進制整數,也可以加入字尾指定倍數。字尾w表示2倍,b表示512倍,k表示1024倍,M表示1024 × 1024倍,G表示1024 × 1024 × 1024倍,等等。另外,在塊大小和計數參數中,一些實現也可以使用x表示乘運算。

例如,塊大小bs=2x80x18b表示2 × 80 × 18 × 512 = 1474560位元組,也就是一張1440 KiB軟碟的確切大小。

用途

dd命令可用於各種用途。

數據轉換

dd可以在檔案、裝置、分區和卷之間複製數據。數據可以從其中任何地方輸入或輸出;但輸出到分區時有重要差異。此外在傳輸過程中,數據可以用conv選項修改以適應媒介。

如果最後一個塊有意外長度,試圖使用cp複製整個磁碟可能會忽略掉它[來源請求];然而dd卻可能成功。源和目標磁碟應該具有相同的大小。

不同情況的dd格式
dd if=/dev/sr0 of=myCD.iso bs=2048 conv=noerror,sync 從CD-ROM中建立ISO磁碟鏡像
dd if=/dev/sda2 of=/dev/sdb2 bs=4096 conv=noerror 克隆一個分區到另一個。
dd if=/dev/ad0 of=/dev/ad1 bs=1M conv=noerror 克隆硬碟「ad0」到「ad1」。

noerror選項意味着如果發生錯誤,程式也將繼續執行。sync選項表示填充每個塊到指定位元組。

備份和恢復主開機紀錄

可以修復主開機紀錄。主開機紀錄可以轉移到檔案,或從中轉移出來。

要複製軟碟的前兩個磁區:

dd if=/dev/fd0 of=MBRboot.img bs=512 count=2

要建立整個x86主開機紀錄的鏡像(包括MS-DOS分區表和MBR魔法位元組):

dd if=/dev/sda of=MBR.img bs=512 count=1

要建立僅含主開機紀錄引導代碼的鏡像(不包括分區表和開機所需的魔法位元組):

dd if=/dev/sda of=MBR_boot.img bs=446 count=1

數據修改

dd可以原地修改數據。

用空位元組覆蓋檔案的前512個位元組:

dd if=/dev/zero of=path/to/file bs=512 count=1 conv=notrunc

轉換選項notrunc意味着不縮減輸出檔案,也就是說,如果輸出檔案已經存在,只改變指定的位元組,然後退出,並保留輸出檔案的剩餘部分。沒有這個選項,dd將建立一個512位元組長的檔案。

在不同的分區中複製磁碟分區到磁碟映像檔案中:

dd if=/dev/sdb2 of=partition.image bs=4096 conv=noerror

磁碟擦除

出於安全方面的考慮,有時需要擦除丟棄的磁碟。

檢查驅動器上是否有數據,並將其輸出到標準輸出:

dd if=/dev/sda

用零擦除磁碟:

dd if=/dev/zero of=/dev/sda bs=4k

相較於上面數據修改的例子,不需要使用轉換選項notrunc,因為當dd的輸出檔案為塊裝置時,它沒有效果。[5]

bs=4k選項使dd一次讀取或寫入4千位元組。在現代系統中,由於傳輸容量(如RAID系統),一個更大的塊大小可能更有利。注意用亂數據填充磁碟總是比用零慢的多,因為亂數據必須先由CPU和/或HWRNG生成,且不同的設計有不同的效能特點。(後面PRNG的/dev/urandom可能比libc中的要慢。)在大多數較現代的磁碟中,用零擦除會使其中的數據永久遺失。[6]

用零擦除磁碟會使它的數據無法被軟件恢復。然而數據仍可能用特殊的實驗室技術恢復。

shred程式提供了完成相同任務的替代方法,最後,目前許多Linux發行版還提供了一個精心製作的工具wipe[7](做得「好」,如上面的Unix哲學),提供了更多方法擦除。

數據恢復

1984年,GNU dd開啟了開源軟件(OSS)恢復數據、檔案、驅動器和分區的歷史。dd行程一次處理一個塊,它的演算法只是在用戶介面顯示執行狀態。1999年10月,一個C語言的程式dd_rescue發佈了。它的演算法一次能處理兩個塊。但改進dd_rescue的數據恢復演算法、2003年的shell指令碼dd_rhelp作者現在推薦GNU ddrescue[8]它是一個發佈於2004年的C++程式,與大多數的Linux發行版一起發行。在開源軟件中,GNU ddrescue有最先進的塊大小變換演算法。[9]ddrescuedd_rescue儘管名字相近,但卻是不同的程式。因為如此,區分更為明確的備用名稱也有使用;使用的名稱有「addrescue」(freecode.com),「gddrescue」(Debian包名)和「gnu_ddrescue」(openSUSE包名)。)

GNU ddrescue既穩定又安全。[10]

另一個開源程式savehd7使用更複雜的演算法,但它需要安裝自己的語言直譯器。

驅動器效能基準測試

對驅動器進行基準測試(通常是單線程),使用1024位元組塊分析連續系統讀取和寫入的效能:

dd if=/dev/zero bs=1024 count=1000000 of=file_1GB
dd if=file_1GB of=/dev/null bs=1024

用亂數據生成檔案

使用內核亂數驅動,用100個隨機位元組生成檔案:

dd if=/dev/urandom of=myrandom bs=100 count=1

將檔案轉換為大寫

將檔案轉換為大寫:

dd if=filename of=filename1 conv=ucase

建立任意大小的空檔案

建立1GiB的稀疏檔案,或增加現有檔案的大小:

dd if=/dev/zero of=mytestfile.out bs=1 count=0 seek=1G

(更先進的工具是GNU coreutils中的fallocatetruncate。)

局限

希捷的文件警告說,「一些依賴底層硬碟訪問的硬碟工具(如DD)可能不支援48位元邏輯區塊地址(LBA),除非進行升級」。[11]使用超過128 GiB的ATA硬碟時需要48位元LBA。然而在Linux中,dd使用內核讀取或寫入原始裝置檔案[a]2003年釋出的2.4.23版本內核已經實現了對48位元LBA的支援。[12][13]

有人開玩笑說,dd意為「destroy disk」(破壞硬碟)或「delete data」(刪除數據),因為在對硬碟進行底層操作時,類似顛倒輸入和輸出檔案的一個小錯誤都可能造成部分或全部硬碟數據的遺失。[2]

dcfldd

dcfldddd的一個分支,由前美國國防部電腦取證實驗室僱員尼克·哈勃(Nick Harbour)開發的增強版本。[14][15][16]dd相比,dcfldd允許一個以上的輸出檔案,同時支援多種校驗計算方法,還提供了驗證模式以匹配檔案,並能顯示操作進度百分比。

參見

註釋

  1. ^ 這可以用strace檢查。

參考文獻

  1. ^ Bell Laboratories. dd man page. [2009-02-25]. (原始內容存檔於2011-02-08). 
  2. ^ 2.0 2.1 Sam Chessman. How and when to use the dd command?. CodeCoffee. [2008-02-19]. (原始內容存檔於2008-02-14). 
  3. ^ 3.0 3.1 Eric S. Raymond. dd. [2008-02-19]. (原始內容存檔於2018-12-13). 
  4. ^ 參見舊討論The Unix "dd" command. alt.folklore.computers. [2011-07-05]. (原始內容存檔於2011-07-09). 
  5. ^ linux - Why using conv=notrunc when cloning a disk with dd?. Stack Overflow. 2013-12-11 [2014-03-24]. (原始內容存檔於2014-03-24). 
  6. ^ Wright, Craig; Kleiman, Dave; Sundhar R.S., Shyaam. Overwriting Hard Drive Data: The Great Wiping Controversy. Lecture Notes in Computer Science. Information Systems Security. 2008, 5352: 243–257 [2012-03-07]. doi:10.1007/978-3-540-89862-7_21. (原始內容存檔於2019-09-24). 
  7. ^ Wipe: Secure File Deletion. Wipe.sf.net. [2014-03-24]. 
  8. ^ LAB Valentin. dd_rhelp author's repository. 2011-09-19 [2013-04-20]. (原始內容存檔於2008-05-16). Important note : For some times, dd_rhelp was the only tool (AFAIK) that did this type of job, but since a few years, it is not true anymore: Antonio Diaz did write a ideal replacement for my tool: GNU 'ddrescue'. 
  9. ^ Damaged Hard Disk. www.cgsecurity.org. [2008-05-20]. (原始內容存檔於2008-05-10). 
  10. ^ Interview with GNU ddrescue's Antonio Diaz Diaz. Blue-GNU. [2008-12-06]. (原始內容存檔於2008-04-15). 
  11. ^ Windows 137GB (128 GiB) Capacity Barrier - Seagate Technology (March 2003)
  12. ^ ChangeLog-2.4.23. www.kernel.org. [2009-12-07]. (原始內容存檔於2009-10-08). 
  13. ^ Linux-2.4.23 released Archive.is存檔,存檔日期2012-12-14 Linux kernel mailing list, 2003.
  14. ^ DCFLDD at Source Forge. Source Forge. [2013-08-17]. (原始內容存檔於2013-08-02). 
  15. ^ Jeremy Faircloth, Chris Hurley. Penetration Tester's Open Source Toolkit. Syngress. 2007: 470 – 472. ISBN 9780080556079. 
  16. ^ Jack Wiles, Anthony Reyes. The Best Damn Cybercrime and Digital Forensics Book Period. Syngress. 2011: 408 – 411. ISBN 9780080556086. 

外部連結