差分編碼

本页使用了标题或全文手工转换
维基百科,自由的百科全书

差分编码(英語:Delta encoding),又稱增量編碼,是指在序列式資料之間以數據差異英语Data differencing形式儲存或傳送資料的方式(相對於儲存傳送完整檔案的方式)。差分編碼應用廣泛,如需要查看文件的歷史更改記錄(版本控制git等)、Windows中的遠程差分壓縮英语Remote Differential Compression在线备份等場景均用到了差分编码。

差異儲存在稱為「delta」或「diff」的不連續檔案中。由於改變通常很小(平均佔全部大小的2%),差分編碼能大幅減少資料的重複。一連串獨特的delta檔案在空間上要比未編碼的相等檔案有效率多了。

差分編碼的簡單例子是儲存序列式資料之間的差異(而不是儲存資料本身):不存「2, 4, 6, 9, 7」,而是存「2, 2, 2, 3, -2」。單獨使用用處不大,但是在序列式數值常出現時可以幫助壓縮資料。

相關條目