大公網

大公報電子版
首頁 > 藝文 > 小公園 > 正文

?知見錄/脆弱的數字資源\胡一峰

2024-10-02 05:02:26大公報
字號
放大
標準
分享

  偶然看到一則消息,有家媒體公司有上萬個九十年代用來存檔的硬盤驅動器,現在五分之一無法讀取,上面的資料可能全部遺失了。這很令人警覺。我曾下意識地認為資料數字化后就可以千年萬代保存下去。這種想法其實是想當然,簡單的生活經驗就可以證偽。我有好幾個損壞的U盤、硬盤和手機,里面的文檔照片都無法讀取了。它們擺在我的抽屜里,事實上毫無用處,沒有丟進垃圾桶,既因愛惜舊物的習慣,也怕個人信息丟失。

  冗余資料的數量與媒介方便程度似乎成正比,到了數字時代更是瘋狂增加。自打有了電腦寫作,修改文稿更加方便,修改次數也大大增加。每改一次都留下過程稿,曾被我視為一個好習慣,后來卻發(fā)現,就回溯修改過程而言,數字化的過程稿看似增刪清晰,實則不如手改稿直觀。每改必存毫無必要,反而制造了冗余累贅。

  據說,二○二○年全球產生數據量已經超過四十ZB,相當于地球上每個人每年產生了五TB的數據。其中,百分之八十以上是不經常使用的“冷數據”,但至少有百分之十的數據是有價值的數字資源,需要被長期保存。與傳統(tǒng)的紙張相比,數字介質的維護成本更大。由于格式和載體對環(huán)境的依賴性,數字資源其實十分脆弱,如何長期保存和保真都已成為全球課題。

  其實,與此相關的另一話題同樣值得關注,那就是選擇。保存文化資源的目的是為了傳遞文明。歷史地看,每個時代都在為后世立法,其方式就是對本時代的文化進行選擇性保存。因此,研讀歷史不只是了解過去是個什么樣子,更能搞懂如今為何是這般樣子。如果說,前信息時代的選擇性保存是受制于介質技術不得不為之“惡”,那么,在新介質的加持下,今天更要避免因為選擇失誤或放棄選擇帶來的信息負擔之“惡”。

點擊排行