對(duì)檔案數(shù)字資源“異質(zhì)備份”的理解

檔案數(shù)據(jù)的“異質(zhì)備份”是目前檔案行業(yè)經(jīng)常使用的業(yè)務(wù)術(shù)語(yǔ),雖然最開(kāi)始提出時(shí)主要是指紙質(zhì)檔案的膠片化,但隨著技術(shù)的發(fā)展,現(xiàn)在主要指對(duì)檔案數(shù)據(jù)資源的使用“不同離線介質(zhì)“進(jìn)行”離線存儲(chǔ)”,實(shí)現(xiàn)長(zhǎng)期保存。
這個(gè)項(xiàng)目自啟動(dòng)以來(lái),我們團(tuán)隊(duì)便傾注了極大的熱情和精力。在市場(chǎng)調(diào)研、需求分析、方案制定等各個(gè)環(huán)節(jié),我們都力求做到最好。期間,我們不斷與合作伙伴溝通協(xié)作,共同攻克了一個(gè)又一個(gè)難題。終于,在激烈的競(jìng)爭(zhēng)中脫穎而出,成功中標(biāo)!
這次中標(biāo)不僅是對(duì)我們團(tuán)隊(duì)實(shí)力的認(rèn)可,更是對(duì)我們辛勤付出的回報(bào)。這個(gè)項(xiàng)目的成功中標(biāo),將為我們帶來(lái)更多的業(yè)務(wù)機(jī)會(huì)和發(fā)展空間,也將在行業(yè)內(nèi)樹(shù)立我們的良好口碑。
早期觀點(diǎn):“異質(zhì)備份”指電子文件打印為紙質(zhì)或膠片
問(wèn)題一:信號(hào)不穩(wěn)定,受環(huán)境影響大
這種模擬信號(hào)的存儲(chǔ)介質(zhì)由于存儲(chǔ)信號(hào)是連續(xù)變化的波形,所以每個(gè)采樣點(diǎn)的采樣值在播放或者數(shù)字化過(guò)程中很容易受到外界影響而無(wú)法輸出唯一數(shù)據(jù)。 例如: 使用不同品牌、不同精度的掃描儀對(duì)同一文件進(jìn)行掃描將生成不同大小數(shù)字化文件。 使用不同品質(zhì)的磁頭或者鏡頭將顯著影響磁帶或者膠片的播放質(zhì)量。
問(wèn)題二:無(wú)法記錄復(fù)雜電子文件
除可以展開(kāi)為二維結(jié)構(gòu)的檔案數(shù)據(jù)(如文本類(lèi)、圖紙類(lèi)和簡(jiǎn)單圖像)外,傳統(tǒng)紙質(zhì)和膠片介質(zhì)難以記錄復(fù)雜結(jié)構(gòu)電子文件,如壓縮包、鏡像文件、數(shù)據(jù)庫(kù)備份文件、二進(jìn)制程序文件、CAD圖紙文件等,這些復(fù)雜類(lèi)型數(shù)據(jù)難以展開(kāi)為二維結(jié)構(gòu)或線性波形,因此難以在傳統(tǒng)介質(zhì)上進(jìn)行記錄。
問(wèn)題三:無(wú)法恢復(fù)為唯一的電子文件
備份的唯一作用,就是用來(lái)做“數(shù)據(jù)恢復(fù)”,如果異質(zhì)備份主要使用“模擬信號(hào)”方式進(jìn)行備份,則將無(wú)法準(zhǔn)確恢復(fù)為原文件(文件大小、內(nèi)容完全一致),外界光線、磁場(chǎng)將導(dǎo)致每次的文件還原結(jié)果都不一致。 可見(jiàn),無(wú)論是“紙質(zhì)”還是“縮微膠片”都仍然使用模擬信號(hào)存儲(chǔ)數(shù)據(jù),這種存儲(chǔ)模式本質(zhì)上是一種不穩(wěn)定的存儲(chǔ)形態(tài),非常容易受到播放設(shè)備、環(huán)境和技術(shù)種類(lèi)而導(dǎo)致檔案電子文件發(fā)生變化,從而導(dǎo)致無(wú)法從這類(lèi)介質(zhì)中還原唯一的電子文件,難以使用信息化手段對(duì)檔案數(shù)字化文件進(jìn)行唯一性認(rèn)證,最終難以起到現(xiàn)代意義上的數(shù)字備份效果。 導(dǎo)致唯有原紙質(zhì)件才具有法律效力,所有的電子還原件難以證明其真實(shí)性,帶來(lái)額外的工作成本。
問(wèn)題四:誤碼率高,沒(méi)有數(shù)據(jù)糾錯(cuò)機(jī)制,極易損壞
最重要的是,這類(lèi)存儲(chǔ)介質(zhì)缺乏現(xiàn)代意義上的數(shù)據(jù)修復(fù)機(jī)制(如數(shù)據(jù)校驗(yàn)值、數(shù)據(jù)糾刪算法),當(dāng)一個(gè)位置的磁性或者像素丟失后,無(wú)法通過(guò)數(shù)學(xué)手段恢復(fù)損壞的數(shù)據(jù),最終導(dǎo)致數(shù)據(jù)損壞。 可見(jiàn),使用“模擬軌”方式存儲(chǔ)的檔案數(shù)據(jù)仍然以實(shí)物方式管理、難以進(jìn)行唯一性跟蹤、除原件外,也難以在現(xiàn)代單套制體系下進(jìn)行憑證和真實(shí)性認(rèn)證。
問(wèn)題五:容量密度小,相關(guān)設(shè)備造價(jià)高、不普及
模擬軌因?yàn)榇鎯?chǔ)原理問(wèn)題難以實(shí)現(xiàn)高密度擴(kuò)展,單張介質(zhì)存儲(chǔ)量有限,需要搭配專業(yè)級(jí)設(shè)備才能實(shí)現(xiàn)數(shù)據(jù)讀取和寫(xiě)入(如讀取膠片需要專業(yè)級(jí)鏡頭設(shè)備,初次采購(gòu)成本較高)。 隨著技術(shù)發(fā)展,目前也有數(shù)字膠片技術(shù),即采用模擬信號(hào)存儲(chǔ)數(shù)字型號(hào)的方式,先將數(shù)字信號(hào)轉(zhuǎn)為圖形碼(如二維碼),然后將圖形碼刻蝕在傳統(tǒng)膠片上,從而實(shí)現(xiàn)使用傳統(tǒng)膠片記錄數(shù)字信號(hào),但目前仍受限于市場(chǎng)和技術(shù)推廣。
現(xiàn)代觀點(diǎn):“異質(zhì)備份”指在“不同存儲(chǔ)介質(zhì)”上進(jìn)行“離線備份”
圍繞“磁介質(zhì)”和“光介質(zhì)”離線存儲(chǔ),相關(guān)的標(biāo)準(zhǔn)如下:


優(yōu)勢(shì)一:天然符合支持檔案行業(yè)“離線存儲(chǔ)”
藍(lán)光光盤(pán)是天然的離線存儲(chǔ)介質(zhì),當(dāng)不讀取數(shù)據(jù)時(shí),光盤(pán)與驅(qū)動(dòng)器分離,進(jìn)而與系統(tǒng)斷開(kāi)實(shí)現(xiàn)離線存儲(chǔ)。 硬磁盤(pán)的離線存儲(chǔ)通常需要借助人工管理或硬盤(pán)庫(kù)管理,實(shí)現(xiàn)對(duì)指定硬盤(pán)進(jìn)行斷電離線管理。
優(yōu)勢(shì)二:低誤碼率,數(shù)據(jù)糾錯(cuò)算法與介質(zhì)質(zhì)檢
現(xiàn)代化的存儲(chǔ)介質(zhì)均具備數(shù)據(jù)糾錯(cuò)算法,即輕微的環(huán)境干擾或介質(zhì)損壞不會(huì)導(dǎo)致數(shù)據(jù)損壞,驅(qū)動(dòng)器一般可以進(jìn)行數(shù)據(jù)解碼恢復(fù)。 磁介質(zhì)具備S.M.A.R.T.自動(dòng)化檢測(cè)功能,光介質(zhì)需要使用特制檢測(cè)光驅(qū)實(shí)現(xiàn)介質(zhì)檢測(cè),完善的介質(zhì)檢測(cè)可以避免存儲(chǔ)數(shù)據(jù)潛在的丟失風(fēng)險(xiǎn)。
優(yōu)勢(shì)三:容量密度大,保存時(shí)間長(zhǎng)
目前藍(lán)光光盤(pán)可以最大做到200GB/張的容量密度。 硬盤(pán)可以做到20TB/塊,遠(yuǎn)超傳統(tǒng)的模擬存儲(chǔ)介質(zhì)。
隨著時(shí)代和技術(shù)的發(fā)展,各種術(shù)語(yǔ)的含義也在發(fā)生變化,無(wú)論是長(zhǎng)期保存、離線存儲(chǔ)還是異質(zhì)存儲(chǔ),雖然技術(shù)在不斷迭代,但目的始終沒(méi)有變化,即保證珍貴的檔案數(shù)據(jù)的安全性。 只有結(jié)合最新檔案相關(guān)要求和技術(shù)發(fā)展潮流,提升相關(guān)技術(shù)能力,才能逐步建立起電子檔案數(shù)據(jù)的安全備份體系,實(shí)現(xiàn)長(zhǎng)期保存。
查看原文