檔案數(shù)據(jù)的“異質(zhì)備份”是目前檔案行業(yè)經(jīng)常使用的業(yè)務(wù)術(shù)語(yǔ),雖然最開(kāi)始提出時(shí)主要是指紙質(zhì)檔案的膠片化,但隨著技術(shù)的發(fā)展,現(xiàn)在主要指對(duì)檔案數(shù)據(jù)資源的使用“不同離線介質(zhì)“進(jìn)行”離線存儲(chǔ)”,實(shí)現(xiàn)長(zhǎng)期保存。

這個(gè)項(xiàng)目自啟動(dòng)以來(lái),我們團(tuán)隊(duì)便傾注了極大的熱情和精力。在市場(chǎng)調(diào)研、需求分析、方案制定等各個(gè)環(huán)節(jié),我們都力求做到最好。期間,我們不斷與合作伙伴溝通協(xié)作,共同攻克了一個(gè)又一個(gè)難題。終于,在激烈的競(jìng)爭(zhēng)中脫穎而出,成功中標(biāo)!

這次中標(biāo)不僅是對(duì)我們團(tuán)隊(duì)實(shí)力的認(rèn)可,更是對(duì)我們辛勤付出的回報(bào)。這個(gè)項(xiàng)目的成功中標(biāo),將為我們帶來(lái)更多的業(yè)務(wù)機(jī)會(huì)和發(fā)展空間,也將在行業(yè)內(nèi)樹(shù)立我們的良好口碑。


早期觀點(diǎn):“異質(zhì)備份”指電子文件打印為紙質(zhì)或膠片

2008年汶川大地震發(fā)生后,國(guó)家檔案局審時(shí)度勢(shì),要求各級(jí)國(guó)家檔案館通過(guò)建立異地備份庫(kù)等形式,時(shí)任國(guó)家檔案局局長(zhǎng)楊冬權(quán)在兩年后的“全國(guó)檔案安全體系建設(shè)工作會(huì)議”上提出: “為了確保檔案實(shí)體安全和信息安全,國(guó)家檔案局2008年進(jìn)一步要求各級(jí)國(guó)家檔案館通過(guò)建立異地備份庫(kù)等形式,對(duì)本級(jí)重要檔案及電子文件實(shí)行異地備份,對(duì)重要的電子文件實(shí)行異質(zhì)備份,確保電子文件的長(zhǎng)期可讀,確保檔案信息的絕對(duì)安全。各地檔案部門(mén)高度重視,精心組織,積極謀劃,相繼建立了電子文件中心或電子文件備份中心,開(kāi)展電子文件管理工作,認(rèn)真做好電子文件異質(zhì)備份和重要檔案異地備份工作?!? “要嚴(yán)格對(duì)電子文件進(jìn)行安全備份。凡未向電子文件中心移交電子文件的單位,要將本單位所有電子文件在異地備份一套,其中劃入永久保存的,還要轉(zhuǎn)換成紙質(zhì)或縮微膠卷,實(shí)行異質(zhì)備份,以確保電子文件安全?!? 可見(jiàn),早期文檔中所提到的“異質(zhì)備份”主要指電子文件轉(zhuǎn)換成“紙質(zhì)”或“微縮膠片”,也就是大家通常說(shuō)的“模擬軌”存儲(chǔ)方式。 當(dāng)前技術(shù)下,電子文件主要使用兩種形態(tài)進(jìn)行保存,一種是“模擬軌”、一種是“數(shù)字軌”。模擬軌上主要記錄模擬信號(hào),模擬信號(hào)(Analog Signal)是一種連續(xù)變化的信號(hào),可以在一定范圍內(nèi)取無(wú)限多個(gè)值。它通常用于傳輸物理世界中的信息,如聲音、光強(qiáng)、溫度等。例如,在音頻傳輸中,模擬信號(hào)可以直接表示聲音的波形。這種信號(hào)的特點(diǎn)是具有連續(xù)性和無(wú)窮多的可能值,任何微小的變化都會(huì)反映在信號(hào)上。由于模擬信號(hào)的連續(xù)性,傳輸過(guò)程中容易受到噪聲的影響,從而導(dǎo)致信號(hào)的失真或衰減。除傳統(tǒng)紙質(zhì)外,早期的磁帶和縮微膠片存儲(chǔ)的就是這類(lèi)信號(hào)。 但是,傳統(tǒng)的模擬信號(hào)存儲(chǔ)介質(zhì)存在諸多問(wèn)題:

問(wèn)題一:信號(hào)不穩(wěn)定,受環(huán)境影響大

這種模擬信號(hào)的存儲(chǔ)介質(zhì)由于存儲(chǔ)信號(hào)是連續(xù)變化的波形,所以每個(gè)采樣點(diǎn)的采樣值在播放或者數(shù)字化過(guò)程中很容易受到外界影響而無(wú)法輸出唯一數(shù)據(jù)。 例如: 使用不同品牌、不同精度的掃描儀對(duì)同一文件進(jìn)行掃描將生成不同大小數(shù)字化文件。 使用不同品質(zhì)的磁頭或者鏡頭將顯著影響磁帶或者膠片的播放質(zhì)量。

問(wèn)題二:無(wú)法記錄復(fù)雜電子文件

除可以展開(kāi)為二維結(jié)構(gòu)的檔案數(shù)據(jù)(如文本類(lèi)、圖紙類(lèi)和簡(jiǎn)單圖像)外,傳統(tǒng)紙質(zhì)和膠片介質(zhì)難以記錄復(fù)雜結(jié)構(gòu)電子文件,如壓縮包、鏡像文件、數(shù)據(jù)庫(kù)備份文件、二進(jìn)制程序文件、CAD圖紙文件等,這些復(fù)雜類(lèi)型數(shù)據(jù)難以展開(kāi)為二維結(jié)構(gòu)或線性波形,因此難以在傳統(tǒng)介質(zhì)上進(jìn)行記錄。

問(wèn)題三:無(wú)法恢復(fù)為唯一的電子文件

備份的唯一作用,就是用來(lái)做“數(shù)據(jù)恢復(fù)”,如果異質(zhì)備份主要使用“模擬信號(hào)”方式進(jìn)行備份,則將無(wú)法準(zhǔn)確恢復(fù)為原文件(文件大小、內(nèi)容完全一致),外界光線、磁場(chǎng)將導(dǎo)致每次的文件還原結(jié)果都不一致。 可見(jiàn),無(wú)論是“紙質(zhì)”還是“縮微膠片”都仍然使用模擬信號(hào)存儲(chǔ)數(shù)據(jù),這種存儲(chǔ)模式本質(zhì)上是一種不穩(wěn)定的存儲(chǔ)形態(tài),非常容易受到播放設(shè)備、環(huán)境和技術(shù)種類(lèi)而導(dǎo)致檔案電子文件發(fā)生變化,從而導(dǎo)致無(wú)法從這類(lèi)介質(zhì)中還原唯一的電子文件,難以使用信息化手段對(duì)檔案數(shù)字化文件進(jìn)行唯一性認(rèn)證,最終難以起到現(xiàn)代意義上的數(shù)字備份效果。 導(dǎo)致唯有原紙質(zhì)件才具有法律效力,所有的電子還原件難以證明其真實(shí)性,帶來(lái)額外的工作成本。

問(wèn)題四:誤碼率高,沒(méi)有數(shù)據(jù)糾錯(cuò)機(jī)制,極易損壞

最重要的是,這類(lèi)存儲(chǔ)介質(zhì)缺乏現(xiàn)代意義上的數(shù)據(jù)修復(fù)機(jī)制(如數(shù)據(jù)校驗(yàn)值、數(shù)據(jù)糾刪算法),當(dāng)一個(gè)位置的磁性或者像素丟失后,無(wú)法通過(guò)數(shù)學(xué)手段恢復(fù)損壞的數(shù)據(jù),最終導(dǎo)致數(shù)據(jù)損壞。 可見(jiàn),使用“模擬軌”方式存儲(chǔ)的檔案數(shù)據(jù)仍然以實(shí)物方式管理、難以進(jìn)行唯一性跟蹤、除原件外,也難以在現(xiàn)代單套制體系下進(jìn)行憑證和真實(shí)性認(rèn)證。

問(wèn)題五:容量密度小,相關(guān)設(shè)備造價(jià)高、不普及

模擬軌因?yàn)榇鎯?chǔ)原理問(wèn)題難以實(shí)現(xiàn)高密度擴(kuò)展,單張介質(zhì)存儲(chǔ)量有限,需要搭配專業(yè)級(jí)設(shè)備才能實(shí)現(xiàn)數(shù)據(jù)讀取和寫(xiě)入(如讀取膠片需要專業(yè)級(jí)鏡頭設(shè)備,初次采購(gòu)成本較高)。 隨著技術(shù)發(fā)展,目前也有數(shù)字膠片技術(shù),即采用模擬信號(hào)存儲(chǔ)數(shù)字型號(hào)的方式,先將數(shù)字信號(hào)轉(zhuǎn)為圖形碼(如二維碼),然后將圖形碼刻蝕在傳統(tǒng)膠片上,從而實(shí)現(xiàn)使用傳統(tǒng)膠片記錄數(shù)字信號(hào),但目前仍受限于市場(chǎng)和技術(shù)推廣。

現(xiàn)代觀點(diǎn):“異質(zhì)備份”指在“不同存儲(chǔ)介質(zhì)”上進(jìn)行“離線備份”

隨著信息化系統(tǒng)和“單套制”理念的不斷推進(jìn),數(shù)字化后的電子檔案和原生電子檔案存量逐年增長(zhǎng),為滿足檔案存儲(chǔ)的安全性,官方文檔中不再提及“異質(zhì)備份”,而是將重點(diǎn)落到了在“不同存儲(chǔ)介質(zhì)”上進(jìn)行“離線備份”。 維基百科中提到: “備份(英語(yǔ):backup),在信息技術(shù)與數(shù)據(jù)管理領(lǐng)域,指將文件系統(tǒng)或數(shù)據(jù)庫(kù)系統(tǒng)中的數(shù)據(jù)加以復(fù)制;一旦發(fā)生災(zāi)難或錯(cuò)誤操作時(shí),得以方便且及時(shí)地恢復(fù)系統(tǒng)的有效數(shù)據(jù)和正常運(yùn)作。重要資料應(yīng)當(dāng)異地備援,降低風(fēng)險(xiǎn)” “離線備份(Off-line Backup):離線備份使用可離線媒體來(lái)備份,磁帶、光盤(pán)或是硬盤(pán)盒備份完成后離開(kāi)備份媒體” 2024年《中華人民共和國(guó)檔案法實(shí)施條例》中第四十一條明確提到: “檔案館對(duì)重要電子檔案進(jìn)行異地備份保管,應(yīng)當(dāng)采用磁介質(zhì)、光介質(zhì)、縮微膠片等符合安全管理要求的存儲(chǔ)介質(zhì),定期檢測(cè)載體的完好程度和數(shù)據(jù)的可讀性。異地備份選址應(yīng)當(dāng)滿足安全保密等要求?!? “檔案館可以根據(jù)需要建設(shè)災(zāi)難備份系統(tǒng),實(shí)現(xiàn)重要電子檔案及其管理系統(tǒng)的備份與災(zāi)難恢復(fù)?!? 此外,第四十條也明確提到: “檔案館應(yīng)當(dāng)在接收電子檔案時(shí)進(jìn)行真實(shí)性、完整性、可用性和安全性等方面的檢測(cè),并采取管理措施和技術(shù)手段保證電子檔案在長(zhǎng)期保存過(guò)程中的真實(shí)性、完整性、可用性和安全性?!? 2020年國(guó)際檔案局《檔案檢查工作辦法》中明確提到: “制定電子檔案?jìng)浞?、轉(zhuǎn)換和遷移方案及策略,并按照備份策略對(duì)電子檔案實(shí)行在線、離線、近線備份” “電子檔案單套管理,完成電子檔案長(zhǎng)期保存所需的配套制度、設(shè)施設(shè)備的配置工作、指定長(zhǎng)期保存策略,實(shí)現(xiàn)電子檔案單套管理”。 2022年,國(guó)際檔案局發(fā)布的《電子會(huì)計(jì)檔案管理規(guī)范》中明確提到: “電子會(huì)計(jì)檔案應(yīng)實(shí)施在線和離線存儲(chǔ)。在線存儲(chǔ)按電子會(huì)計(jì)檔案管理系統(tǒng)運(yùn)行要求實(shí)施。離線存儲(chǔ)載體應(yīng)具有較好的耐久性,按優(yōu)先順序依次為一次性寫(xiě)光盤(pán)、磁帶、硬磁盤(pán)等?!? “重要電子會(huì)計(jì)檔案應(yīng)進(jìn)行一式三套離線存儲(chǔ),三套離線存儲(chǔ)載體宜分開(kāi)保管,有條件的單位應(yīng)進(jìn)行異地備份。離線存儲(chǔ)載體管理按照 DA/T15和 DA/T38給出的要求進(jìn)行。不能用運(yùn)維備份的信息組織方式進(jìn)行離線存儲(chǔ),更不能用系統(tǒng)備份文件代替離線存儲(chǔ)文件。 對(duì)離線存儲(chǔ)電子會(huì)計(jì)檔案的磁性載體每滿2年、光盤(pán)每滿4年進(jìn)行一次抽樣機(jī)讀檢驗(yàn),抽樣率不低于10%,發(fā)現(xiàn)問(wèn)題應(yīng)及時(shí)采取措施。對(duì)磁性載體上的電子檔案,應(yīng)每4年轉(zhuǎn)存一次。原載體同時(shí)保留時(shí)間不少于4年?!? 從上述相關(guān)表述中可以明顯看出,“異質(zhì)備份”表述被“離線存儲(chǔ)”所替代,明確提及了多種離線存儲(chǔ)介質(zhì),如“磁介質(zhì)”和“光介質(zhì)”,并且需要進(jìn)行多套備份和長(zhǎng)期保存,并格外重視存儲(chǔ)過(guò)程中的“四性檢測(cè)”,例如電子檔案數(shù)據(jù)的真實(shí)性就必須依賴現(xiàn)代存儲(chǔ)技術(shù)進(jìn)行針對(duì)性維護(hù)。
圍繞“磁介質(zhì)”和“光介質(zhì)”離線存儲(chǔ),相關(guān)的標(biāo)準(zhǔn)如下: article article 相比于傳統(tǒng)的膠片等技術(shù),光介質(zhì)和磁介質(zhì)主要具備以下優(yōu)勢(shì):

優(yōu)勢(shì)一:天然符合支持檔案行業(yè)“離線存儲(chǔ)”

藍(lán)光光盤(pán)是天然的離線存儲(chǔ)介質(zhì),當(dāng)不讀取數(shù)據(jù)時(shí),光盤(pán)與驅(qū)動(dòng)器分離,進(jìn)而與系統(tǒng)斷開(kāi)實(shí)現(xiàn)離線存儲(chǔ)。 硬磁盤(pán)的離線存儲(chǔ)通常需要借助人工管理或硬盤(pán)庫(kù)管理,實(shí)現(xiàn)對(duì)指定硬盤(pán)進(jìn)行斷電離線管理。

優(yōu)勢(shì)二:低誤碼率,數(shù)據(jù)糾錯(cuò)算法與介質(zhì)質(zhì)檢

現(xiàn)代化的存儲(chǔ)介質(zhì)均具備數(shù)據(jù)糾錯(cuò)算法,即輕微的環(huán)境干擾或介質(zhì)損壞不會(huì)導(dǎo)致數(shù)據(jù)損壞,驅(qū)動(dòng)器一般可以進(jìn)行數(shù)據(jù)解碼恢復(fù)。 磁介質(zhì)具備S.M.A.R.T.自動(dòng)化檢測(cè)功能,光介質(zhì)需要使用特制檢測(cè)光驅(qū)實(shí)現(xiàn)介質(zhì)檢測(cè),完善的介質(zhì)檢測(cè)可以避免存儲(chǔ)數(shù)據(jù)潛在的丟失風(fēng)險(xiǎn)。

優(yōu)勢(shì)三:容量密度大,保存時(shí)間長(zhǎng)

目前藍(lán)光光盤(pán)可以最大做到200GB/張的容量密度。 硬盤(pán)可以做到20TB/塊,遠(yuǎn)超傳統(tǒng)的模擬存儲(chǔ)介質(zhì)。

隨著時(shí)代和技術(shù)的發(fā)展,各種術(shù)語(yǔ)的含義也在發(fā)生變化,無(wú)論是長(zhǎng)期保存、離線存儲(chǔ)還是異質(zhì)存儲(chǔ),雖然技術(shù)在不斷迭代,但目的始終沒(méi)有變化,即保證珍貴的檔案數(shù)據(jù)的安全性。 只有結(jié)合最新檔案相關(guān)要求和技術(shù)發(fā)展潮流,提升相關(guān)技術(shù)能力,才能逐步建立起電子檔案數(shù)據(jù)的安全備份體系,實(shí)現(xiàn)長(zhǎng)期保存。

查看原文