Také máte v šuplíku pár disket s důležitými soubory, jako je diplomka psaná v programu T602? A co rodinné fotografie? Pravidelně je vypalujete na cédéčka a myslíte si, že o ně nemůžete přijít? Omyl.
Když se pracovníci Amesova výzkumného centra NASA v Kalifornii chtěli podívat na fotografie Měsíce pořízené v 60. letech družicemi Lunar Orbiter, narazili na problém. Magnetické pásky s jejich záznamy odpočívaly dlouhé roky v klimatizované místnosti ve speciálně odstíněných schránkách. Přesto si odborníci s jejich čtením nevěděli rady. Museli povolat bývalého zaměstnance v důchodu, který si schoval zařízení na čtení pásek – stále funkční, byť se v něm zabydlela ještěrka. Pamětník pomohl také s převodem snímků do dnes použitelné podoby. Zatím se ale podařilo vydolovat z pásek jen fotografie s malým rozlišením, kvalitnější verze pokusům o dekódování odolávají.
Podobné potíže mohou potkat každého z nás. Zatímco egyptské hieroglyfy a středověké klášterní knihy si můžeme prohlížet i po staletích, dnešní nosiče informací mají omezenou životnost. Jejich „poločas rozpadu“ se stále zkracuje.
Problémy s dlouhodobým uchováváním digitálních dat se odehrávají ve třech rovinách: samotná média se zapsanými daty degradují a časem se stávají nečitelnými; vedle toho typy nosičů zastarávají a po nějaké době chybí hardware, který by umožnil je přehrát; do třetice se mění formáty souborů, takže si nové počítačové programy se starými soubory neumí poradit.
Na flešku nespoléhat Většina z nás počítá s tím, že když si někam uložíme soubory, nemůžeme o ně přijít. Málokdo si přitom uvědomuje, že například životnost cédéček výrazně kolísá podle jejich kvality – povrch lacinějších výrobků rychle mění chemické vlastnosti a stává se nečitelným. U některých typů výrobci negarantují ani deset let.
„Nejspolehlivější jsou kompaktní disky od seriózních výrobců se zlatou vrstvou, které jsou vyloženě určené pro archivaci. Někteří výrobci ale zlatou barvu jen napodobují,“ upozorňuje profesor Pavel Ripka z katedry měření Fakulty elektrotechnické ČVUT. Takové cédéčko jde přitom pořídit za pár desetikorun. Vypálené nosiče bychom měli chránit před vysokou teplotou, vlhkostí, UV zářením a výpary chemikálií. Zároveň odborník varuje před používáním DVD disků. Sice mají větší kapacitu než cédéčka, ale také mnohem kratší životnost.
„Měli bychom si uvědomit rozdíl mezi zálohováním a archivováním. Ve věcech, které chceme archivovat, bychom si měli udělat pořádek, abychom zbytečně neuchovávali deset verzí jednoho dokumentu, když nám stačí ta poslední,“ říká Pavel Ripka. Za nebezpečné médium považuje také USB flash disky. Sice jsou vhodné pro krátkodobý přenos dat, ale výrobci se soustředí na jejich rychlost a kapacitu, nikoliv na stabilitu.
Jak zmíněným rizikům předcházet? Podle profesora Ripky je ideální ukládat stejná data na několik různých nosičů, například na cédéčka a pevný disk. Důležité informace je vhodné uložit ve více datových formátech a případně je i vytisknout na kvalitní papír. A pochopitelně jednotlivé kopie přechovávat na různých místech, abychom nepřišli o všechny najednou, když nás navštíví zloděj nebo živelní pohroma.
Dlouhodobě stabilní nejsou ani zmíněné pevné disky. „Důvěřoval bych jim tak pět let. Během té doby se ale jejich kapacita mnohonásobně zvýší, takže není problém starý archiv přesunout na nový disk a pořád nám zůstane dost volného místa,“ říká Pavel Ripka.
Zmíněné rady mohou znít banálně, ale sáhněme si do svědomí – opravdu se podle nich chováme?
Antibiotika, nebo Madonna?
Příběh z NASA ilustruje další princip, který bychom měli při archivaci dat zachovávat. „Ukazuje potřebu aktivní péče o data, která zde chyběla,“ říká konzultant Miroslav Širl z občanského sdružení Co po nás zbude, který se zabývá problematikou archivace elektronických dokumentů. „Data byla sice pečlivě uložená, ale to nestačí,“ konstatuje Miroslav Širl. Cílem aktivní péče je také to, aby data byla použitelná současnými prostředky. Je třeba pravidelně kontrolovat autenticitu a integritu uložených dat a případně je přesunout na novější nosiče nebo je převést do novějšího formátu.
Časopis New Scientist poukazuje na další riziko: čím více kopií od daného souboru existuje, tím větší je šance, že se zachová pro příští generace. Může se tedy stát, že odkazem naší civilizace bude spousta pornografie a písně od Madonny, ale informace, jako je přečtený lidský genom nebo návod na výrobu antibiotik, by se mohly ztratit.
Ostatně, nebylo by to poprvé, kdy by se něco podobného přihodilo. Spojené státy musely předloni navýšit rozpočet na obnovu jaderného arzenálu o 69 milionů dolarů, protože „zapomněly“, jak se vyrábí tajná příměs nukleárních hlavic přezdívaná Fogbank. Lidé, kteří se kdysi podíleli na jejím vývoji, odešli do důchodu nebo změnili zaměstnání a příslušné záznamy nejsou k nalezení. Digitalizace i návrat k analogu Možnostem dlouhodobé archivace se na mezinárodní úrovni intenzivně věnuje například British Library. V České republice se touto problematikou zabývá například Národní archiv, který pracuje na projektu Národního digitálního archivu. „Úkolem digitálního archivu bude uchovávat vybrané elektronické dokumenty veřejné správy v podstatě po neomezenou dobu,“ říká Jiří Bernas z Národního archivu, který se na projektu podílí.
Z bezpečnostních důvodů bude mít digitální archiv dvě úložiště: jedno v Praze, druhé v jižních Čechách. Podle současných plánů má začít fungovat ve druhé polovině roku 2013. Soubory se v archivu budou ukládat na diskových polích – tedy soustavách více pevných disků – a na optických médiích, případně na magnetických páskách. Pro laika to může znít exoticky, ale právě magnetické pásky jsou spolu s pevnými disky mezi profesionály dodnes nejoblíbenějším nosičem pro ukládání dat. Ovšem s tím, že probíhá jejich aktivní údržba, takže se data na jedné konkrétní pásce nezdrží déle než jeden až dva roky.
Některé instituce se ovšem rizik spojených s digitalizací obávají natolik, že se raději vracejí k osvědčeným analogovým zápisům. „Přestože mají data v digitální podobě, převedou je zpátky na analogové obrazy, které uchovávají například na mikrofilmech,“ podotýká Miroslav Širl.
Je pravda, že pokud by se naše civilizace dostala do potíží a ocitla se například bez zdroje elektřiny, všechny uložené jedničky a nuly nám budou k ničemu. S touto vizí počítá americká nadace, která vyrobila tzv. Rosettský disk (pojmenovaný podle slavné Rosettské desky, do níž je vytesán shodný text ve dvou egyptských písmech a v řečtině). Niklový disk připomínající cédéčko má na sobě vyleptáno 30 000 stran textu ve více než tisíci různých jazycích včetně češtiny. Má sloužit jako Noemova archa jazyků, protože se dá předpokládat, že v příštích desetiletích řada z nich vymizí.
Na přední straně je text viditelný pouhým okem, postupně se zmenšuje a ke čtení vyžaduje tisícinásobné zvětšení. Kromě toho, že se jedna kopie dostala do vesmíru na palubě evropské sondy Rosetta, mířící ke vzdálené kometě, může disk na Zemi posloužit jako odkaz příštím generacím, bez ohledu na to, jakou techniku po nás zdědí. Ke čtení disku není potřeba žádné speciální vybavení, stačí pořádně velká lupa.