Digital storage

Digitallagrene renner over

Forskere samler store mengder informasjon, men mangler digital lagerplass, og viktige kunnskaper står i fare for å bli utilgjengelige for neste generasjon. Vitenskapelige data har allerede forsvunnet eller er blitt reddet i siste øyeblikk.

21. juli 2011 av Ib Salomon

Hjerneforskerne gjør det, astronomene gjør det, og spesielt atomfysikerne gjør det: De skaper umåtelige mengder digitale data.

Når fysikerne for eksempel starter opp den store akseleratoren ved CERN, verdens største senter for partikkel-fysikk, leverer den i løpet av ett år 15 petabyte informasjon. En petabyte tilsvarer én milliard megabyte, langt mer enn man finner i selv de største bibliotekene. Også de utallige satellittene produserer astronomiske mengder data. Den europeiske romfartsorganisasjonen ESA har fem petabyte data liggende på lager, og regner glatt med at datamengden vil tidoble seg i løpet av de nærmeste årene.

Det er selvsagt i seg selv ikke noe galt med enorme datamengder. Forholdet er bare det at problemene med å ta vare på dataene, øker på – og det samme gjør faren for at de på et eller annet tidspunkt vil vise seg å være utilgjengelige.

Og ingenting blir enklere av at det er snakk om komplekse data som det helst skulle vært mulig å finne igjen alle deler av. Tilgangsønsket skyldes ikke minst at kravene til vitenskapelig dokumentasjon er kontinuerlig økende. For å godkjenne et legemiddel forlanger myndighetene eksempelvis at alle de forutgående testene og forsøkene blir grundig dokumentert. Og blir det reist tvil om forskernes arbeid, slik det nylig skjedde innen klima-forskningen, er det viktig å kunne lete bakover og dobbeltsjekke dataene som forskerne baserte konklusjonene på.

Forskningen blir digital og kommer aldri på papir

Mange opplysninger finnes nå bare i digital form og vil aldri se et papir – faktisk blir i dag bare 0,1 prosent trykt. Også de vitenskapelige tidsskriftene går den veien. Man venter at hele 75 prosent av alle verdens 20 000 forskningsmagasiner vil utgis digitalt i løpet av ti år. Noe som i så fall blir et enormt bidrag til et allerede nå voksende lager av digital informasjon.

For tiden dobles lagermengden på få år, og i 2020 tror man den vil være 40 ganger større enn nå. Skulle all informasjon vi skaper i dag bli skrevet ut på papir, ville stabelen økt raskere enn en rakett flyr, og i løpet av ett år kunne vi ha bygd 11 slike stabler fra Jorden til Solen.

Det meste er ny informasjon, og en betydelig del kommer fra forskning. Men i tillegg til flodbølgen av nye data blir også gamle dokumenter, filmer og bilder digitalisert i et vanvittig tempo. Google har for eksempel tatt mål av seg til å digitalisere de rundt 130 millioner bøkene man mener er utgitt gjennom tidene.

De ekstreme datamengdene stiller enorme krav til lagringsmediene. En av løsningene er å pakke informasjonen stadig tettere sammen, noe vi også gjør i stor stil. Siden datamaskinens barndom har vi klart å lagre opplysninger flere millioner ganger tettere, og utviklingen fortsetter: En Blu-ray plate kan for eksempel romme fem ganger så mye data som en DVD. Forskerne er også godt i gang med en videreutvikling, der informasjonen enkelt sagt kan stables i 20 lag. Et slikt lagringsmedium vil kunne romme 500 gigabyte. Også de helt nye holografiske metodene virker lovende.

Stor risiko når informasjon pakkes tett

Men det er ikke helt farefritt å lagre opplysningene så tett, mener blant andre Neil Grindley, som er ekspert på digital oppbevaring og jobber for britiske Joint Information Systems Committee: ”Faren for å miste digital informasjon blir ekstra stor dersom den oppbevares i komprimert form,” uttaler han.

Blant annet av den grunn blir lagring på store harddisker stadig mer utbredt i forskningsmiljøene. Fordelen er at det er veldig enkelt å hente ut data fra en harddisk. Til gjengjeld krever det store servere som alltid må være oppe. En server så stor som et kjøleskap kan romme opptil 200 terabyte, men den blir varm når den jobber. Driftstemperaturen bør helst ligge på 17–18 grader, og det trengs masse energi til både å holde serveren i gang og sørge for kontinuerlig avkjøling.

Derfor er blant annet CERN på utkikk etter steder der forskerne kan legge de enorme datalagrene og samtidig ha enkel tilgang til både energi og kjølevann. Løsningen blir trolig nybygde anlegg i fjell, der det er god tilgang på vannkraft og der vannet samtidig kan brukes til kjøling. Også de store europeiske bibliotekene vurderer tilsvarende løsninger, for de har også et stadig økende behov for utvidet lagringskapasitet.

Tema

Les også

Kanskje du er interessert i...

FÅ ILLUSTRERT VITENSKAPS NYHETSBREV

Du får ditt gratis spesialtillegg, Vår Ekstreme Hjerne, til nedlasting straks du har meldt deg på nyhetsbrevet.

Fant du ikke det du lette etter? Søk her: