Metadata - orden i kaos

Skrevet av Asbjørn Risan , 27. oktober, 2020
Mengden data i samfunnet øker hele tiden, og kan gi oss en enorm verdi. Men bare hvis vi finner igjen det vi leter etter. Her kommer metadata inn.

Vi omgir oss med og forholder oss til metadata hele tiden, hver eneste dag. Varedeklarasjonen og holdbarhetsdatoen på melkekartongen, tidtabellen for kollektivtransporten og tv-guiden er eksempler på metadata.

Metadata

I Store norske leksikon er metadata definert som «data om data, informasjon som beskriver annen informasjon». Det vil si at i overført betydning er metadata noe som beskriver noe. Det kan også settes et likhetstegn mellom metadata og data.

Metadata er opplysninger om noe. Når du bestiller en flybillett så er det viktig å få informasjon om når flyet går, hvilken flyplass det går fra, hvor det har tenkt å lande og hvor mye det koster. Metadata er enkeltopplysninger som samlet beskriver en større helhet.

Ulike typer metadata

Beskrivende, administrative og tekniske metadata er eksempler på flere ulike typer metadata.For å forstå dette kan vi bruke et eksempel; Når du tar et bilde med telefonen dannes det flere ulike lag med metadata som er med på å beskrive bildet. Dette vil gjøre det lettere for deg, og ikke minst ulike algoritmer å finne igjen akkurat det bildet.

Informasjon om når bildet ble tatt er administrative metadata. Hva slags kamera og modell som ble brukt, antall piksler i høyde/bredde, om det ble brukt blits eller ikke, format, hvor bildet fysisk ble tatt (geoposisjon) og mye mer er eksempler på tekniske metadata. Beskrivende metadata for et bilde er hva det er tatt bilde av; er det et bilde av elg i solnedgang eller Eiffeltårnet. Å knytte beskrivende metadata til bilder og illustrasjoner er viktig hvis man bruker dem i dokumenter/presentasjoner med tanke på universell utforming.

Metadata og Unit

Jeg jobber med bibliotektjenester i Unit, og i våre tjenester har metadata tradisjonelt vært knyttet til å beskrive bøker og dokumenter for å gjøre det enklere å vite hva man har i samlingen og hvor man kan finne og få tilgang til dokumentet. Men hvem som har lånt boken, hvor lenge de kan låne den og hva boka inneholder/handler om er også metadata.

Målet med metadata i våre bibliotektjenester er altså at man skal kunne identifisere, finne, velge og få tilgang til bøkene og dokumentene. I andre tjenester som Unit leverer kan det være arkivering og rapportering som er hensikten, men det er like fullt snakk om metadata.

I Unit er det meste av aktiviteten knyttet til metadata på et eller annet vis, enten i produksjon av metadata, vurdering av metadata eller systemer for å håndtere eller vedlikeholde metadata. I Felles studentsystem (FS) lagres metadata om hvilke fag/emner som undervises i til hvilken tid, hvem som undervises og hvilke studenter som har rett til å studere. I Samordna opptak vurderes karakterer og ønskede studieretninger for å kunne tildele studieplasser. I Cristin registreres det metadata om publikasjoner og prosjekter innen forskning.

Masterdata og autoriteter

En viktig variant av metadata er masterdata eller autoriteter. I det følgende brukes autoritetsregister som et uttrykk for masterdatakilder.

Et autoritetsregister er et register over foretrukket skriveform og varianter for det man ønsker å beskrive. Vanlige autoritetstyper er personnavn, organisasjonsnavn, emneord og tid/sted. I et autoritetsregister vil hver innførsel få en unik identifikator som det knyttes ulike opplysninger til.

Hensikten med et autoritetsregister er å sikre konsekvent registrering, unngå skrivefeil og sikre søkeinnganger på typiske varianter i skrivemåte.

Fellestjenester

I Unit arbeider vi med å samkjøre og etablere autoritetsregistre som fellestjenester i kunnskapssektoren på en ny teknisk plattform. Autoritetsregisteret over personer/forfattere som brukes i bibliotekstjenestene våre.

I tillegg til registeret for person/forfattere arbeides det også med å etablere et register for prosjekt i regi av prosjektet Masterdatakilder for Ulike registre for emneord vil også bli etablert på den samme løsningen.

Unit har også, sammen med Nasjonalbiblioteket, fått i oppdrag å operasjonalisere målsetninger i Nasjonal bibliotekstrategi knyttet til metadata og infrastruktur for metadata. Det er Nasjonalbiblioteket som har det overordnede ansvaret for strategien.

Når man bruker metadata er det viktig at disse holdes oppdatert og at de ulike tjenestene som bruker dataene til enhver tid er oppdatert med de siste endringene. Man bør derfor unngå lokale kopier, men hente data «just in time» fra kilden istedenfor «just in case». Det er kjedelig om busselskapet endrer rutetidene, men ikke oppdaterer dette i appen. Et annet eksempel er tv-guider i aviser eller programblader som er trykket i lenge før sendetidspunktene. De er sårbare for endringer og vil risikere å ikke gi et korrekt bilde av virkeligheten.

Det er derfor nødvendig med en sterk, robust og rask infrastruktur som kan gi tilgang til data i sanntid. Det er bare fantasien som sette grenser for hvilke muligheter og nye tjenester dette kan danne grobunn for. De beste ideene er der ute. Tilgang til data er derfor et sentralt punkt.

Tilgang til data

I Unit og UH-sektoren produseres det store menge data/metadata som kan brukes i å skape andre tjenester. Det er derfor viktig at tilgangen til disse dataene åpnes opp i så stor grad som mulig. Samtidig er det noen data/dataelementer som ikke kan tilgjengeliggjøres for alle. Prosjektet Datadeling i høyere utdanning og forskning arbeider med denne problemstillingen for å lage en infrastruktur for tilgjengeliggjøring av data i sektoren, samtidig som hensynet til personvernet ivaretas.

Skrevet av Asbjørn Risan , 27. oktober, 2020

0 kommentarer

Skriv ny kommentar

Bruk av kommentarfeltet på Unit-bloggen. Vi ønsker kommentarer og spørsmål til våre bloggsaker velkommen, og setter pris på engasjement rundt det vi jobber med i Unit. Vi ønsker at du bruker fullt navn. Vi skal også svare på saklige spørsmål etter beste evne. Det er likevel noen kjøreregler. Vi tillater ikke: · Kommentarer som ikke er relevante for saken eller Units virksomhet · Ufin språkbruk, trakassering og personangrep · Spam, reklame og andre lenker til eksterne nettsteder som ikke er relevante for saken · Innlegg som bryter med norsk lov · Innhold som bryter med tredjeparts opphavsrettigheter/immaterielle rettigheter Kommentarer som bryter med våre retningslinjer, vil bli fjernet.