Masterdata og autoriteter

Skrevet av Asbjørn Risan , 10. oktober, 2020
En viktig variant av metadata er masterdata, også kalt autoriteter.

Et autoritetsregister er et register over foretrukket skriveform og varianter for det man ønsker å beskrive. Vanlige autoritetstyper er personnavn, organisasjonsnavn, emneord og tid/sted. I et autoritetsregister vil hver innførsel få en unik identifikator som det knyttes ulike opplysninger til. I det følgende brukes autoritetsregister som et uttrykk for masterdatakilder.

Hensikten med et autoritetsregister er å sikre konsekvent registrering, unngå skrivefeil og sikre søkeinnganger på typiske varianter i skrivemåte. Eksempelvis er den foretrukne navneformen for den russiske forfatteren Čajkovskij, Pëtr Il'ič skrevet på denne måten, men i autoritetsregisteret er det også registrert 35 ulike navnevarianter/alternative former. Henrik Ibsen har 24 registrerte navneformer, Jo Nesbø har 15.

Et annet eksempel er foretrukken form og synonymer. Termen “Svin” er foretrukken form, mens “Griser” er registrert som et synonym/ikke foretrukken form.

Når en bibliografisk post er autorisert kan søkesystemene utnytte dette og bistå brukeren ved øke fullstendigheten på søket når brukerne søker på en av de ikke foretrukne formene. 

I Oria, som er søkesystemet for norske fag- og forskningsbibliotek, er alle navnevariantene til forfattere og synonymer søkbare. Det vil si at hvis brukeren søker på “Tsjajkovski, Pjotr“ så vil autoriserte poster med Čajkovskij, Pëtr Il'ič bli gjenfunnet fordi “Tsjajkovski, Pjotr“ er registrert som en navnevariant.

Et autoritetsregister brukes også til å samle alle ressurser som er knyttet til en autoritet, samt skille mellom ellers likelydende innførsler. Eksempler på dette er forfattere med samme navn (det finnes tre artikler på «Jonas Lie» i Norsk bibliografisk leksikon) eller homonym (likelydende ord, men med forskjellig betydning). Emneordet “Java” kan hvis det kun er en tekststreng henvise til programmeringsspråket, kaffetypen eller øya “Java”. Hvis emneordet er autorisert vil man kunne skille mellom disse og man kan enkelt finne alle postene som omhandler kaffetypen Java. I eksempelet Lie vil man kunne skille mellom forfatteren, maleren og NS-politikeren Jonas Lie.

Autoriteter er også viktige koblingspunkter for å kunne koble data fra ulike datasett sammen.

Skrevet av Asbjørn Risan , 10. oktober, 2020

0 kommentarer

Skriv ny kommentar

Bruk av kommentarfeltet på Unit-bloggen. Vi ønsker kommentarer og spørsmål til våre bloggsaker velkommen, og setter pris på engasjement rundt det vi jobber med i Unit. Vi ønsker at du bruker fullt navn. Vi skal også svare på saklige spørsmål etter beste evne. Det er likevel noen kjøreregler. Vi tillater ikke: · Kommentarer som ikke er relevante for saken eller Units virksomhet · Ufin språkbruk, trakassering og personangrep · Spam, reklame og andre lenker til eksterne nettsteder som ikke er relevante for saken · Innlegg som bryter med norsk lov · Innhold som bryter med tredjeparts opphavsrettigheter/immaterielle rettigheter Kommentarer som bryter med våre retningslinjer, vil bli fjernet.