Nasjonalt autoritetsregister for verk

Muligheten til å få oversikt over alle variasjoner av et verk har lenge vært et savn. Tradisjonell metadatapraksis fokuserer på den enkelte manifestasjon (utgave, oversettelse) av et verk, og vi har i dag ingen sikker metode for å knytte sammen slike i etterkant for å kunne identifisere de varianter/utgaver som representerer ett og samme verk.

Første forsøk

Allerede i 2016 gikk Nasjonalbiblioteket i gang med å etablere et register over verk der hvert verk skulle tilordnes en global identifikator og  beskrives med tittel, skaper(e) og andre metadata. Arbeidet ble utført i samarbeid med UNIT, som sto for den tekniske utviklingen. 

Etter hvert ble det imidlertid klart at prosjektet ikke ville føre oss dit vi ønsket, – samarbeidet med UNIT om Verksregisteret ble derfor terminert i juli 2018. Resultatet vi satt igjen med var en base verksentiteter som lenkede data, automatisk generert fra en delmengde av Nasjonalbibliotekets katalog i Alma. I tillegg var også levert et rudimentært redigeringsverktøy for verkene. Samtidig ble det inngått avtale med UNIT om å drifte løsningen på ubestemt tid uten videreutvikling, slik at vi kunne utføre nødvendig oppretting i registeret. Per februar 2020 er status at det finnes ca. 10000 manuelt kuraterte verk i registeret. I tillegg regner vi med at en viss andel av de ikke kuraterte også har tilstrekkelig kvalitet.

Status februar 2020: Verksregisteret i internasjonal kontekst

Arbeidet med Verksregisteret er nå inne i en ny fase, ved at det foregår innenfor rammen av et internasjonalt, bibliotekdrevet samarbeidsprosjekt, SHARE-VDE (Virtual Discovery Environment), som Nasjonalbiblioteket meldte seg inn i mai 2019. 

Mange aktører er involvert: En italiensk metadataleverandør, Casalini Libri, koordinerer prosjektet, mens den tekniske utviklingen i hovedsak utføres av @CULT, et programvarefirma som blant annet har spesialisert seg på søketjenester for kulturarvssektoren basert på semantisk teknologi. Det danske firmaet Samhæng APS er innleid for utvikling av interaksjonsdesign. De deltakende bibliotekene omfatter 8 amerikanske universitetsbibliotek og 2 europeiske nasjonalbibliotek (nasjonalbibliotekene i Finland og Norge, henholdsvis). I tillegg er det 13 amerikanske bibliotek som leverer data, men som ikke deltar i utviklingen av prosjektet.  

Data prosesseres og skapes – men hvilke verk kommer ut?

SHARE-VDE har som mål å skape lenkede data ut fra 

  • bibliografiske data i MARC21 fra de deltakende bibliotekene
  • autoritetsdata, både fra bibliotekene og eksterne kilder som VIAF og ISNI

Dette gjøres i en automatisert prosess der MARC-postene matches mot tilgjengelige autoritetsdata, og berikes med informasjon fra disse. Konverteringen til lenkede data skjer hovedsakelig i henhold til BIBFRAME, men også andre elementer kan taes med. Det bibeholdes full sporbarhet til eierbibliotek, slik at hvert medlemsbibliotek kan hente ut BIBFRAME-data av sine MARC-poster, samt motta berikede MARC-poster som en egen leveranse.

Gjennom konverteringen til lenkede data blir det altså generert BIBFRAME-entiteter, deriblant verk. I utgangspunktet er dette verk i BIBFRAMEs betydning, som i praksis er mye nærmere Uttrykk enn Verk slik RDA (og LRM) definerer begrepene. Dette er ikke i samsvar med Nasjonalbibliotekets ønsker, og det vurderes nå å etablere en SHARE-VDE-spesifikk utvidelse av  BIBFRAME, som gjør det mulig å skille mellom verk og uttrykk (i RDA-forstand). Avgjørelse om dette vil bli tatt om kort tid. 

Nasjonalbibliotekets data

I skrivende stund (februar 2020) er situasjonen at kun et lite testsett av Nasjonalbibliotekets data er prosessert. Resultatet ser ikke håpløst ut, men kan ikke bedømmes skikkelig før oppdatert datamodell og justerte algoritmer blir implementert. Dette forventes i løpet av de nærmeste månedene.

Infrastruktur bygges

Det utvikles en felles søkeportal share-vde.org hvor data fra alle bibliotek som har levert data vises. Eksempel fra eksisterende portal: Synnøve Solbakken av Bjørnstjerne Bjørnson. Nytt brukergrensesnitt er under utvikling.

Et annet viktig verktøy for oss er redigeringsverktøy for BIBFRAME-data, som foreløpig er på spesifikasjonsstadiet under navnet J.Cricket. 

Muligheter og utfordringer

Å utvikle verksregisteret innenfor et stort og komplekst samarbeidsprosjekt, er en helt annen måte å tilnærme seg arbeidet på enn å utføre arbeidet i en bestiller-leverandørmodell. Det gir nye muligheter, men også en del utfordringer. 

Mulighetene ligger først og fremst i at man som deltaker nyter godt av hele konsortiets kompetanse og kapasitet. I dette tilfellet får vi også data som ikke direkte angår Verksregisteret, men som likevel kan være nyttige. For selv om Nasjonalbibliotekets motivasjon for å delta i SHARE-VDE var å finne løsning på Verksregisteret, oppnår vi samtidig å få lenkede data ut av hele de bibliografiske postene, ikke bare verksentiteter. I tillegg får vi berikede MARC-poster, som i sin tur kan brukes til å utfylle våre autoritetsregistere (særlig Nasjonalt autoritetsregister for personer og korporasjoner), for eksempel med ISNI-numre.

På den annen side, det faktum at man som 1 av 10 deltakere har liten kontroll over planer og prioriteringer til prosjektet som helhet, kan representere store utfordringer. For å få gjennomslag for sitt syn i viktige avgjørelser, må man jobbe gjennom ansvarlig  arbeidsgruppe og prøve å oppnå støtte der. Et eksempel på dette er datamodellen, der vårt behov for et RDA-aktig verksbegrep ikke deles eller prioriteres av alle. 

Åpne spørsmål 

Et viktig spørsmål er hvordan Nasjonalbiblioteket kan innføre resultatet av prosjektet på en måte som sikrer en god autoritetstjeneste for verk  til bibliotekene og andre brukere i Norge. Eksempelvis, skal vi satse på å forvalte våre data direkte i den felles SHARE-VDE infrastrukturen, eller skal vi ta dataene hjem og bygge opp lignende infrastruktur her?

Svarene på dette vil blant annet avhenge av tilgangsregimene til og ytelsen i den felles infrastrukturen og lisensiering av programvaren som utvikles i prosjektet.