Konvertering/migrering av data
I forbindelse med overgangen til nytt biblioteksystem for bibliotekene i UH-sektoren skal den eksisterende bibliotekbasen konverteres og migreres over til det nye systemet. Dette er en prosess som BIBSYS er godt i gang med, men vi vil ha behov for å få bistand og avklaringer fra bibliotekene på hvordan vi skal håndtere ulike typer metadata. På denne siden vil vi samle de spørsmål og avklaringer som vi har sendt ut, og samtidig gi tilgang til hjelpemidler, lister og lignende
Med utgangspunkt i de tilbakemeldingene vi får, vil vi vurdere hvordan vi skal behandle dataene og om alt skal migreres, eller om noe skal høstes fra f.eks institusjonelle arkiv, evt andre løsninger.
Ulike rettelser i forbindelse med datamigrering 25/4 2012
008 $a/$b
En del poster mangler 008 $a og/eller $b. Disse må rettes før de kan importeres i WorldCat. Uten gyldige verdier her, blir de ikke med inn i WorldCat i det hele tatt, da dette er en såkalt 'Blocker error'. Her finner dere liste over objektid fordelt på bibliotek.
En del av postene her har verdien 0 i $a og/eller $b. Disse er lovlige verdier i BIBSYS, men ganske mange av dem finnes på poster hvor det finnes spesifikke koder for materialtypen. I noen tilfeller har poster blitt kopiert fra LC-brønn hvor '0' blir lagt inn automatisk av programmet. Disse må også rettes. Verdien '0' får vi ikke konvertert til MARC 21 og følgelig blir heller ikke posten importert til WorldCat. Vi må derfor ha melding om alle slike som dere ikke finner kode for i BIBSYS. Det finnes eksempler på registrering av 'tredimensjonale gjenstander' som nøkler og skjøteledninger. Disse skal ha kode 'y'. Det er unødvendig å gi disse koden '0'. I 008 $b kodes disse som monografier og skal ha verdien 'v'.
Feil kombinasjon av verdier: 008 $a p og $b n
Nedenfor følger en liste over poster som har 008 $a p (trykt materiale) og $b n (innspilt musikk). Dette skal vel være bortimot fysisk umulig og bør rettes opp. Vi kan ikke garantere for hvordan feilkodede poster vil fungere i nytt system.
Multiple 1XX
Poster med flere 1XX vil bli importert inn i WorldCat, men vil bli liggende med feil der også. Det blir vanskeligere å finne dem for å rette etter at nytt system er tatt i bruk, og det vil være en fordel at disse postene er rettet i dagens system.
Poster uten 245 $a, men som har 491 $a
Poster som mangler 245 $a er en såkalt 'blocker error' og vil ikke bli importert til OCLC uten at de er rettet. Det gjøres ikke forskjell på ukatalogiserte og katalogiserte poster. (Unntaket her er flerbindsverk i Bibliotekbasen. Her har vi laget konverteringsprogrammer som kopierer inn manglende informasjon slik at bindpostene gir en (mer eller mindre) selvstendig bindbeskrivelse i henhold til katalogiseringsregler og bruk av MARC 21. Flerbindsverk som er katalogisert i henhold til BIBSYS-praksis skal derfor ikke revideres.)
Poster som mangler 245 $a, men som har 491 $a kan være feillenket. 491 med delfelt $a brukes på monografiserier. Hvis man her har å gjøre med et flerbindsverk, må 491 rettes. Hvis det ikke er et flerbindsverk, men en monografiserie, må posten rettes for å gi en fullstendig beskrivelse som hefte i monografiserie.
Poster uten 245 $a som ikke er lenkeposter
Poster uten 245 $a gir 'blocker error' hos OCLC og vil ikke bli importert til OCLC med mindre de blir rettet. Postene i vedlagte fil må rettes. (Hvis det dreier seg om flerbindsverk, trenger vi ikke 245, men da må det finnes en 491 uten $a for at posten skal bli riktig konvertert. De fleste i denne lista er antakelig ikke flerbindsverk.)
Mikroformer
I BIBSYS har vi en generell koding av mikroformer (008 $a a), dvs. vi spesifiserer ikke hvilken type mikroform det er. Men OCLC krever at 008/23, evt. 008/29 og 007/01 finnes. De vil derfor prøve å legge disse på ut fra hvilke termer de finner i 300. De vil sjekke om en av disse finnes i poster som er kodet som mikroform: mikrofilm, mikrofilmkassetter (eller bare 'kassetter'), mikrofilmspoler (eller bare 'spoler'), mikrofilmkort, mikro-opak, mikrofiche. Poster med disse opplysningene trenger ikke rettes. Lista nedenfor inneholder poster med feilstavede eller ulovlige betegnelser i 300, eller manglende 300. Alle poster som er kodet som mikroform og som har feil eller manglende opplysning i 300, finnes i lista nedenfor. Feilstavinger må også rettes. ('Mikrofiche' er jo ikke tillatt i henhold til katalogiseringsreglene, så ikke bruk den når dere retter postene. Der hvor den finnes fra før kan den godt ligge, men feilstavinger må rettes her også.)
Filmruller (008 $a h) 14/12 2011
En ganske betydelig andel av poster som er kodet med 008 $a h ser ut til å være feilkodinger. Mange av disse skulle vært kodet som enten 'mikroform' (008 $a a), 'magnetbånd' (008 a u) eller annet.
Koden 'h' (filmruller) er ment brukt til filmer ('levende bilder') av den typen man brukte før videoteknikken kom. Det er nok ikke så mange av disse i bibliotekbasen, og det er neppe særlig med ny tilvekst.
Her er en liste over de postene som har fått 008 $a h. De som vil kan benytte denne til å rette feilkodingene.
Språkkoder 29/11 2011
I det nye biblioteksystemet må alle poster ha språkkode. Dessverre er det ganske mange poster som mangler språkkode i dagens system. BIBSYS vil kjøre maskinelle rettinger og sørge for at alle disse postene får språkkode før eksporten til WorldCat. I de fleste tilfellene vil dette dreie seg om en default-verdi som vil bli avtalt med OCLC, sannsynligvis språkkoden 'und' (undetermined) eller ev. 'zxx' (no linguistic content) der det er mulig å skille ut ikke-språklig materiale.
For å gi bibliotekene sjansen til å legge på korrekte språkkoder i den grad og i det volum det vurderes som viktig, har vi derfor lagt ut lister over poster som mangler språkkode. Det vil selvsagt være urealistisk å vente at alle postene kan behandles manuelt, så her gjelder det å finne en fornuftig og realistisk angrepsmåte. Det vil være mulig å behandle postene manuelt også etter at BIBSYS har behandlet postene maskinellt.
Vi vil presisere at manuell rydding ut fra disse listene skal oppfattes som en mulighet, ikke som en plikt.
Grunnen til manglene kan være flere. En del er eldre ting fra en tid da det ikke ble lagt like stor vekt på dette i BIBSYS. En annen stor gruppe kan være instrumentalmusikk som vi ikke har hatt noen språkkode for i BIBSYS tidligere. Disse skal nå ha språkkode 'zxx'.
Nå vet ikke vi i BIBSYS akkurat hvilke musikkposter som er 'instrumental' og hvilke som ikke er det. Men hvis dere vil, er det mulig for oss å legge på språkkode 'zxx' maskinellt på alle musikkposter som ikke allerede har en språkkode. Da er det jo naturligvis en viss risiko for at noen musikkposter som skulle hatt en regulær språkkode blir feilkodet. Gi oss gjerne synspunkter på dette.
Hvis dere ser andre mønstre her, og ser muligheter for maskinell innlegging av språkkode, må dere gjerne gi oss et tips.
Samleside med lenke til lister fordelt på bibliotekets kortform finner dere her
Lokale emnedata 18/11 2011
I BIBSYS-samarbeidet har vi praktisert stor grad av lokale emneord og lokal bruk av etablerte emneordssystemer. Det nye biblioteksystemet vi skal konvertere til, har ikke en slik tradisjon. Her er felles registrering det vanlige. Vi trenger derfor noen innspill fra bibliotekene før valg av konverteringsprosedyre bestemmes.
BIBSYS ber kontaktpersonene for nytt biblioteksystem om å sørge for tilbakemelding på det dokumentet som er lenket opp under. Vi vil ha ett svar pr bibliotek. Oppgi navnet ditt og hvilket bibliotek du svarer på vegne av. Ta også med bibkoden. Dere må gjerne sende oss spørsmål hvis dere lurer på noe, eller noe er uklart.
Svarfrist: 21. desember 2011.
Se dette dokumentet for mer informasjon om konverteringen av lokale data
Elektroniske gratisressurser 27/10 2011
Før migrasjon av data til OCLC kreves en kartlegging av gratis nettressurser som er registrert i bibliotekbasen, og som er utgitt av bibliotekenes egne institusjoner.
Dette kan være dokumenter registrert med utgangspunkt i institusjonelt arkiv, digitaliseringer av trykte dokumenter utgitt av egen institusjon, og andre nettdokumenter utgitt av egen institusjon. OCLC ønsker at dokumentene skal kunne identifiseres som en del av en samling. Vi har i dag for manglefulle opplysninger i bibliotekbasen til å kunne knytte dokumentene til institusjon og til samling.




