Länkstig

Katalogisering

En viktig del av kulturarvsarbetet består av att katalogisera våra samlingar. Katalogisering handlar i grunden om att tillgängliggöra information och som katalogisatör arbetar man med att bygga den databas som utgör bibliotekskatalogen. En stor del av arbetet går ut på att lägga in metadata för att göra materialet sökbart, men också om att ur böckerna själva utvinna och tolka den information som man omtolkar till metadata. Katalogisatören är den mänskliga kopplingen mellan en bok och den databas där boken går att hitta. 

Vad är katalogisering? 

För varje bok gör katalogisatören en bibliografisk databaspost, med metadata som beskriver boken enligt en lång rad standarder och olika regelsystem som numera ofta förändras. Man anger då allt som är specifikt för den enskilda boken – ju äldre material, desto mer sådan information finns ofta att ta hänsyn till: författare, titel, upplaga, förlagsort, utgivningsår, antal sidor, illustrationer, format med mera. Samtidigt beskriver man bokens innehåll genom att ange olika ämnesord och en klassifikationskod, dels för att göra boken maskinellt sökbar, dels för att bestämma dess hylluppställning. Många andra uppgifter kan också tillkomma: om boken ingår i en serie, vad den har för målgrupp, om det finns olika länkar som kan vara relevanta för materialet och så vidare. 

Bild
Katalogisering universitetsbiblioteket
Material ur Östanåsamlingen. Musikkatalogisering är en konst som få har övning i.
Foto: Gunnar Jönsson

Särskilt vid katalogisering av äldre tryck, kräver arbetet specialkunskaper: att kunna läsa frakturstil, att ha kännedom om olika språk för att förstå vad ett verk handlar om och därmed kunna förse det med ämnesord, att kunna hitta korrekta namnformer för både personer och tryckorter, att vara förtrogen med handpresstidens metoder för tryckning och därmed kunna bedöma en boks format. Ingående kunskaper i historia (inte minst Göteborgiana och personhistoria med lokal anknytning) gör också att universitetsbibliotekets katalogisatörer har förmåga att förstå ett verks plats i dess historiska sammanhang och dess proveniens, det vill säga dess ägarhistorik, på ett sätt som tydligt kan förmedlas till bibliotekets användare. 

Arbetet kräver stor precision och uppmärksamhet vad gäller olika detaljer. Om katalogisatören misstolkar informationen eller matar in den på fel sätt, blir det också problem med att återvinna den. En databas är aldrig bättre än sin metadata. Om denna innehåller fel eller saknas helt (vilket inte sällan är fallet då poster importeras från kataloger som upprättats efter annan standard) blir sökmöjligheterna och träffresultaten därefter. 

Arbetar man med tryckt material brukar man prata om katalogisering. Den som istället arbetar med arkivmaterial, ägnar sig åt registrering och förteckning

Vi gör jobbet med transkribering och tolkning, för att materialet ska bli sökbart för alla.

Katalogisatörens ekosystem

I Sverige ansvarar Kungliga Biblioteket för det nationella samarbetsprojektet LIBRIS. Omkring 500 bibliotek deltar i samarbetet, som tillhandahåller information om titlar på svenska bibliotek. LIBRIS är de svenska bibliotekens gemensamma katalog och uppdateras dagligen. De registrerande biblioteken bidrar gemensamt till uppbyggnaden av innehållet i databasen. För närvarande innehåller den omkring 7 miljoner titlar i form av bibliografiska poster. Dem kan alla bibliotek använda gemensamt, genom att ange att de har ett eller flera exemplar av boken i sina samlingar. Det kräver att ett enskilt bibliotek först har beskrivit boken.

Varje bibliotek har dessutom en lokal katalog, som oftast består av de poster som beskriver bibliotekets eget bestånd. Den lokala katalogen byggs upp genom att bibliografisk information hämtas från LIBRIS. 

Katalogisering
Finns materialet redan i katalogen? Har man tur, har ett annat bibliotek hunnit beskriva materialet. Ju fler unika titlar, desto mer arbete!
Foto: Gunnar Jönsson

”Men finns det inte på nätet?”


Stora delar av bibliotekens material kan saknas i LIBRIS eller i digitala kataloger överhuvudtaget. Det gäller framför allt sådant som förvärvats långt innan bibliotekskatalogerna blev digitala och som man ännu inte har haft möjlighet att katalogisera retroaktivt. Många av Göteborgs universitetsbiblioteks samlingar är betydligt äldre än de digitala katalogerna och det sätt på vilket samlingarna katalogiserats varierar också mycket. 

En typ av äldre bibliotekskatalog som många säkert är bekanta med, är kortkatalogen, den så kallade Katalog -57. Där beskrivs varje bok på ett registerkort som förvaras i ett kartotek. Sådana brukar finnas i två versioner, en alfabetiskt sorterad och en som är systematiskt ordnad efter ämnesområde. Kortkataloger kan scannas in och göras tillgängliga online, även om de inte kan tas upp i den ordinarie bibliotekskatalogen. Är korten skrivna på maskin, kan det vara möjligt att OCR:a dem så att de blir sökbara i fritext. Hur informationen presenteras på korten och vad dess placering på pappersytan säger om vilken typ av metadata det är fråga om, måste en mänsklig katalogisatör avgöra. Vissa kort är skrivna för hand, vilket försvårar maskinläsning ytterligare. Universitetsbibliotekets Katalog -57 är ett exempel på en mycket omfattande kortkatalog, vars innehåll ännu inte - i sin helhet - har lagts in i LIBRIS. Samtidigt är en stor del av bibliotekets material endast sökbart via Katalog -57, som är inskannad. För den som letar äldre material är detta värdefullt att känna till. 

En del samlingar har inte heller kortkataloger, men kan istället finnas beskrivna i tryckta eller mer eller mindre läsligt handskrivna kataloger, exempelvis i form av alfabetiskt eller kronologiskt ordnade listor. En sådan katalog kan skannas och tillgängliggöras digitalt, vanligen i form av en PDF. 

Vissa samlingar saknar helt och hållet katalog och ibland finns bara en kortare översiktlig uppgift om vad samlingen innehåller. Det krävs ett omfattande detektivarbete för att få grepp om vad en samling faktiskt innehåller och emellanåt kan man bli överraskad då en närmare granskning i samband med katalogisering ger en helt ny bild av vad man har framför sig. 

Katalogisatörer arbetar kontinuerligt med att utöka och förbättra bibliotekskatalogen och se till att den speglar bibliotekets bestånd. I dagsläget behöver man fortfarande handskas med en stor mängd olika kataloger, varav ett urval är tillgängliga online, för att bilda sig en uppfattning om vilka böcker som faktiskt finns i samlingarna. 

Hur lång tid tar det?

Alla som planerat en verksamhet och behövt kartlägga olika processer brukar behöva uppgifter om hur lång tid saker och ting tar. Men hur lång tid det tar att katalogisera en bok? Frustrerande nog varierar svaret oerhört mycket beroende på boken: det kan ta 5 minuter, eller 3 timmar, eller ibland en hel arbetsdag. Arbetets detaljerade natur, dess krav på problemlösning och vikten av korrekt metadata, gör katalogisering till en mycket långsam sport. Snabba lösningar ger inte alltid önskat resultat och kan i sin tur kräva efterarbete som tar ännu mera tid. 

Värt att notera i sammanhanget är att om man vill göra digitaliserade böcker sökbara och tillgängliga, måste originalboken vara katalogiserad. En underliggande utmaning för många digitaliseringsprojekt! 

Katalogisatörens utmaningar

Äldre tryck

Äldre tryck är något som ganska ofta beställs för digitalisering. Med äldre tryck avses böcker och broschyrer som är tryckta under handpresstiden. Grovt räknat brukar det handla om material som är tryckt i Europa mellan 1450-1830. I Kina trycktes böcker redan under 400-talet och med lösa typer från och med 1000-talet. 

Vid katalogisering av äldre tryck skriver man i princip av alla uppgifter i boken precis som de står – bindestreck, särskrivningar och även tryckfel om sådana finns. Detta för att man lätt ska kunna skilja olika tryckningar åt, bara genom att granska titelbladets text. 

Fraktur
Frakturstil kan upplevas som mer svårläst än antikva.
Foto: Gunnar Jönsson

Tryckstilar

Frakturstil eller gotisk stil var den gängse tryckstilen i den germanska delen av Europa fram till 1700-talet då den successivt ersattes av antikva. Det finns många varianter av frakturstil – mer eller mindre svårläsliga. Antikva (roman type på engelska) användes länge parallellt med fraktur i den romanska världen. 

Språk

Att kunna förstå och tolka olika språk är ett måste för den som katalogiserar specialsamlingar – gärna döda språk, dessutom. Även äldre svenska kan vara nog så utmanade. Man måste inte kunna det givna språket flytande, men man behöver ha en grundläggande förståelse för dess grammatik och syntax, samt vanliga uttryck i sammanhanget. Äldre material är ofta tvärvetenskapligt. Samma bok kan handla om medicin, litteratur, astronomi och magi. Var man lärd, så var man! Oavsett innehållet måste man förstå bokens innehåll för att kunna förse den med ämnesord och klassifikationskod. 

Större delen av det äldre trycket i universitetsbibliotekets samlingar är på latin. Latin utgjorde västvärldens lingua franca under många århundraden. Utöver latinet är tyska, franska, grekiska och holländska flitigt representerade. Engelska var i äldre tid inte särskilt vanligt förekommande i vår del av världen och det finns inte heller särskilt många vetenskapliga böcker skrivna på svenska före 1700-talet, men från denna tid finns däremot en mängd skillingtryck på svenska och även religiös litteratur. 

Translitterering

Ibland räcker det inte att man förstår vad det står. Man kan också behöva kunna translitterera bland annat grekiska med latinska bokstäver, så att titeln blir sökbar i bibliotekskatalogen. Translitterering innebär omskrivning av ett skriftsystem till ett annat. Ett främmande tecken kan motsvaras av ett eller flera i ett känt alfabet. 

Translitterering görs efter en angiven standard. När det gäller grekiska finns också en skillnad i hur man translittererar beroende på materialets ålder: för böcker tryckta från och med omkring år 1450 arbetar man i enlighet med regelverket för nygrekiska.

Vad gäller rysk kyrillisk skrift har folkbiblioteken och universitetsbiblioteken i Sverige inte kunnat enas om en standard och använder därför olika translittereringsstandarder. Detta medför förstås problem vid sökning i katalogerna. Hur ska man stava för att få träff? Andra länder har i sin tur egna standarder, vilket skapar utmaningar om man importerar en katalogpost från något utländskt bibliotek. 

Namnformer – personnamn och ortnamn

Namnformer, det vill säga olika återgivning av personnamn och ortnamn, är något komplext och spännande. De flesta moderna språk har genomgått någon eller några stavningsreformer och före dessa kunde det mesta stavas lite hur som helst. I fråga om personnamn gäller detta även efter reformerna. Bruket att latinisera namn var dessutom mera regel än undantag så länge latinet var det gängse internationella språket i vetenskapliga sammanhang.  

Theognidos heter just så på grekiska. På latin skrivs namnet däremot i genitiv, Theognidis och i Nationalencyklopedin heter han Theognis – en grekisk diktare som levde under (ca) 500-talet BCE. 

LIBRIS katalogregler säger att man ska använda den namnform som överensstämmer med språket i det land personen kommer ifrån. Exakt vad det innebär är inte sällan föremål för olika tolkningar. Dock ges Nationalencyklopedin prioritet över gällande katalogiseringsregler. 

Boken är tryckt på orten Ultrajecti, vilket betyder ”kastat allra längst bortanför civilisationen” och är en latiniserad form av nederländska Utrecht, marginellt mer centralt beläget idag. Tryckorter i äldre material har generellt latiniserade namn: Lugdunum Batavorum (holländska Leiden), bara Lugdunum (Lyon i Frankrike), Agrippina (Köln), Lutecia (Paris) och de svenska Lincopia (Linköping), Holmiae (Stockholm), Gevalia (Gävle), Junecopia (Jönköping) och Wexionia (Växjö), för att inte tala om påhittade orter som Canabacum eller Tripoli (inte staden i Libyen) som figurerar som tryckorter för verk som innehöll politisk eller religiös kritik, där det kunde vara riskabelt att vara inblandad.

Marginalia

Folk har alltid skrivit och gjort egna anteckningar i sina böcker. Mest brukar man träffa på namnteckningar, som kan ge värdefull information om böckernas proveniens, men ibland förekommer också kommentarer i marginalerna eller små meddelanden. 

För katalogisatören gäller generellt att handskrivna anteckningar ska kunna läsas för att man ska ta upp dem i en katalogpost. Ägarskap och annat som gäller för en enskild bok tas upp i den lokala delen av en post, eftersom det gäller ett specifikt exemplar. Sådan information kan vara mycket intressant för en forskare. Ibland är handskrivna noteringar oläsliga och då anger man istället det i posten. 

Format

I äldre tryck anger bokformatet hur många gånger arken i inlagan har vikts. Primo är termen för det ark som man tar ur papperspressen. Pressen skapar vattenlinjer i pappret, vilket man har nytta av då man bedömer formatet man har framför sig. Folio, som också betyder vika, anger att arket vikts en gång. Quarto innebär två vikningar, vilka resulterat i fyra sidor. Octavo är tre vikningar – åtta sidor. Duodecimo är fyra vikningar, vilket ger sexton sidor per ark. Formatet blir successivt mindre. Dessutom tillkommer ytterligare hel- och halvformat. Variationen är stor. 

När man ska ange en boks format, börjar man med att räkna antalet sidor i en svit, det vill säga antalet vikta ark, som ofta är häftade (ihopsydda) var för sig och därmed lätt urskiljbara. Sviterna skiljs åt med så kallade arksignaturer (som ofta utgörs av alfabetets bokstäver). Ibland saknas arksignaturer och då kan man istället ta hjälp av linjerna i pappret och av bokens storlek. Sammansättningen av sviter är viktig för identifikation av olika exemplar och tryckningar. 

Paginering

Paginering kan vara hur enkel som helst – har man tur heter första sidan nr 1 och den sista exempelvis 250 och då kan man helt enkelt uppge att boken har 250 sidor, om sviterna är löpande. Men paginering kan ibland vara ojämn, saknas helt eller delvis, eller vara felaktigt gjord. Det kan också finnas luckor i pagineringen eller andra avvikelser och allt detta måste anges vid katalogisering. Det förekommer emellanåt att varje svit i en bok har separat paginering. Planscher, insatsblad och utviksblad avviker ofta från den generella pagineringen i en bok. 

Proveniens

Utöver skrivna anteckningar som anger hur boken förvärvats, ägts och skänkts, kan man också stöta på ett eller flera exlibris. Allt anges i bokens post. 

Kortkatalog
Bibliotekskatalogerna har haft många ansikten under historien. Högst mysfaktor har kanske den klassiska kortkatalogen.

Text: Kristina Sevo och Anna Lindemark