Techniek

Het digitaliseren van oude drukken

Materiaal uit de Bijzondere Collecties wordt niet uitgeleend. In studiezalen en onder toezicht kunnen de werken worden ingezien. Door digitalisering wordt het materiaal eenvoudig toegankelijk voor onderzoekers en andere gebruikers. Vanwege de kwetsbaarheid kan het materiaal niet zonder meer onder een scanner of kopieerapparaat gelegd worden.

Ten behoeve van de digitalisering wordt eerst een materiaalvoorbewerking uitgevoerd. De boeken worden van tevoren stuk voor stuk beoordeeld op hun fysieke staat. Van elk boek wordt bepaald of de fysieke conditie voldoende is en of het boek geschikt is voor scanning en Optical Character Recognition(OCR). Met OCR wordt van de gescande pagina automatisch een tekstbestand gemaakt. Hiervoor moeten de karakters op de pagina goed herkend worden door de scanapparatuur.

Boeken die te kwetsbaar zijn, niet goed open kunnen of waarvan bijvoorbeeld de OCR geen goed resultaat zal opleveren, zijn uit de selectie verwijderd. Daarnaast is tijdens de materiaalvoorbewerking bekeken of er uitklapbare kaarten en prenten in de boeken zitten. Deze boeken zijn apart gedigitaliseerd.

Scanapparatuur

Bij het scannen van boeken uit de Bijzondere Collecties is het vaak niet mogelijk boeken plat open te leggen. Het scannen gebeurt daarom met behulp van een speciale 'boekenwieg'. Dit apparaat voorkomt dat de band - in het bijzonder de rug - te zwaar wordt belast of zelfs beschadigd.

De formaten van de gedigitaliseerde werken variëren van kleine almanakken tot grote prentenboeken. De boeken zijn op basis van formaat aan het digitaliseringsbedrijf aangeboden, zodat de scaninstellingen zoveel mogelijk hetzelfde blijven en de workflow door kan gaan.

Ontsluiting en beschikbaarstelling

De gedigitaliseerde werken zijn op verschillende manieren ontsloten, door:

  • het toevoegen van de beschrijvingen uit de STCN waardoor ruime zoekmogelijkheden geboden worden;
  • het toevoegen van structurele metadata zodat in de gedigitaliseerde werken gebladerd kan worden;
  • optische tekenherkenning (OCR) zodat gezocht kan worden op woorden in de tekst;
  • het toevoegen van woordcoördinaten zodat zoektermen opgelicht kunnen worden in de afbeelding van de betreffende pagina's.