Selectieproces

Trefwoorden

Aan de selectiecriteria voldoen ongeveer 12.000 van de circa 17.000 titels in de STCN. Na overleg met de verschillende betrokken partijen en uit de reacties op een enquêteformulier dat onder wetenschappers is verspreid, bleek dat er behoefte is aan een inhoudelijke invalshoek. Een willekeurige selectie wordt als weinig zinvol ervaren, omdat op deze manier collecties slechts gedeeltelijk gedigitaliseerd zullen worden en dus minder bruikbaar zullen zijn voor onderzoek. Gezien de omvang van het project is het niet mogelijk om de duizenden titels handmatig te selecteren op basis van onderzoeksvragen. Om deze redenen is gebruikt gemaakt van de onderwerpstrefwoorden in STCN. Elke titel in deze database is voorzien van een of meer trefwoorden. Door op basis hiervan boeken te selecteren, kunnen duidelijk omschreven onderwerpen worden gedigitaliseerd.

Wetenschappelijke Adviesraad

De onderwerpstrefwoorden zijn voorgelegd aan een Wetenschappelijke Adviesraad. Uitgaande van de veronderstelling dat een boek gemiddeld 250 pagina's bevat, hebben zij de opdracht gekregen om tot 7500 werken te selecteren op basis van trefwoorden. Om de keuze te vereenvoudigen heeft de adviesraad de trefwoorden ondergebracht in de volgende thematische clusters: History & Politics, Economy & Trade, Science & Ideas, Religion & Society, Daily Life & Education. Deze clusters leveren samen in eerste instantie 4687 titels op, waaronder ook diverse tijdschriften en andere periodieken.

Uitbreiding Selectie

Omdat tijdens de materiaalvoorbereiding is gebleken dat een boek gemiddeld geen 250, maar 130 pagina's bevat, is de selectie uitgebreid. Het gehele cluster Visual Arts is toegevoegd en uit het cluster Literature & Drama de trefwoorden Drama, Dramaturgy and Musicology, Dialogues en Genre parodies. Het totaal aantal pagina's komt hiermee in eerste instantie boven de 1,3 miljoen. De selectie is daarna nog verder uitgebreid omdat het budget nog niet was uitgeput. De extra selectie is gemaakt uit eerder afgewezen werken. Er kunnen nog 800.000 extra pagina's toegevoegd worden, waardoor het totale aantal gedigitaliseerde pagina's nu boven twee miljoen uitkomt.