Koninklijke Bibliotheek – Early Dutch Books Online

Koninklijke Bibliotheek - Early Dutch Books Online

De open data set Early Dutch Books Online (EDBO) bevat  meer dan twee miljoen bladzijden uit 11.000 in Nederland gedrukte boeken uit het einde van de 18e eeuw (1781-1800).

De boeken zijn afkomstig uit de Koninklijke Bibliotheek en de bibliotheken van de universiteiten van Amsterdam en Leiden.

De KB biedt de set aan als open data: voor de metadata geldt een CC0-licentie, voor de individuele objecten (full-texts) geldt een Public Domain Mark. Voor de gehele Leidse deelcollectie (of substantiële delen ervan) geldt  dat die alleen hergebruikt mogen worden voor niet-commerciële doelen.

Overgang naar Delpher

Sinds begin 2014 is de EDBO-collectie niet langer beschikbaar via earlydutchbooksonline.nl. De website waarop dit materiaal nu doorzocht kan worden is http://boeken.delpher.nl/. Op deze site wordt de EDBO-set de “Delpher Boeken Basiscollectie” genoemd. Hier is ook meer achtergrondinformatie over het materiaal te vinden.

De Delpher Boeken Basiscollectie zal vanaf 2014 uitgebreid worden met andere boeken die niet tot de EDBO-set behoren. Zo zullen bijvoorbeeld ook de boeken uit de periode 1840-1940 er in worden opgenomen

Redirects

De KB heeft een redirectserver opgezet om oude URLs (van earlydutchbooksonline.nl) automatisch te vertalen in nieuwe (naar boeken.delpher.nl). Door deze redirects merken gewone eindgebruikers niets van de migratie en blijven bv. bookmarks en links in blogs gewoon werken.

 Ontwikkelaars, applicatiebouwers en andere API-afnemers raden we echter af gebruik te maken van de redirectserver. We raden u aan in uw software oude URL-patronen te vervangen voor nieuwe. Dit kan aanzienlijke snelheidswinst opleveren en maakt uw applicatie minder storingsgevoelig, bv. wanneer onze redirectserver down mocht gaan. De vertaling van oude naar nieuwe URLs vindt u in de technische uitleg over de set EDBO (pdf, Engels) 

 

Over de set

De dataset EDBO bevat meer dan twee miljoen gedigitaliseerde bladzijden uit het Nederlandse taalgebied uit de periode 1781-1800. De set bestaat uit 11.240 records, gebaseerd op 9.710 titels. De set bevat o.a.

De keuze van de gedigitaliseerd werken is door deskundigen bepaald door het belang van het werk. Het merendeel van de items bestaat uit afbeeldingen van tekstuele pagina’s voorzien van OCR; de OCR is nog voor verbetering vatbaar. 2.465 titels bevatten één of meerdere afbeeldingen. Een complete titellijst is te vinden via http://boeken.delpher.nl (laat zoekveld leeg en klik op de zoekknop) en via deze link

De set is gemaakt in een samenwerkingsproject tussen de  Koninklijke Bibliotheek en de bibliotheken van de Universiteit van Amsterdam en de Universiteit Leiden. Ieder van deze bibliotheken bezit ongeveer 1/3 van de gedrukte werken op basis waarvan de set gemaakt is.

Voor elk van de 11.240 boeken zijn de volgende bestanden beschikbaar:
1. beschrijvende metadata van het boek (Dublin Core in XML)
2. structurele metadata van het boek (MPEG21-DIDL)
3. het hele boek in PDF-formaat

Voor elk van de ongeveer 2 miljoen gescande pagina’s zijn de volgende bestanden beschikbaar:
4. afbeelding in hoge resolutie (JPEG 2000)
5. afbeelding in middelhoge resolutie (JPEG)
6. tekst (OCR, in XML-formaat)
7. de coördinaten van elk woord op een pagina (ALTO)

 De metadata en digitale objecten in de set beslaan zo’n 1,2 TB.

 

Voorwaarden hergebruik & bronvermelding

  1. De metadata van de EDBO-set zijn beschikbaar onder een CC0-licentie.
  2. Individuele full-text boeken en een niet-substantieel deel van deze set zijn te gebruiken onder een Public Domain Mark;
  3. Voor de gehele set gedigitaliseerde boeken of substantiële delen ervan geldt:
    • de deelcollecties (of substantiële delen) van de Universiteitsbibliotheek Amsterdam en de KB mogen zowel voor commerciële als niet-commerciële doelen gebruikt worden
    • de Leidse deelcollectie (of substantiële delen ervan) mag alleen voor niet-commerciële doelen worden hergebruikt
    • De EDBO-set als geheel mag dus voor niet-commerciële doelen herbruikt worden

Bronvermelding

Bronvermelding doe je als volgt: vermeld de naam “Early Dutch Books Online/Delpher” en de URL http://boeken.delpher.nl. Vermeld ook de naam van de bibliotheek waar het object uit afkomstig is.

  • Dit vind je op Delpher in het tabblad “Details” bij het veld “Signatuur” (voorbeeld)
  • Het is ook te vinden in het XML-metadatarecord, in het veld: <dc:identifier xsi:type=”shelfmark”> (voorbeeld)

Techniek

In de technische uitleg over de set EDBO (pdf, Engels) vind je uitleg over en voorbeelden van de

  • De redirects van earlydutchbooksonline.nl naar boeken.delpher.nl
  • beschrijvende metadata (Dublin Core),
  • structurele metadata (MPEG21-DIDL),
  • full text-objecten (PDF, OCR, ALTO, JPEG)
  • metadata-download-API op basis van OAI-PMH
  • zoek-API op basis van SRU

 

Contact & feedback

We zijn bijzonder benieuwd hoe de EDBO-data herbruikt  wordt! Alhoewel de set EDBO open cultuurdata betreft en dus vrijwel (zie exacte voorwaarden hierboven) onbeperkt hergebruikt mag worden door ontwikkelaars, instellingen, bedrijfsleven en privé-personen, zouden wij het bijzonder op prijs stellen als je laat weten wanneer je van plan bent EDBO-data te downloaden. Op die manier kunnen we je op de hoogte brengen van eventuele veranderingen en updates van onze datasets & APIs.

Stuur dus s.v.p. een korte mail naar dataservices@kb.nl  met je contactgegevens en een korte uitleg wat je met de data doet. Uiteraard wordt er door de KB zorgvuldig met de contactgegevens omgesprongen.

Feedback op onze data & API’s  is uiteraard ook zeer welkom!

Laatste update: 14-02-2014