Archive for the ‘Datablog’ Category

Datablog: Koninklijke Bibliotheek – Watermarks in Incunabula printed in the Low Countries

WM I 02410 unicorn, horizontal, to right

 

Logo van de Koninklijke Bibliotheek

 

 

 

 

De Koninklijke Bibliotheek biedt met de dataset Watermarks in Incunabula printed in the Low Countries (WILC) toegang tot  ruim 16.000 watermerken uit boeken die gedrukt zijn tussen 1450 en 1501 (zgn. incunabelen) in de Lage Landen, het huidige Nederland en België.

De watermerken zijn afkomstig uit 14.300 exemplaren van de 2.229 incunabel-edities die wereldwijd bewaard zijn gebleven (sommige zijn in meer dan één exemplaar overgeleverd). Er komen watermerken in voor uit boeken die zich nu verspreid over de hele wereld bevinden in bibliotheken, archieven en musea.

De KB doet dit als open (cultuur)data: voor de metadata geldt een CC0-licentie, voor de individuele objecten (afbeeldingen van watermerken) geldt ook een CC0-licentie.

De website waarop dit materiaal doorzocht kan worden is http://watermark.kb.nl.  Hier is ook meer hulp en achtergrondinformatie over het materiaal te vinden.

Over de set

Watermerken zijn bij de fabricage aangebracht in het papier waarop later de boeken gedrukt werden. Papier werd handmatig geschept met een zeef waarop een watermerk aangebracht werd als een soort fabriekslogo. Op de plaats van het watermerk en de lijnen van de zeef is het papier iets dunner. Aan de hand van de watermerken kan men vaststellen waar en wanneer het papier geproduceerd is omdat iedere regio en/of papiermolen zijn eigen voorstellingen gebruikte en de watermerken steeds veranderden. Sommige watermerken komen erg vaak voor. Daarom zijn veel details toegevoegd zodat met secundaire kenmerken (bijvoorbeeld kettinglijnen, density) een onderscheid te maken is tussen watermerken die sterk op elkaar lijken.

Watermerken worden zichtbaar door het papier tegen het licht te houden. Er kan een afbeelding van gemaakt worden door het reliëf dat in het papier zit zichtbaar te maken met een wrijfsel (zoals je vroeger een afbeelding van een cent maakte), door radiografieën of foto’s. In WILC komen vooral wrijfsels (11.739) en radiografieën (4.323) voor.

Watermerken worden gebruikt om anonieme objecten op papier thuis te brengen. Door het watermerk te vergelijken met objecten waarvan wel een datum of herkomst bekend is, kan een object gedateerd worden of – in samenhang met andere technieken – een productieplaats vastgesteld worden. Zo konden ruim 3.400 watermerken uit de 1200 ongedateerde boeken gedateerd worden. Niet alleen boeken maar ook vijftiende-eeuwse prenten kunnen hiermee nader gespecificeerd worden.

Bestanden

Voor de watermerken in de WILC-set zijn de volgende bestanden beschikbaar:

  • een afbeelding van het watermerk (JPG), meestal rond de 400×600 pixels (exacte afmetingen variëren van scan tot scan);
  • beschrijvende metadata (Dublin Core in XML) met daarin persistente links naar bovengenoemde afbeeldingen.

De metadata in de set kan via OAI-PMH geharvest en via SRU doorzocht worden.

Lees meer over deze dataset op het datablog van de Koninklijke Bibliotheek.

 

Datablog: Koninklijke Bibliotheek – Middeleeuwse Verluchte Handschriften

Koninklijke Bibliotheek – Middeleeuwse Verluchte HandschriftenLogo Koninklijke Bibliotheek

De Koninklijke Bibliotheek biedt met de datasets  Middeleeuwse Verluchte Handschriften (MVH) toegang tot  ruim 11.000 handgemaakte afbeeldingen (zgn. verluchtingen) uit  400 middeleeuwse handschriften tot ca. 1550.

De KB doet dit als open (cultuur)data: voor de metadata geldt een CC0-licentie, voor de individuele objecten (plaatjes) geldt gezien hun ouderdom een Public Domain Mark.

De content is afkomstig uit de Koninklijke Bibliotheek (8.376 afbeeldingen in 330 manuscripten) en Museum Meermanno-Westreenianum (2.765 afbeeldingen in 70 manuscripten) in Den Haag.

De website waarop dit materiaal doorzocht kan worden is http://manuscripts.kb.nl/  Hier is ook meer hulp en achtergrondinformatie over het materiaal te vinden; daar wordt bv. uitgelegd waar de hieronder genoemde setnamen ‘BYVANCK’ en ‘ByvanckB’ vandaag komen.

Over de sets

De Middeleeuwse Verluchte Handschriften zijn onderverdeeld in twee datasets

  • De set BYVANCK beschrijft elk van de 400 manuscripten als geheel. Voor elk handschrift zijn gegevens zoals vervaardiger, materiaal, taal, plaats van oorsprong, aantal folia/bladzijden, fysieke afmetingen en jaartal vastgelegd; het soort informatie dat je op deze pagina aantreft.
    Deze set  bevat (beschrijvende metadata van) veel getijden- en gebedenboeken, die gewoonlijk geïllustreerd zijn met voorstellingen uit het leven van Maria en Christus. Christelijke thematiek is verder te vinden in verschillende Historiebijbels en in liturgische handschriften. Onder de overige verluchte handschriften nemen wereldgeschiedenissen, encyclopedieën en literaire werken een belangrijke plaats in.
    Deze set vertegenwoordigd  15% van alle verluchte handschriften die momenteel in Nederland bewaard worden. Beschrijvingen van het KB-deel van deze set tref je hier aan.
  • De set  ByvanckB beschrijft elk van de 11.141 afbeeldingen in deze 400 manuscripten. De beschrijving wat er op de afbeelding te zien is, de grootte van de afbeelding, het soort verluchting, de vervaardiger, afgebeelde onderwerpen (volgens de Iconclass-indeling) etc.; dus het soort informatie dat je bij deze afbeeldingen ziet. De metadata bevat tevens persistente URLs naar de gedigitaliseerde afbeeldingen.
    Het totaal aantal voorstellingen in deze set bedraagt 11.141, die de vele vormen kunnen hebben, zoals geschilderde miniaturen, tekeningen, gehistorieerde initialen of margescènes, en die alle mogelijke onderwerpen beslaan.

De twee sets zijn onderling gelinkt: voor elk manuscript zijn de bijbehorende verluchtingen te vinden en voor elke verluchting is het bijbehorende manuscript te vinden.

De sets bevatten vele verluchtingen uit welbekende klassiekers uit de Nederlandse literatuurgeschiedenis, bijvoorbeeld

Bestanden

Voor elk van de 400  handschriften in de BYVANCK- set zijn de volgende bestanden gemaakt.

  • Beschrijvende metadata

Voor de verluchtingen in de ByvanckB-set zijn de volgende bestanden gemaakt.

  • Een scan van 750 pixels breed
  • Een thumbnail van 125 pixels breed
  • Een foto van de hele manuscriptpagina waarin de verluchting is opgenomen. Niet voor alle verluchtingen beschikbaar.
  • Beschrijvende metadata met daarin persistente links naar bovengenoemde 3 bestanden
  • Een hi-res scan van circa 2000×3000 pixels, offline opgeslagen

De metadata in de sets kan via OAI-PMH geharvest en via SRU doorzocht worden.

Lees meer over deze datasets op het datablog van de Koninklijke Bibliotheek.

Datablog: Rijksdienst voor het Cultureel Erfgoed – Beeldbank & Bibliotheek

De Rijskdienst voor het Cultureel Erfgoed (RCE) biedt al enige tijd data en content aan voor hergebruik. Twee datasets zijn sinds vandaag ook als Open Cultuur Data dataset beschikbaar:

De beeldbank van de RCE bestaat metadata en de digitale bestanden van 550.000 afbeeldingen. De afbeeldingen zijn afbeeldingen van erfgoed die de afgelopen 150 jaar zijn gemaakt. In de beeldbank staan nu vooral foto’s van gebouwde monumenten, afbeeldingen van (scheeps)archeologie en landschap.

De metadata van de beeldcollectie wisselt van kwaliteit. Een van de redenen hiervoor is dat de opbouw van de beeldcollectie langer dan een eeuw geleden gestart is. De gegevens bij met name de foto’s zijn in de meeste gevallen ook de gegevens uit het jaar van de opname. Toch heeft de RCE er voor gekozen het grootste deel van zijn beeldcollectie nu breed ter beschikking te stellen. Aan de actualisering en completering van de gegevens wordt intussen hard gewerkt.

Uit de selectie Rotterdamse beelden, beschikbaar onder een Creative Commons - Naamsvermelding Gelijk-delen licentie

situatieplan Haventerrein (CC-BY-SA)

De bibliotheek van de RCE bestaat uit metadata van ongeveer 150.000 boeken en rapporten op het gebied van (scheeps)archeologie, monumentenzorg, landschap, roerend erfgoed, kunst, etc.

De bibliotheekcollectie van de RCE is samengesteld uit verschillende deelcollecties. Archeologie, Scheeps- en onderwaterarcheologie, Roerend Erfgoed en Onroerend Erfgoed. Vooralsnog worden alleen de metadata van de boekencollectie vrijgegeven.

Lees meer over deze dataset op de datablogs beeldbank en bibliotheek van de RCE.

Datablog: Koninklijke Bibliotheek – Staten-Generaal Digitaal

Troonrede 1994De Koninklijke Bibliotheek en de Tweede Kamer bieden met de dataset Staten-Generaal Digitaal (SGD) toegang tot alle gedigitaliseerde Handelingen van het zittingsjaar 1814/15 tot 1 januari 1995.

De set bevat 180 jaar politiek & maatschappelijk debat, bewindslieden, politieke taal, Rijksbegrotingen, Troonredes, wetten en regeringsverklaringen. De inhoud is als volgt:

  1. Handelingen (of Kamerverslagen) : de woordelijke verslagen van alles wat er in de vergaderingen van de Eerste Kamer, de Tweede Kamer en de Verenigde Vergadering is besproken. De Troonredes zijn hier bv. in opgenomen.
  2. Kamerstukken (of Bijlagen) : de schriftelijk uitgewisselde stukken tussen de Regering en het Parlement.  De Rijksbegrotingen zijn hier bv. in opgenomen.
  3. Aanhangsels (of Kamervragen) :  de schriftelijke vragen van Kamerleden van de Eerste of Tweede Kamer en de bijbehorende antwoorden van de minister of staatssecretaris.
  4. Registers : de Handelingen, Kamerstukken en Aanhangsels zijn over een groot aantal jaargangen voorzien van registers op zaken en persoonsnamen.

Daarnaast zijn apart beschikbaar:

  •  Kaarten (1112 stuks): Vanaf het zittingsjaar 1863/64 is kaartmateriaal toegevoegd.  Ze zijn voorzien van precieze geografische informatie (lengte en breedte)
  • Lemma’s uit de persoons- en zaakregisters.
  • Volgorde van sprekers in de Kamerverslagen

De website waarop dit materiaal doorzocht kan worden is www.statengeneraaldigitaal.nl. Hier is ook meer hulp en achtergrondinformatie over het materiaal te vinden.

De KB biedt SGD aan als open cultuurdata: voor de zowel de metadata als de objecten geldt een een CC0-licentie. De metadata in de set kan via OAI-PMH geharvest en via SRU doorzocht worden.

Lees meer over deze dataset op het datablog van de Koninklijke Bibliotheek.

Datablog: Koninklijke Bibliotheek – Early Dutch Books Online

De Koninklijke Bibliotheek biedt met de dataset Early Dutch Books Online (EDBO) toegang tot meer dan twee miljoen bladzijden uit in Nederland gedrukte boeken uit de periode 1781-1800.

De set bestaat uit 11.240 full-text boeken (9.710 titels). Hij bevat beroemde werken uit de Nederlandse geschiedenis, zoals de briefroman Sara Burgerhart van Betje Wolff en Aagje Deken, de verhandeling over de elektriseermachine van Deiman en het verslag van de veldtochten van generaal Pichegru.
Naast veel theologie en politiek, zijn er ook boeken over planten, dieren, kookboeken, mode, atlassen, almanakken en populair drukwerk, zoals griezelromans, toneelstukken, liedbundels, erotische romans, politieke teksten en wetenschappelijke verhandelingen, te vinden in EDBO.

De set  bestaat uit scans van de gedrukte pagina’s voorzien van OCR en woordcoördinaten;  de OCR is nog voor verbetering vatbaar. Van elk boek is ook een doorzoekbare PDF gemaakt. Er is zowel beschrijvende als structurele metadata beschikbaar. 2.465 titels bevatten één of meerdere afbeeldingen. Een complete titellijst is te vinden via www.earlydutchbooksonline.nl (zoek: titel ‘*’) en via deze link

De set is gemaakt in een samenwerkingsproject tussen de  Koninklijke Bibliotheek en de bibliotheken van de Universiteit van Amsterdam en de Universiteit Leiden. Ieder van deze bibliotheken bezit ongeveer 1/3 van de gedrukte werken op basis waarvan de set gemaakt is.

De website waarop dit materiaal doorzocht kan worden is www.earlydutchbooksonline.nl. Hier is ook meer hulp en achtergrondinformatie over het materiaal te vinden.

De KB biedt EDBO aan als open cultuurdata: voor de metadata geldt een een CC0-licentie;  individuele full-text items en niet-substantiële delen van deze set zijn te gebruiken onder een Public Domain Mark. De dataset als geheel (of substantiële delen ervan) mag ook voor commerciële doelen worden hergebruikt, met uitzondering van de Leidse deelcollectie, want die mag alleen niet-commercieel worden ingezet.  De metadata in de set kan via OAI-PMH geharvest en via SRU doorzocht worden.

Lees meer over deze dataset op het datablog van de Koninklijke Bibliotheek.

Datablog: Universiteitsbibliotheek Utrecht

Uit de collectie van de Universiteitsbibliotheek Utrecht

De collectie Kaarten van Holland en Utrecht is een digitale representatie van een collectie gedrukte kaarten van de provincies Holland en Utrecht uit de 16de tot en met de 19de eeuw. De in totaal 111 kaarten van Holland en 12 kaarten van Utrecht zijn in 2006 door een particulier aan de Utrechtse Universiteitsbibliotheek geschonken. Ze bieden een treffend beeld van de cartografische en geografische ontwikkeling van het Nederlandse economische kerngebied.

Alle objectbeschrijvingen (metadata) worden onder CC0 beschikbaar gesteld en de afbeeldingen (content) zijn Publiek Domein. De dataset van 123 objecten is via OAI-PMH te harvesten in JPG-format, grootte variërend tussen 0,5 – 1 MB. Het is eventueel ook mogelijk hoge resolutie images in TIFF-format te verkrijgen, waarbij de grootte tussen 80 – 150 MB varieert.

Lees meer over deze dataset op het datablog van de Universiteitsbibliotheek Utrecht.

Datablog: Tropenmuseum collectiedata

Collectie Tropenmuseum: De ruiterij van Goa vertrekt uit Fort Rotterdam

De collectie van het Amsterdamse Tropenmuseum bevat bijna 175.000 voorwerpen en ca. 485.000 fotografieën. Slechts een klein deel daarvan is te zien in de zalen van het museum. Het museum heeft echter als een van haar belangrijkste taken, naast het bewaren, het publiek toegankelijk maken van de collectie. Op Tropenmuseum collectie online wordt daarom steeds meer getoond van wat in het depot is opgeborgen. Objecten en fotocollectie zijn onderling gerelateerd, en gekoppeld aan tentoonstellingen, expedities,thema’s,  personen en instellingen.

In 2009 werd daar door de samenwerking met Wikimedia een dimensie aan toegevoegd. Op dit moment zijn ongeveer 50.000 objecten afbeeldingen uit de collectie beschibaar via Wikimedia Commons: foto’s en objecten van Indonesië en het voormalig Nederlands Indië, foto’s uit de Marrons collectie en het project WikiAfrika. Bekijk hier de ca. 500 records uit de collectie over Rotterdam. De bestanden zijn via verschillende API’s van Wikimedia Commons te benaderen. De afbeeldingen zijn aan Wikimedia aangeboden onder een Creative Commons Naamsvermelding Gelijkdelen 3.0 licentie.

Lees meer over deze dataset op het datablog van het Tropenmuseum.

 

Datablog: Nationaal Archief, Polderreglementskaarten

Kleine Adriana Theodorapolder, gemeente Ooltgensplaat

Bij de goedkeuring van de Polderreglementen door het Provinciebestuur van Zuid-Holland zijn in de periode 1857 – 1974 grenskaarten gemaakt van de polders en waterschappen. Van deze polder­reglements­kaarten werd door de provincie een afzonderlijk polderboek bijgehouden.  In 1990 is het kaartenarchief van de Provincie Zuid-Holland overgedragen aan het Nationaal Archief. Deze polderreglementskaarten zijn gedigitaliseerd en op de website van GaHetNA te bekijken.

In 2010 zijn door vrijwilligers van het Erfgoedhuis Zuid-Holland deze kaarten gegeorefereerd: van elke kaart is bepaald welk deel van de wereldbol door deze kaart wordt bedekt. In de datadump staan de basisgegevens van elke kaart, met daarbij de gevonden coördinaten. De set bestaat uit content (693 kaarten) en de bijbehorende metadata van 631 records. De content en matadata zijn beschikbaar onder een CCO 1.0 Universal verklaring. Via een Open Search API kan de dataset aangeroepen worden.
Lees meer over deze dataset op het datablog van het Nationaal Archief.

Datablog: Rotterdamse beelden en geluiden (2)

Eric Koch, Amerikaanse kolen voor Nederland. Het lossen in de Rotterdamse haven

Anefo en Rotterdam

De open dataset fotopersbureau Anefo van 142000 beelden afkomstig uit het Nationaal Archief zitten 4079 afbeeldingen die rechtstreeks geografisch zijn te koppelen aan Rotterdam. Een extra 305  foto’s zijn via de overige trefwoorden te koppelen aan Rotterdam.

API

Op de datablog van de gehele set staat te lezen hoe de dataset in elkaar steekt en hoe deze via een Open Search Api benaderd kan worden. Via deze API kan ook eenvoudig de Rotterdamse afbeeldingen uit het geheel gehaald worden: http://www.gahetna.nl/beeldbank-api/opensearch?q=2.24.01.05&q=Rotterdam

Onderwerpen

Wanneer je de Rotterdamse afbeeldingen bekijkt valt op dat qua thematiek relatief veel sport (Voetbal), haven en stakingsgerelateerd materiaal aanwezig is. Kijk bijvoorbeeld eens naar de 31 trefwoorden waar 50 of meer afbeeldingen over Rotterdam aanwezig zijn. Bekijk alle onderwerpen op het datablog van het Nationaal Archief.

Combinaties

Een Rotterdamse set foto’s vraagt er natuurlijk om gecombineerd te worden met een andere open cultuurdatasets waaruit eenvoudig Rotterdamse onderwerpen te destilleren zijn zoals de Rotterdamse Beelden en Geluiden. Applaus uit De Doelen combineert uitstekend met foto’s daarvan, bewegende beelden van de haven verdiept met foto’s daarvan.

Licentie

De set bestaat uit content (afbeeldingen) en metadata (beschrijvingen). De content is beschikbaar onder een CC-BY-SA licentie, de metadata is beschikbaar onder een CC0 licentie.

Lees meer over deze Rotterdamse beelden op het datablog van het Nationaal Archief.

 

Datablog: Rotterdamse beelden en geluiden (1)

Het Nederlands Instituut voor Beeld en Geluid biedt via Open Cultuur Data drie collecties aan. Twee van deze collecties bevatten tal van historische beelden én geluiden van Rotterdam en omgeving, die speciaal voor de hackthon van 13 oktober zijn samengesteld. Deze kunnen aan elkaar worden gekoppeld, maar bijvoorbeeld ook aan andere mooie datasets, zoals de Anefo collectie van het Nationaal Archief waar meer dan 4.000 foto’s over Rotterdam in zitten.

Het Geluid van Nederland:
De 2.000 geluiden in deze dataset komen uit heel Nederland en zijn opgenomen tussen de jaren ’50 en de jaren ’90. Het geluid van Rotterdam is goed te horen: zo zitten er opnames in van de Laurenskerk, scheepsfluiten, een rondvaart uit 1987 (inclusief Duitse, Nederlandse, Franse en Engelse tourguide), applaus uit de Kleine Doelenzaal en een oude stoomtram (van de Rotterdamse Tram Maatschappij). De volledige set met Rotterdamse geluiden staat hier, en het datablog over de SoundCloud API en alle 2.000 geluiden staat hier. Zie voor meer details de SoundCloud developer pagina Accessing Sets.

Scheepsfluiten by Beeld en Geluid

Open Beelden:
Op Open Beelden is ook een speciale Rotterdam set aangemaakt. Deze set bevat nu ruim 100 video’s met onderwerpen uit het bekende Polygoonjournaal en enkele andere films over Rotterdam van de jaren ’20 t/m de jaren ’70. De video’s laten typisch Rotterdamse plekken en bezienswaardigheden zien zoals de Euromast, de Rotterdamse haven, de Kuip en Diergaarde Blijdorp. De volledige set met Rotterdamse video’s staat hier, en het datablog over Open Beelden staat hier.