Open Archieven – genealogische data

Open Archieven - genealogische data

CC0-licentie

 

 

 

 

Over de dataset
Open Archieven (http://www.openarch.nl/) is een zoekmachine voor genealogische gegevens, oftewel historisch persoonsgegevens. Denk hierbij aan gegevens uit volkstelling- en bevolkingsregisters, doop-, trouw- en begraafregisters en akten van de Burgerlijke Stand. De data is afkomstig uit twee typen bronnen: archiefinstellingen en stamboomonderzoekers. Het gaat in totaal om 4,4 miljoen persoonsvermeldingen.

1. Archiefinstellingen
Meer en meer archiefinstellingen stellen historische persoonsgegevens beschikbaar als open data. Open Archieven verzameld deze data, of het nu CSV, XML exports of OAI-PMH is, zodat het op een eenduidige wijze gepresenteerd en beschikbaar gesteld kan worden. Op dit moment gaat het om data van de volgende archiefinstellingen:

  • Erfgoed Leiden en Omstreken (complete set genealogische data), zij stellen deze data ook zelf via OAI-PMH beschikbaar (zie voor meer info de beschrijving van deze data op Open Cultuur Data)
  • Gemeentearchief Ede (gereconstrueerde persoonskaarten), zij stellen deze data ook zelf via CSV beschikbaar (zie voor meer info de beschrijving van deze data op Open Cultuur Data)
  • Streekarchief Langstraat Heusden Altena (bevolkingsregister)

2. Stamboomonderzoekers
Stamboomonderzoekers indexeren voor hun genealogisch onderzoek bepaalde archiefbronnen, zodat zij zelf, maar ook anderen makkelijker informatie vinden over personen in de betreffende achiefbron. Open Archieven neemt deze index gegevens – in overleg met en met toestemming van de auteur – op, zodat deze vindbaar zijn via http://www.openarch.nl/ en op gestructureerde wijze voor hergebruik beschikbaar kunnen worden gesteld. Open Archieven tracht tevens de data te verrijken met links naar online scans van de bron.
Op dit moment gaat het om de volgende datasets:

  • door J.B. Glasbergen geïndexeerde volkstellingsregister van Rijnsburg (bron bij Erfgoed Leiden en omstreken) met toegevoegde links naar scans bij FamilySearch
  • door Kees Kooij geïndexeerde doop gegevens van Tienhoven (bron bij Regionaal Historisch Centrum Vecht en Venen) met toegevoegde links naar scans bij FamilySearch
  • door Kees Kooij geïndexeerde trouw gegevens van Tienhoven (bron bij Regionaal Historisch Centrum Vecht en Venen) met toegevoegde links naar scans bij FamilySearch
  • door Jos van Rijn geïndexeerde register van in Alkemade aangegeven lijken (bron bij Groene Hart Archieven) met links naar toegevoegde scans bij het Nationaal Archief
  • door Ivo Beckers geïndexeerde doop, trouw en begraafregisters Langendijk (bron bij Regionaal Archief Alkmaar) met toegevoegde links naar scans bij Van Papier Naar Digitaal

Op dit moment bestaat de totaal geboden dataset uit zo’n 4,4 miljoen persoonsvermeldingen. Zodra Open Archieven kennis neemt van nieuwe genealogische open data bronnen van particulieren of instellingen, worden deze opgenomen.

Hoe zou deze data hergebruikt kunnen worden?
Doordat de historische persoonsgegevens gestructureerd worden aangeboden kunnen deze eenvoudig hergebruikt worden. Vragen als ‘wie is er ook op deze dag getrouwd’ en ‘wie woonde er toen op dit adres’ zouden beantwoord kunnen worden voor specifieke plaatsen. Gegevens zouden gekoppeld kunnen worden aan geografische informatie, weerinformatie, informatie over monumenten of kunst, enz.

Toegang tot de data, en dataformaten
Deze dataset is voor de gebruiker toegankelijk gemaakt via de website Open Archieven (http://www.openarch.nl/). Hergebruikers kunnen de dataset harvesten via het OIA-PMH protocol. Binnen dit protocol wordt het Archive 2 All model (http://www.den.nl/standaard/386/) gebruikt, in dit model worden historische gebeurtenissen, personen, objecten, relaties en bronnen beschreven.

De basis URL van de Open Archieven OAI-PMH data provider is http://api.openarch.nl/oai-pmh/, documentatie hiervan is beschikbaar viahttp://www.openarch.nl/api/docs/oai-pmh/. De data is opgedeeld in sets: voor elk archief is een aparte set, via http://api.openarch.nl/oai-pmh/?verb=ListSets kan hiervan een overzicht worden opgevraagd. De gegevens kunnen in z’n geheel worden geharvest of door middel van een filter op datum van laatste wijziging.

Er is ook een API beschikbaar (zie http://www.openarch.nl/api/docs/ voor de documentatie) die functies biedt ten aanzien van aktes, links, commentaar en statistieken. Deze API biedt een REST-interface met als uitvoer JSON en bij sommige functies ook GEDCOM.

Licenties en voorwaarden hergebruik
De data wordt beschikbaar gesteld onder een CC0 licentie. Dit houdt in dat de data zonder toestemming mag worden gekopieerd, veranderd, verspreid en uitgevoerd, zelfs voor commerciële doeleinden. Contact over hergebruik wordt erg op prijs gesteld daar dit het begin kan betekenen van een vruchtvolle samenwerking. De gegevens kunnen links bevatten naar online scans van bronnen van derden, deze scans vallen niet onder deze open data set. Raadpleeg de websites die de scans bieden voor de licentie voorwaarden die zij stellen.

Contact
Vragen over deze dataset of geboden interfaces? Mail naar Bob Coret via data@openarch.nl of via twitter @openarch_nl