Koninklijke Bibliotheek – Staten-Generaal Digitaal

Koninklijke Bibliotheek - Staten-Generaal Digitaal

De  Tweede Kamer der Staten-Generaal en de Koninklijke Bibliotheek stellen d.m.v. de dataset SGD alle Handelingen –  d.w.z. de woordelijke verslagen van alles wat er in de vergaderingen van de Eerste Kamer, Tweede Kamer en Verenigde Vergadering is besproken – van het zittingsjaar 1814-1815 tot 1 januari 1995 ter beschikking. Dit doet de KB als open cultuurdata:  zowel de metadata als de objecten zijn beschikbaar onder een CCO 1.0 Universal verklaring.

De website waarop dit materiaal doorzocht kan worden is www.statengeneraaldigitaal.nl. Hier is ook meer hulp en achtergrondinformatie over het materiaal te vinden

 

Over de set SGD

De dataset SGD bevat alle gedigitaliseerde Handelingen van het zittingsjaar 1814-1815 tot 1 januari 1995.  Handelingen zijn de woordelijke verslagen van alles wat er in de vergaderingen van de Eerste Kamer, Tweede Kamer en Verenigde Vergadering is besproken.  De set bevat dus o.a. 180 jaar politiek & maatschappelijk debat, bewindslieden, politieke taal, Rijksbegrotingen, Troonredes, wetten en regeringsverklaringen.

Troonrede 1994

Er worden binnen het materiaal van SGD vier typen stukken onderscheiden:

  1. Handelingen (of Kamerverslagen) : zijn de woordelijke verslagen van alles wat er in de vergaderingen van de Eerste Kamer, de Tweede Kamer en de Verenigde Vergadering is besproken. Ook de verslagen van de Openbare Commissie Vergaderingen (OCV’s, gehouden van 1962 t/m 1980) en van de Uitgebreide Commissie Vergaderingen (UCV’s, gehouden van 1980 t/m 1994) zijn in de Handelingen opgenomen
  2. Kamerstukken (of Bijlagen) :  zijn de schriftelijk uitgewisselde stukken tussen de Regering en het Parlement. De behandeling van een Kamerstuk kan meerdere jaren in beslag nemen. Ook de Rijksbegroting is opgenomen bij de Kamerstukken.
  3. Aanhangsels (of Kamervragen) :  zijn de schriftelijke vragen van Kamerleden van de Eerste of Tweede Kamer en de bijbehorende antwoorden van de minister of staatssecretaris. De eerste Aanhangsels verschenen in de Handelingen van de Tweede Kamer van het zittingsjaar 1906-1907. De Aanhangsels aan de Handelingen van de Eerste Kamer volgden in het zittingsjaar 1918-1919.
  4. Registers (op personen en zaken) : de Handelingen, Kamerstukken en Aanhangsels zijn over een groot aantal jaargangen voorzien van registers op zaken en persoonsnamen. Dit zijn lijsten met namen (persoonsregisters) en zaken (zaakregisters) met daarachter verwijzingen waar deze personen en zaken in Handelingen, Kamerstukken en Aanhangsels voorkomen. Een compleet overzicht van registers is hier te vinden. Alleen de persoons- en zaakregisters zijn doorzoekbaar. Zie deze PDF voor achtergrondinfo over registers & lemma’s.

Daarnaast zijn apart beschikbaar:

  •  Kaarten: Vanaf het zittingsjaar 1863-1864 is kaartmateriaal toegevoegd. De kaarten dienen als visueel beleidsmateriaal bij memories van toelichting, voorlopige verslagen, memories van antwoord, etc. De kaarten zijn voorzien van precieze geografische informatie (lengte en breedte) en apart doorzoekbaar.
  • Lemma’s uit de persoons- en zaakregisters.
  • Volgorde van sprekers in de Kamerverslagen

Bestanden

Voor elke van de plusminus 454.8K kamerverslagen, kamerstukken, kamervragen en registers zijn de volgende bestanden gemaakt:
1. Beschrijvende metadata (Dublin Core-XML)
2. Structurele metadata (MPEG21-DIDL)
3. PDF

Daarnaast is er aparte beschrijvende metadata voor
4. Kaarten uit de Handelingen – 1112 stuks

Voor elk van de plusminus 2,5 miljoen gescande pagina’s zijn de volgende bestanden gemaakt:
5. Hi-res opname (JPG) v/d papieren pagina
6. Full-text (OCR-XML)
7. Coördinaten van elk woord op een pagina (ALTO-XML)

Daarnaast zijn er aparte XML-bestanden gemaakt voor
8. Lemma’s uit de persoons- en zaakregisters – 38.294 records
9. Volgorde van sprekers in de Kamerverslagen (ALTO-XML)

De metadata & digitale objecten in de set beslaan zo’n 30 TB. Zie onder “Techniek” voor voorbeelden van de beschrijvende & structurele metadata records, PDF- OCR-, JPG- & ALTO-bestanden en hoe deze op te vragen zijn via de API’s

 

Voorwaarden hergebruik & bronvermelding

  • De objecten in deze set (PDFs’ JPGs, OCR’s, ALTO’s) zijn beschikbaar onder de CCO 1.0 Universal verklaring.
  • De Tweede Kamer der Staten-Generaal en de Koninklijke Bibliotheek hebben afstand gedaan van het auteursrecht op de beschrijvende & structurele metadata. Deze bestanden zijn dus ook beschikbaar onder de CCO 1.0 Universal verklaring.

Door de CC0-vermelding die op zowel de objecten als metadata zit, is het niet noodzakelijk om aan bron- & naamsvermelding te doen. Dit neemt niet weg dat de KB en de 2e Kamer dit wel bijzonder op prijs stellen. Gebruik hierbij dan het volgende format:

Tweede Kamer der Staten-Generaal &  Koninklijke Bibliotheek, Den Haag. Bron: www.statengeneraaldigitaal.nl – [link naar object]
(voor de link naar het object : zie voorbeelden van (persitente) URLs onder “Techniek”)

 

Techniek

De technische uitleg over en voorbeelden van de

  • Beschrijvende metadata (dcx),
  • Structurele metadata (mpeg21-didl),
  • Full-text objecten (pdf, ocr-xml, alto-xml, jpg)
  • Harvest-API o.b.v. OAI-PMH
  • Zoek-API o.b.v. SRU

is apart op de KB-site ondergebracht:

 

Praktijk

De SGD-set in bestaande diensten

De set wordt momenteel al hergebruikt in

Suggesties voor hergebruik

De KB geeft de volgende suggesties voor hergebruik van deze set:

  • Gebruik bij fact-checking / datajournalistiek
  • App-versie van statengeneraaldigitaal.nl : voor kamerleden tijdens Kamerdebatten + voor journalisten op de vierkante kilometer rondom het Binnenhof
  • Politieke quiz-app
  • Quiz met rare/opvallende wetten & moties: Is deze wet/motie aangenomen of niet?
  • Linkse &  rechtse thema’s, taalgebruik & stokpaardjes door de jaren heen
  • Historische actualiteiten (i.c.m andere sets)
  • Zijn huidige politieke hot-topics historisch gezien wel zo hot?


Contact & feedback

We zijn bijzonder benieuwd hoe de SGD-data herbruikt  wordt! Alhoewel de set SGD open cultuurdata betreft en dus onbeperkt hergebruikt mag worden door ontwikkelaars, instellingen, bedrijfsleven en privé-personen, zouden wij het toch bijzonder op prijs stellen als je laat weten wanneer je van plan bent SGD-data te downloaden. Op die manier kunnen we je op de hoogte brengen van eventuele veranderingen en updates van onze datasets & API’s en kunnen we (de resultaten van) jouw project speciale aandacht geven op onze API-pagina’s.  Dit levert  jouw project of toepassing dan weer de nodige publiciteit op!

Stuur dus s.v.p. een korte mail naar dataservices@kb.nl (daar zitten echte mensen achter!) met je contactgegevens en een korte uitleg wat je met de data doet. Uiteraard wordt er door de KB zorgvuldig met de contactgegevens omgesprongen.

Feedback op onze data & API’s  is uiteraard ook zeer welkom!