Tips voor data-eigenaren

Maker: TigerPixel, zie http://www.flickr.com/photos/tigerpixel/3488935621/. CC BY-NC-ND 2.0 http://creativecommons.org/licenses/by-nc-nd/2.0/deed.en.

Het afgelopen jaar heeft Open Cultuur Data veel tips gekregen van developers en andere hergebruikers van culturele datasets over hoe deze het beste aangeboden kunnen worden door de data-eigenaren. Hierbij een overzicht van de belangrijkste punten waar je als aanbieder op kunt letten, zodat de kans van het hergebruik van jouw open culturele datasets verder wordt vergroot:

Waar kan ik mijn data het beste neerzetten?

  • Bied je data (content en / of metadata) in ieder geval altijd aan via je eigen website. Op deze manier is het duidelijk wie de afzender is, en bovendien heb je dan nog meer zicht op het hergebruik van je data.
  • Je kunt zowel content (b.v. afbeeldingen, video’s) aanbieden, als de informatie hierover (metadata). Vrijwel altijd staat de metadata op een andere plek dan de content. Als je zowel content als metadata aanbiedt, zorg dan dat het duidelijk is waar beide gevonden kunnen worden. Voeg in de metadata altijd in een apart veld een duidelijke link toe naar de content, bijvoorbeeld de URL van een plaatje of een video.

Hoe kan ik – naast het schrijven van een datablog – meer informatie geven over mijn open culturele dataset?

  • Idealiter kunnen hergebruikers in je metadata een link vinden naar het bijbehorende record in je eigen catalogus, website of beeldbank.
  • Als je organisatie een webwinkel heeft waar gebruikers ook content kunnen bestellen, is het belangrijk om de content die in je Open Cultuur Dataset ook als zodanig te markeren. Als hergebruikers een winkelwagentje zien naast een foto die in jouw dataset als ‘open’ wordt bestempeld is dat verwarrend en kan dat hergebruik afschrikken.
  • Zorg ervoor dat er een verklaring of nieuwsbericht op je eigen website staat over de open cultuur dataset(s) die jouw instelling aanbiedt.
  • Neem altijd een rechtenveld op in je metadata, waarin duidelijk is onder welke voorwaarden en welke licentie(s) jij je metadata én je content aanbiedt. Open Cultuur Data houdt aan dat metadata in ieder geval onder CC0 beschikbaar dient te zijn, en content onder CC BY of CC BY-SA, of gemarkeerd moet zijn als Publiek Domein als er geen auteursrechten meer op de content rusten.

Hoe kan ik mijn metadata het beste aanbieden?

  • Geef duidelijk aan in de metadata onder welke voorwaarden je de dataset (dus content en / of metadata) beschikbaar stelt. Zie ook  het laatste punt hierboven.
  • De voorkeuren verschillen per ontwikkelaar. Sommigen hebben genoeg aan een .csv of .txt dump van de metadata, anderen hebben liever een volwaardige live API, waarbij je kunt kiezen om de data op verschillende manieren aan te roepen (JSON, .xml). Wat je mogelijkheden of beperkingen ook zijn, zorg dat je in ieder geval altijd duidelijk beschrijft wat er in je metadatavelden te vinden is in je datablog, en geef hergebruikers zoveel mogelijk opties om je data te benaderen, downloaden en doorzoeken. Als je een API hebt, beschrijf dan welke standaard je volgt, en waar meer informatie hierover te vinden is.
  •  Geef duidelijk aan in je datablog of – nog beter – in je metadata wanneer de dataset het laatst is bijgewerkt. Als je dataset met enige regelmaat verandert, zorg dan dat je een update beschikbaar stelt, of zelfs meerdere versies van je dataset aanbiedt.

Hoe kan ik mijn content het beste aanbieden?

  • Als je open content hebt, is het aan te bevelen een zo hoog mogelijke resolutie beschikbaar te stellen. Dit stimuleert hergebruik! Let wel, sommige ontwikkelaars zouden ook graag een kleinere resolutie kaarten hebben om mee te werken, omdat dat wat minder ‘zwaar’ is. Als het kan, zorg dan dat je content in verschillende resoluties beschikbaar is.

Zijn er nog specifieke tips als ik graag wil dat mijn open culturele content op Wikipedia wordt hergebruikt?

Voor hergebruik op Wikipedia zijn met name de volgende metadatavelden van belang: Naam van de maker, titel, object type, beschrijving, creatiedatum, afmetingen, huidige locatie, intern ID, licentie.

  • Zorg dat deze velden in ieder geval goed zijn gedocumenteerd.
  • Als er een unieke categorie aan jouw content wordt gehangen op de Wikimedia Commons (b.v. Media From Groene Hart Archieven), dan kunnen er statistieken over hergebruik op Wikipedia worden gegenereerd (zie hier voorbeelden hiervan). Deze categorieën worden door de Wikimedia community zelf toegekend. Als je vragen hierover hebt, kun je contact opnemen met Maarten Zeinstra (mz [at] kl.nl).

Nog meer tips? Zie de ‘Checklist voor aanbieders van Open Data‘ van OpenDataNederland.

 

Geef een reactie

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.