GLAMetrics: Nederlands cultureel erfgoed op Wikipedia bereikt maandelijks miljoenenpubliek

8cb20dad36c51248f319dc689ae6da9fdf880d_large

Een menigte aanschouwt een komeet door Jan Luyken (1698), Collectie: Amsterdam Museum, CC-0

Er is een groeiende behoefte in de culturele sector naar het meten van de impact van het beschikbaar stellen van collecties als open data en open content, en tegelijkertijd is er – ook internationaal – geen partij die deze gegevens sectorbreed verzamelt. In 2014 is Open Cultuur Data een verkennend onderzoek gestart naar de (on)mogelijkheden om de impact van open cultuurdata te meten onder de naam GLAMetrics. Hiermee is een belangrijk begin gemaakt met de kwantitatieve bewijsvoering van de gevolgen van het openstellen van culturele data, ten behoeve van de gehele (internationale) sector. In deze blogpost beschrijven we de eerste uitkomsten van een onderzoek naar het hergebruik en bereik van Nederlands digitaal erfgoed binnen de Wikimediaprojecten; dit zijn de diverse projecten van de Wikimedia-gemeenschap, waaronder alle verschillende taalversies van Wikipedia zoals nl.wikipedia.org, maar bijvoorbeeld ook WikiSource en WikiData.

Methode

Om te inventariseren welke open cultuurdatasets op dit moment aan Wikimedia Commons (het media-archief van de Wikimediaprojecten) zijn toegevoegd – en dus binnen Wikimediaprojecten kunnen worden hergebruikt – hebben we een enquête opgesteld en in oktober 2014 binnen het OCD-netwerk verspreid. Deze enquête is door 30 vertegenwoordigers van instellingen uit het netwerk ingevuld. Elf respondenten hebben momenteel één of meerdere open cultuurdatasets op Wikimedia, drie instellingen geven aan op het moment te werken aan een eerste publicatie. Vervolgens is met Wikimedia Nederland samengewerkt om het overzicht van Nederlandse cultuurinstellingen op Wikimedia zo compleet mogelijk te maken.

Wikimedia biedt verschillende publiek beschikbare meetinstrumenten om data te verzamelen over het hergebruik en bereik van materiaal binnen de verschillende Wikimediaprojecten.* Vanaf november 2014 heeft OCD deze meetinstrumenten ingericht voor de Nederlandse erfgoedinstellingen op Wikimedia Commons. Het gaat specifiek om BaGLAMa 2 en GLAMorous:

  • BaGLAmA 2 laat zien op welke pagina’s van Wikimediaprojecten materiaal wordt hergebruikt en hoe vaak deze pagina’s worden opgevraagd;

  • GLAMorous toont per set/collectie hoeveel materiaal er voor hergebruik aangeboden wordt en hoe vaak dit daadwerkelijk gebeurt.

Eerste bevindingen

Vanaf het moment dat we zijn gaan meten (november 2014), waren er 23 Nederlandse erfgoedinstellingen die één of meerdere collecties voor hergebruik in Wikimediaprojecten aanboden door één of meerdere collecties via Wikimedia Commons open te stellen. Sommige instellingen zijn nog maar enkele maanden op Wikimedia aanwezig (zo kwam in februari als 24e instelling Museum Catherijneconvent en in april het Textielmuseum als 25e instelling erbij), terwijl de eerste instelling op Wikimedia Commons – het Tropenmuseum – al meer dan 56 maanden content aanbiedt voor hergebruik.

  • In totaal zijn er tot nu toe bijna 580.000 Nederlandse digitale erfgoedobjecten aan Wikimedia Commons toegevoegd.

  • Van het totale aanbod op Wikimedia Commons, bijna 24,5 miljoen media-items, bestaat ongeveer 2,4% uit Nederlands digitaal erfgoed.

  • De overgrote meerderheid van dit Nederlandse aanbod zijn afbeeldingen, maar er zitten ook bijna 2.000 geluidsopnames en 4.500 videos tussen.

Dankzij GLAMetrics weten we voor het hierboven beschreven aanbod inmiddels een stuk meer over het hergebruik en bereik hiervan:

  • In het eerste kwartaal van 2015 werden de objecten van de bovengenoemde instellingen in gemiddeld 76.000 pagina’s van Wikimediaprojecten hergebruikt. Dit aantal groeide in het gemeten kwartaal met ongeveer 2,5%.

  • Deze pagina’s werden in het eerste kwartaal van 2015 ruim 200 miljoen keer opgevraagd, ongeveer 67,5 miljoen raadplegingen per maand (de Wikimediaprojecten ontvangen momenteel gezamenlijk ongeveer 20,5 miljard raadplegingen per maand, het aandeel in het totale bereik van pagina’s dat Nederlands erfgoed hergebruikt is dus ongeveer 0,3%).

  • Op deze pagina’s werden ongeveer 37.500 unieke objecten hergebruikt. Dat is bijna 7% van het totale aanbod.

  • In totaal resulteerde dit erin dat Nederlands digitale erfgoedobjecten bijna 100.000 keer op een pagina van een Wikimediaproject hergebruikt werden.

Als uitsmijter biedt Wikimedia – naast maandelijkse statistieken – ook cijfers over het aantal raadplegingen van de pagina’s waarop het materiaal is hergebruikt over de gehele gemeten periode. Hoewel niet elke Nederlandse erfgoedcollectie vanaf het moment van beschikbaarheid is gemeten – dit verschilt van slechts een aantal tot maar liefst 56 maanden – zijn de cijfers van het bereik van deze collecties al zeer indrukwekkend: maar liefst 1,9 miljard keer zijn pagina’s met daarin Nederlands digitaal erfgoed geraadpleegd!

Verwachtingen voor GLAMs

Momenteel wordt bijna 7% van het gecombineerde aanbod aan Nederlandse digitale erfgoedobjecten in Wikimedia Commons daadwerkelijk op één of meerdere pagina’s van Wikimediaprojecten hergebruikt. Op basis van de verzamelde gegevens kunnen we ook een paar eerste voorzichtige verwachtingen uitspreken voor instellingen die overwegen om (een deel van) hun collectie via Wikimedia Commons open te stellen.

  • Per collectie verschilt het daadwerkelijke hergebruik. Van sommige collecties wordt bijna 50% hergebruikt, terwijl enkele collecties bijna helemaal niet worden hergebruikt. Zeker in het begin lijkt 7% hergebruik dus een realistische verwachting voor digitaal erfgoed.

  • Voor deze 7% hergebruik kan je per uniek object gemiddeld een bereik van ruim 2.100 raadplegingen per maand verwachten. Op jaarbasis zijn dat 25.000 raadplegingen per uniek object.

  • De exacte impact wordt beïnvloed door de mate waarin de instelling het hergebruik van het materiaal stimuleert door te communiceren met de gemeenschap van vrijwilliger en activiteiten te organiseren.

  • Op basis van het bovenstaande kan een instelling met een donatie van 1.000 objecten gemiddeld een maandelijks bereik van bijna 150.000 raadplegingen van pagina’s van Wikimediaprojecten met materiaal uit haar collectie verwachten.

Vervolg

Als vervolg op deze eerste blogpost, zullen we elk kwartaal een update geven van hoe het hergebruik en bereik van Nederlands digitaal erfgoed op Wikimediaprojecten zich ontwikkelt. Bovendien hopen we, naar mate we meer data verzamelen steeds uitgebreidere bevindingen te kunnen presenteren. Zo gaan we kijken of we retroactief data over oudere collecties op Wikimedia kunnen vergaren, om zo ook ontwikkelingen over de (middel)lange termijn te identificeren. Verder willen we het hergebruik in verschillende taalversies van Wikipedia en andere Wikimediaprojecten met elkaar vergelijken en meten hoeveel van de totale Wikipedia verrijkt wordt met Nederlands digitaal erfgoed. Tot slot willen we kijken naar de invloed van activiteiten rondom een contentdonatie van een erfgoedinstellingen aan Wikimedia op het hergebruik (zoals bijvoorbeeld het organiseren van edit-a-thons).

Oproep

Wij zijn erg benieuwd naar feedback en suggesties, naar aanleiding van onze eerste bevindingen. Daarnaast worden wij graag op de hoogte gesteld van nieuwe contentdonaties van Nederlandse erfgoedinstellingen aan Wikimedia. Dit kan door de reageren op deze blogpost.

Open onderzoeksdata

Geheel in lijn met het gedachtengoed van OCD, is alle data die wij voor dit onderzoek hebben verzameld open beschikbaar voor hergebruik onder CC-0. Zoals hierboven aangegeven zijn wij erg benieuwd naar feedback, suggesties en analyses van anderen!

* Kanttekening bij deze cijfers en meetinstrumenten is dat Wikimedia momenteel mobiel verkeer nog niet goed kan meten. Ook maakt Wikimedia geen onderscheid tussen raadplegingen van pagina’s door bezoekers en raadplegingen door machines (bijvoorbeeld zoekmachines, t.b.v. hun indexering). Naar schatting is dat zo’n 15%. Daarnaast heeft OCD niet kunnen ontdubbelen voor pagina’s van Wikimediaprojecten waarin materiaal van meer dan één erfgoedpartij wordt hergebruikt. Wij nemen echter aan deze kanttekeningen zich dusdanig tot elkaar verhouden dat de bovenstaande uitkomsten in ieder geval niet lager uitpakken. Op termijn hoopt OCD dat Wikimedia nog meer data over het hergebruik en bereik ter beschikking stelt, zoals geanonimiseerde data over het gedrag van bezoekers aan de pagina’s waarin Nederlands erfgoed is hergebruikt, zodat er meer te zeggen is over hoeveel tijd en aandacht de lezer besteedt aan het raadplegen van de specifieke erfgoedobjecten.

Maarten Brinkerink (Nederlands Instituut voor Beeld en Geluid), met dank aan Lotte Belice Baltussen, Jesse de Vos, Maarten Zeinstra (Kennisland) en Tom Kunzler (Open State Foundation) voor hun suggesties 

1 Comment

  1. Vanuit Wikimedia Nederland kan ik volmondig zeggen dat we heel blij zijn met deze cijfers. Daar doen we het voor!

    Ik kan me voorstellen dat een aantal cijfers toch nog vrij abstract blijven. En er zijn grote inhoudelijke verschillen tussen collecties. Misschien is het interessant om de cijfers tot leven te brengen aan de hand van een beschrijving van een aantal ‘voorbeeldcollecties’, met hergebruik van een aantal voorbeeld-items, waar andere instellingen zichzelf aan kunnen spiegelen?

    Collecties (en donaties aan Wikimedia Commons) verschillen op basis van (bijvoorbeeld) deze criteria.

    – Is het materiaal bijgedragen door een grote, middelgrote of kleine instelling?
    – Inhoudelijk: gaat het om beeldende kunst, nieuws en media, dagelijks leven, geschiedenis, cultuurhistorisch…?
    – Is het materiaal dat beschikbaar gesteld werd op Wikimedia Commons gerelateerd aan populaire onderwerpen (bijvoorbeeld celebrities, politici), of juist heel specifieke / specialistische onderwerpen (‘long tail’)?
    – Is de instelling een bibliotheek, een archief, een museum of een ander type culturele instelling?
    – Is het onderwerp van de donatie bepaald door de instelling zelf, of vanuit een vraag van de Wikipediagemeenschap / projecten?

Geef een reactie