Data kwaliteit projecten: Difference between revisions

From Doelgericht Digitaal Transformeren
Line 90: Line 90:
==== Deduplicatie na ingest ====
==== Deduplicatie na ingest ====


Door bij het ingesten gegevens over Uitvoerders, Organisatoren en Locaties uit verschillende fysiek aparte databanken bij elkaar te brengen zijn er duplicaten ontstaan. Die duplicaten moeten we herkennen, bv. op basis van gelijkaardige labels, en ze dan "mergen". Het zal dan zijn dat er twee Kunstenpunt legacy URLs gekoppeld zijn. Waar mogelijk kunnen we ook 1 verwijzing naar wikidata toevoegen.
Door bij het ingesten gegevens over Uitvoerders, Organisatoren, Locaties, Plaatsen, Rollen en Disciplines uit verschillende fysiek aparte databanken bij elkaar te brengen zijn er duplicaten ontstaan. Die duplicaten moeten we herkennen, bv. op basis van gelijkaardige labels, en ze dan "mergen". Het zal dan zijn dat er twee of meerdere Kunstenpunt legacy URLs gekoppeld zijn. Waar mogelijk kunnen we ook 1 verwijzing naar wikidata toevoegen.


Voorbeelddata:
Voorbeelddata:
* [[Item:Q520790|Esther Venrooy gebaseerd op MCV]] en [[Item:Q150454|Esther Venrooy gebaseerd op data.kunsten.be]]
* [[Item:Q520790|Esther Venrooy gebaseerd op MCV]] en [[Item:Q150454|Esther Venrooy gebaseerd op data.kunsten.be]]
* ...
* ...
De logische volgorde om dit aan te pakken is:
* Landen
* Locaties
* Actoren (uitvoerders én organisatoren)
* Locaties ("venues"), waarbij we moeten opletten dat we eventueel zelfs entiteiten splitsen, zodat we een apart Q-nummer hebben voor de "architecturale entiteiten" en een apart Q-nummer voor de Actoren, bv. Kaaitheater als gebouw versus Kaaitheater als Uitvoerder of Organisator. Daarna moeten we ook controleren of er geen Actoren gebruikt worden als Locatie voor een activiteit, en die dus vervangen door het overeenkomstige Q-nummer van het type Locatie. >>> DIT IS EEN GROOT WERK, zie hieronder, een aparte heading ervoor.
* Rollen
* Disciplines
* Activiteiten


==== Aanvullingen na ingest ====
==== Aanvullingen na ingest ====
Line 102: Line 111:
* Taalinfo bij podiumproducties > op niveau van productie
* Taalinfo bij podiumproducties > op niveau van productie
* Relaties tussen personen, organisaties en venues (data.kunsten.be + muziekcentrum.kunsten.be)
* Relaties tussen personen, organisaties en venues (data.kunsten.be + muziekcentrum.kunsten.be)
* Files, images
* Relaties tussen releases > ReleaseGroup introduceren?
* Bioteksten
* Files en images
* Bioteksten > naar pagina's, en dan ook een sitekoppeling
* ...
* ...


Line 126: Line 136:
==== OSLO Mapping ====
==== OSLO Mapping ====


Het datamodel in deze wikibase is compatibel met OSLO Cultuurparticipatie. Zie ook https://osloddt.wikibase.cloud/wiki/Mapping_oslo. Om dit expliciet te maken moeten de properties en de core items gelinkt worden met het OSLO Cultuurparticipatievocabularium, of andere ontologieën.
Het datamodel in deze wikibase is compatibel met OSLO Cultuurparticipatie. Zie ook https://osloddt.wikibase.cloud/wiki/Mapping_oslo. Om dit expliciet te maken moeten de properties en de core items gelinkt worden met het OSLO Cultuurparticipatievocabularium, of andere ontologieën. Zie de mappings alvast via [[Mapping_oslo||hier]]


* Linken van core items
* Linken van core items