Van experiment naar werking: Difference between revisions
(→Opkuis) |
|||
Line 26: | Line 26: | ||
=== Opkuis === | === Opkuis === | ||
Een massa import gaat gepaard met ruis. Er is dus heel wat opkuiswerk nodig. We denken meteen aan de kunsthogescholen en de cultuurcentra, maar in de legacy databanken zaten ook heel wat personen of organisaties dubbel. Dan is er ook het oude zeer van organisaties die ook venues zijn in de legacy databanken, en die we nu bij mekaar brengen. | |||
==== Kunsthogescholen ==== | |||
==== Cultuurcentra ==== | |||
==== Personen en organisaties ==== | |||
==== Venues en organisaties ==== | |||
== Ingest van activiteiten == | == Ingest van activiteiten == |
Revision as of 10:41, 9 April 2022
Begin april hebben we het data model voor actoren en activiteiten min of meer op punt, gebaseerd op wat ervaring en enkele voorbeelden. Tijd om te testen of dit nu ook echt werkt.
Ingest van Belgische gemeenten en steden
Op basis van ergens een lijst heb ik op 9 april 2022 belgische gemeenten en steden via quickstatements ingested. Daarbij moet er ergens iets fout gelopen zijn, want een aantal gemeenten zitten er dubbel in:
SELECT ?landLabel ?itemLabel (GROUP_CONCAT(?item) as ?itemURLs) (count(?itemLabel) as ?itemLabelCount) { ?item <http://osloddt.wiki.opencura.com/prop/direct/P1> <http://osloddt.wiki.opencura.com/entity/Q229>; <http://osloddt.wiki.opencura.com/prop/direct/P20> ?land. SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],nl,en" . } } GROUP BY ?landLabel ?itemLabel HAVING (count(?itemLabel) > 1)
Dit is dus een TODO om die waar nodig te mergen.
Ingest van gecombineerde personen, organisaties en venues
Samenstellen van de lijst
Uit de legacy databanken
Uit havelovewilltravel
Quickstatements
Opkuis
Een massa import gaat gepaard met ruis. Er is dus heel wat opkuiswerk nodig. We denken meteen aan de kunsthogescholen en de cultuurcentra, maar in de legacy databanken zaten ook heel wat personen of organisaties dubbel. Dan is er ook het oude zeer van organisaties die ook venues zijn in de legacy databanken, en die we nu bij mekaar brengen.