Van experiment naar werking: Difference between revisions

Replaced content with "Van wikibase.cloud naar een volwaardige instantie: instance requirements, migratie, recurrente werking zie dit rich text document: https://docs.google.com/document/d/1ElbGMINovcQrmTUUrB-h1Ly1n4ky4YkVhZkhhf46fGE/edit#"
(Replaced content with "Van wikibase.cloud naar een volwaardige instantie: instance requirements, migratie, recurrente werking zie dit rich text document: https://docs.google.com/document/d/1ElbGMINovcQrmTUUrB-h1Ly1n4ky4YkVhZkhhf46fGE/edit#")
Tag: Replaced
Line 1: Line 1:
Begin april hebben we het data model voor actoren en activiteiten min of meer op punt, gebaseerd op wat ervaring en enkele voorbeelden. Tijd om te testen of dit nu ook echt werkt. De eerste stap daarvoor is om enkele basics op punt te krijgen, bv. locatiedata. Maar daarna moeten we de "actors" invoeren. En dat vergt een combinatiestap uit de verschillende legacy databanken.
Van wikibase.cloud naar een volwaardige instantie: instance requirements, migratie, recurrente werking


= Poging 2023 =
zie dit rich text document: https://docs.google.com/document/d/1ElbGMINovcQrmTUUrB-h1Ly1n4ky4YkVhZkhhf46fGE/edit#
* eerst de landen
* dan de gemeenten en steden
* dan de genres, disciplines > discipline
* instrumenten en functies uit dkb en mcv > rol
* person types uit dkb
* people uit dkb
** relatie people en person types
** relatie people en locatie
** relatie people en "discipline"
* identity types uit mcv
* aliassen uit mcv > als
* identities uit mcv
** aliassen toevoegen
** relatie identities en identity types
** relatie identities en "discipline"
** relatie identities en locatie
* organisation types uit dkb
* organisations uit dkb
** relatie organisation en organisation type
** relatie organisation en location
* organisation types uit mcv
* organisations uit mcv
** relatie organisation en organisation type
** relatie organisation en location
** relatie organisation en "discipline"
* venues uit dkb
** relatie venue en organisatie
** relatie venue en locatie
* tentoonstellingen uit dkb
** relatie tentoonstelling en activiteits/tentoonstellingstype (solo, groep, beurs, ...)
** relatie tentoonstelling en people, met rol
** relatie tentoonstelling en organisation, met rol
** relatie tentoonstelling en locatie
* residenties uit dkb
** relatie residentie en activiteitstype (residentie)
** relatie tentoonstelling en people, met rol
** relatie tentoonstelling en organisation, met rol
** relatie tentoonstelling en locatie
* podiumproducties uit dkb
** relatie productie en activiteitstype (podiumproductie)
** relatie productie en people, met rol
** relatie productie en organisation, met rol
** relatie productie en "discipline"
** relatie productie en eerdere productie (herneming)
** (niet vergeten, leeftijdscategorie)
* voorstellingen uit dkb
** relatie voorstelling en activiteitstype (voorstelling)
** relatie voorstelling en venue
** relatie voorstelling en organisatie
** relatie voorstelling en productie
* phonogrammen uit dkb
** relatie phonogram en activiteitstype (opname)
** relatie phonogram en identities, met rol
** relatie phonogram met "discipline"
* releases uit dkb
** relatie release en activiteitstype (release)
** relatie release en phonogrammen
** relatie release en identities, met rol
** relatie release en organisations, met rol
** relatie release met "discipline"
** (niet vergeten, format > CD, vinyl, ...) > kan dan later ook "digitaal" zijn
 
Wat met beelden? > onderzoeken, advies
Wat met digitale releases? > Erin steken
Wat met de concerten? > Erin steken
Wat met linken naar musicbrainz, relaties naar andere platformen, cf. spotify enzo?
 
= Poging 2022 =
 
== Ingest van Belgische gemeenten en steden ==
 
(maart 2022)
 
Op basis van ergens een lijst heb ik op 9 april 2022 belgische gemeenten en steden via quickstatements ingested. Daarbij moet er ergens iets fout gelopen zijn, want een aantal gemeenten zitten er dubbel in:
 
SELECT ?landLabel ?itemLabel (GROUP_CONCAT(?item) as ?itemURLs) (count(?itemLabel) as ?itemLabelCount) {
  ?item <http://osloddt.wiki.opencura.com/prop/direct/P1> <http://osloddt.wiki.opencura.com/entity/Q229>;
        <http://osloddt.wiki.opencura.com/prop/direct/P20> ?land.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],nl,en" . }
}
GROUP BY ?landLabel ?itemLabel
HAVING (count(?itemLabel) > 1)
 
Dit is dus een TODO om die waar nodig te mergen.
 
== Ingest van gecombineerde personen, organisaties en venues ==
 
(april 2022)
 
=== Samenstellen van de lijst ===
 
==== Uit de legacy databanken ====
 
==== Uit havelovewilltravel ====
 
=== Quickstatements ===
 
=== Types van actoren om te checken ===
 
==== Kunsthogescholen ====
 
==== Cultuurcentra ====
 
Cultuurcentra hebben vaak namen die beginnen met CC of die het woord "cultuurcentrum" bevatten. Deze query kan die helpen vinden:
 
SELECT DISTINCT ?itemLabel (GROUP_CONCAT(?item) AS ?items)
  WHERE {
    ?item <http://osloddt.wiki.opencura.com/prop/direct/P1> ?type.
    ?item rdfs:label ?itemLabel . 
    FILTER (CONTAINS(?itemLabel, "CC") || CONTAINS(?itemLabel, "Cultuurcentrum")) .
    SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],nl,en" . }
  }
GROUP BY ?itemLabel
 
Daarnaast kunnen we ook "top down" vertrekken vanuit een lijst van cultuurcentra, bv. https://nl.wikipedia.org/wiki/Lijst_van_cultuurcentra_in_Vlaanderen of https://cult.be/netwerk
 
==== Promotiegaleries ====
 
==== Gesubsidieerde organisaties ====
 
==== Platenlabels ====
 
==== Personen en organisaties ====
 
===== Aliassen =====
 
==== Venues en organisaties ====
 
== Ingest van activiteiten ==
 
(mei 2022)
 
== Leggen van relaties ==
 
(juni 2022)
 
== Dedupliceren en reconcilen ==
 
(juli 2022)