stamboomforum

Forum logoFora » Genealogische sites en publicaties » Stoppen met het publiceren van inconsistente genealogische gegevens?

Tamura Jones heeft de laatste weken op zijn Engelstalige website Modern Software Experiencediverse artikels geplaatst over de consistentie van genealogische data. Elke stamboomprogramma moet een functie hebben om de kwaliteit van de genealogische data op consistentie te controleren, maar nog belangrijker: elke stamboomonderzoeker moet deze functie gebruiken!

Een viertal artikels in deze reeks raad ik u zeker aan:

In dit laatste artikel roept hij websites die genealogische data presenteren, zoals Genealogie Online, GeneaNet, Ancestry, StamboomNederland enz., om geen inconsistente data toe te laten op hun website. Om Tamura te citeren: "Operators of online genealogy hosting may not be able to guarantee that all data is correct, but they can guarantee that the genealogies they show to visitors are consistent."


Hoe denkt u hierover?

Bob Coret

@Bob,

Stuur deze informatie maar met spoed door naar wiewaswie.

Als er één site niet goed met gegevens omgaat dan zijn zij het wel.

Www neemt alle fouten van GenLias zonder meer over.

Zoek maar eens naar geboorten in de periode 1913 t/m 2011; geeft toch nog 3.281 hits.

Het is niet veel, maar wel TEVEEL.

Een beetje programmeur kan deze fouten zo filteren.

Jack de Mol

Veel genealogen hebben duizenden personen in hun bestanden staan, met daaraan gekoppeld vele duizenden gegevens. Het is haast onontkoombaar dat daar "inconsistencies" in sluipen. Ongehuwde moeders van 85 die nog een kind krijgen, u kent ze wel. Sommige programma's hebben de mogelijkheid om op basis van (zelf in te stellen) criteria, checks uit te voeren. Maar dat moet dan af en toe wel eens gedaan worden. Daarom kan het geen kwaad dat dit bij uploaden naar een publieke site sowieso gebeurt. Vervolgens moet de "uploader" e.e.a. natuurlijk wel bekijken en zo nodig corrigeren.Het is dan wel prettig indien de gehanteerde criteria gepubliceerd worden. De bonafide genealoog zal deze extra controle alleen maar op prijs stellen.

Overigens Bob, heet Tamuro Jones Tamura, maar dit geheel terzijde.

Peter Miebies

@Peter, thx, verbeterd!

Bob Coret

@Jack,

Ik zal een link naar WieWasWie doorsturen Blij. Je hebt zeker een punt, WieWasWie kan ook best controle uitvoeren voordat ze overgaan tot publiceren! Maar eerlijkheid gebied te zeggen: zij zullen weer wijzen naar de deelnemende archieven, want daar krijgt WieWasWie z'n data van. En archieven kunnen net als stamboomonderzoeker consistentie checks uitvoeren! 

@Peter,

Voor Genealogie Online staan de controles op http://www.genealogieonline.nl/help/item.php/222 Zou ik op Genealogie Online een stap verder moeten zetten om dergelijke inconsistente gegevens niet te publiceren?

 

Bob Coret

Zou ik niet doen, sommige zaken lijken inconsistent maar blijken het dan toch niet te zijn. Maar op zich is het natuurlijk wel een goed idee. Ik zou dan die gegevens vet maken of een kleurtje geven om duidelijk te maken dat ze mogelijk inconsistent zijn. Lijkt me een zinnige waarschuwing voor kijkers. Mogelijk moet er dan wel ruimte geschapen worden voor de inzender om aan te geven waarom hij die inconsistencies heeft laten staan.

Peter Miebies

Ben bezig voor een paar archieven de ingeklopte gegevens uit de DTB-boeken aan het controleren. Deels daarvan zijn afkomstig uit een oud programma die overgezet zijn naar het nieuwe programma. Ook bij het overzetten komen ook wat fouten voort. Die verbeter ik aan de hand van originele stukken en voeg de daarbij ontbrekende gegevens bij. Maar ook mensen die de gegevens inkloppen maken fouten, vaak doordat ze het oude schrift niet zo machtig zijn. Deze worden ook gecorrigeerd. Nadat deze zijn gecorrigeerd worden ze gelinkt aan de scans en vervolgens op internet geplaatst. Dat gebeurd ook met BS en BR. 

En deze gegevens gaan voorlopig nog niet naar WieWasWie, omdat de betreffende archieven en vrijwilligers sceptisch tegenover WWW zijn. Ze zijn gewoon amateuristisch bezig, dat al vele miljoenen euro's heeft gekost. Bij WWW zouden ze 10 jaar nodig hebben om alle fouten te herstellen.

mvg, Masje II

Masje II

@Masje II

Om de discussie niet al te warrig te maken, denk ik dat er een onderscheid is tussen fouten en inconsistente zaken. Een (tik)fout kan resulteren in een inconsistentie bv 1990 i.p.v. 1790, maar het hoeft niet 1791 ipv 1790. En Bob doelt op de eerste categorie.

Peter Miebies

Zowel stamboomonderzoekers als vrijwilligers maken fouten. De meerderheid doet dit niet moedwillig en ik  denk dat een ieder de fouten wil verbeteren.

Vraag is of - als je dit geautomatiseerd kunt detecteren - je de inconsistente gegevens nog steeds moet publiceren (met of zonder waarschuwing of foutmelding)? En dat geldt dan voor zowel archieven als websites die genealogische gegevens publiceren.

Bob Coret

@Bob,

Het is niet "www kan ook best controle uitvoeren", maar "www moet ook controles uitvoeren".

Elke schakel in de keten heeft zijn of haar verantwoordelijkheden. Afschuiven naar de vorige schakel is niet bepaald professioneel.

Het begint bij de controle tijdens en na het invoeren bij de archiefdienst. Als zij de gegevens doorgeven naar bijvoorbeeld GenLias of www dan horen weer controles uitgevoerd te worden.

Een voorbeeld in www, dat er niet om liegt:

voornaam = 'doodgeboren' en plaatsnaam = 'Rockanje'

221 hits, maar bij alle doodgeboren kinderen wordt verwezen naar een geboorteakte.

Idem bij Oostvoorne geeft 257 hits met het documenttype 'BS geboorte'.

Dit komt overigens bij meerdere plaatsen op Voorne-Putten voor.

Het regionaal archief VPR heeft hier duidelijk niets gecontroleerd toen de gegevens in GenLias werden opgenomen. Www neemt alles nogmaals klakkeloos over.

Zie ook http://www.genver.nl/zh/0598MAN.HTM en http://www.genver.nl/zh/0581MAN.HTM

Om op je laatste vraag terug te komen:

"Vraag is of - als je dit geautomatiseerd kunt detecteren - je de inconsistente gegevens nog steeds moet publiceren (met of zonder waarschuwing of foutmelding)?"

Fouten, die ontstaan zijn in de akten zelf moet je zeker (ongecorrigeerd) publiceren, maar als dit technisch mogelijk is ook een melding doen met wat er aan schort. De historie moet immers intact blijven.

Een goed voorbeeld: http://www.genlias.nl/nl/searchDetail.jsp?val=0&xtr=24241593

Inconsistente gegevens, die wel gecorrigeerd moeten worden:

De volgende persoon kan nooit overleden zijn http://www.genlias.nl/nl/searchDetail.jsp?val=0&xtr=24185580 31 april heeft immers nooit bestaan.

En het volgende huwelijk zou formeel nooit hebben plaatsgevonden: http://www.genlias.nl/nl/searchDetail.jsp?val=0&xtr=14666822 als ik de gegevens mag geloven, maar daar hebben we www.genver.nl voor.

Duidelijke voorbeelden, die bij het inlezen van data vragen om syntax-controles op datums.

Invoerfouten corrigeren of als het niet anders kan, melden wat er fout is.

Jack de Mol

Ik zou voorstander zijn van het zeer expliciet vermelden van de waarschuwing op de pagina waarin het getoonde gegeven wordt weergegeven. Op deze manier is het niet alleen voor de auteur, maar ook voor de overige gebruiker duidelijk dat extra aandacht vereist is. 

Daarbij zouden zelfs twee typen waarschuwingen gemaakt kunnen worden: onwaarschijnlijkheden (oranje) en inconsistenties (rood).  Iemand die overlijdt voordat hij/zij geboren wordt, is inconsistent.  Iemand die een kind krijgt voor het 16e levensjaar (zoals nu in genealogieonline gehanteerd wordt) is onwaarschijnlijk maar niet onmogelijk. 

Voor "onwaarschijnlijkheden" zou de auteur de mogelijkheid moeten krijgen de waarschuwing, na verificatie, niet langer te tonen.  Voor inconsistenties zou de waarschuwing altijd moeten blijven gelden totdat de aangeleverde Gedcom verbeterd is.

Daarnaast zou GenealogieOnline aggressiever kunnen zijn in "fout detectie".  Leeftijden boven de 110 worden nu niet als onwaarschijnlijk aangemerkt.  Ook zit er bij mijn weten geen check op het feit dat kinderen binnen 9 maanden na het vorige kind uit dezelfde ouders geboren worden.

Frederik

@Frederik,

Ik heb eens kritisch naar de huidige controles gekeken (zie ook http://www.genealogieonline.nl/help/item.php/222) en kan deze goed opdelen in fouten en "onwaarschijnlijkheden". Met twee type ikoontjes werken kan dus goed. Ga ik mee een de slag.

De huidige controles kijken naar de persoon zelf en z'n ouders. Nog niet omgekeerd, ouders en hun kinderen, waardoor de minimale 9 maanden check (voor de moeder) er inderdaad nog niet is. Ga ik eens naar kijken.

Als er nog meer suggesties zijn voor controles dan hoor ik die graag!

mvg,

Bob Coret

Bob Coret

Genealogie Online maakt vanaf nu onderscheid tussen fouten en onwaarschijnlijkheden (waarschuwingen).

Tevens worden de meldingen meer prominenter weergegeven. Waar er eerst alleen een ikoontje werd getoond waar je met de muis over moest "hangen" om de melding te zien, wordt er nu de complete melding getoond.

Het maakt Genealogie Online echter nog geen Inconsistent Genealogy Free Zone....

Bob Coret

Dat is een nuttige, waardevolle en verbazingwekkend snelle toevoeging!

Peter Miebies


Beste Bob,

Dat is erg snel in elkaar gezet. Klasse. 

In plaats van GenealogieOnline een inconsistent genealogy free zone te maken, kun je natuurlijk ook per gebruiker aangeven of zijn/haar genealogie vrij van inconsistenties is.  Nu met de split tussen waarschuwingen en fouten is dat een stuk makkelijker.  Op de openingspagina van een consistente genealogie zou dan een soort icoon kunnen komen (wimpel/vlaggetje/lintje) en op de openingspagina van een inconsistente genealogie een ander symbool. Kortom, goede gebruikers in het zonnetje, gebruikers met onopgeloste fouten in de hoek.

Eventuele uitbreiding van de checks op genealogie online zou kunnen zijn:

  • niet bestaande data (31 april, 29 februari in een niet schrikkeljaar, etc.)
  • als echtgenoot en echtgenote dezelfde achternaam hebben (= waarschuwing).
  • data in de toekomst (= fout).
  • een splitsing naar geslacht voor sommige checks: vader kan tot 9 maanden voor geboorte van het kind overleden zijn (= waarschuwing) maar moeder kan niet voor de geboorte van het kind overleden zijn (= fout).
  • Als de kinderen in een gezin niet gesorteerd zijn op geboortedatum. (= waarschuwing).

 

groeten,

Frederik




Plaats een reactie

Om reacties (en nieuwe onderwerpen) te plaatsen op het Stamboom Forum dient u eerst in te loggen! Nog geen lid? Registratie is gratis en snel!