stamboomforum

Forum logoActualiteit en nieuws » LINKS: een reconstructie van alle negentiende en vroeg-twintigste eeuwse families in Nederland


Profiel afbeelding

Via de website van het IISG, het Internationaal Instituut voor Sociale Geschiedenis in Amsterdam, kwam ik op het spoor van een interessant project dat van 2009-2012 lopen zal.

"LINKS beoogt een reconstructie van alle negentiende en vroeg-twintigste eeuwse families in Nederland. De basis voor deze reconstructie wordt gevormd door GENLIAS, de index op de akten van de burgerlijke stand zoals die in de openbare archieven van Nederland worden bewaard. Gedurende de laatste vijftien jaar werkten talrijke vrijwilligers aan de totstandkoming van deze index. Deze bevat niet alleen de namen van geborenen, overledenen en gehuwden maar ook die van de ouders, geboorteplaatsen, leeftijden en veelal het beroep.

De beschikbaarheid van deze dataset biedt een enorm potentieel voor wetenschappelijk onderzoek, mits de individuen aan elkaar worden gelinkt tot families. Hierbij moet niet alleen gedacht worden aan de historische demografie en de sociale en economische geschiedenis maar ook aan naamkunde, epidemiologie, antropologie, historische sociologie en genetica. Vanwege de hoge mate van fuzzyness van de voor- en achternamen (als gevolg van fouten, verkeerde opgaven en inconsistenties tijdens de registratie, regionale afwijkingen, fouten bij het indexeren, etc.) is dit linken niet vanzelfsprekend. Het informatiseringdoel van LINKS is drieledig: a) de bouw van een dynamische parser die de input van GENLIAS omzet naar gestandaardiseerde eenheden, b) de bouw van nominal record linkage procedures met zelflerende capaciteiten en c) de bouw van een retrieval systeem inclusief GIS-referenties en visualisering waarmee de wetenschapper zijn benodigde data kan selecteren. Omdat de database van GENLIAS continu wordt vernieuwd en uitgebreid, voorzien we jaarlijks een nieuwe release van LINKS met familiereconstructies, niet alleen voor wetenschappers, maar ook voor de GENLIAS gemeenschap.

Het project is een samenwerking tussen het IISG, het LIACS (Leiden Institute of Advanced Computer Science), het Meertens Instituut, de VKS (Virtual Knowledge Studio)."

Een engelstalige omschrijving van het project kan worden geraadpleegd via www.iisg.nl/~hsn//documents/links-project.pdf

Mgr Dirk van Leeuwen

Wat een gigantisch veelomvattend project! Hartelijk dank voor uw melding!

sacha vries

Heel gaaf...en dat werdt tijd! Men had de gegevens eigenlijk openbaar moeten maken (b.v. een DVD kunnen bestellen met de data van genlias) zodat software developers daar gewoon mee aan de slag kunnen.

Gerrit van Doorn

Ik vraag me sterk af wat we hier nou mee moeten. Gaat straks de software bepalen wie familie is, wie niet? Dat kunnen wij toch zelf veel beter?

Even zonder gekheid: Er is een aantal jaren geleden in soc.genealogy.benelux een discussie gestart door Don Arnoldus over een GIN, een Genealogisch IdentificatieNummer, zeg maar een soort sofi-nummer voor onze voorouders. Ik heb daar zelf ook fanatiek aan meegedaan, en indertijd heeft Bob Coret ook al aangeboden om daaraan mee te werken. Het IISG bleek toen achter de schermen ook al in beeld te komen, en voor wie tijd heeft is het wel aardig om die oude discussie nog eens na te lezen.

Wat daar beschreven werd werkt nu al bij de LDS. New FamilySearch heeft een centrale database, waarin feitelijk 1 grote stamboom staat, en dankzij web 2.0 kan iedereen straks direct vanuit zijn eigen software kijken of er overeenkomsten zijn, en ook gegevens toeveoegen. De centrale software houdt daarbij alles bij, en laat ook eerlijk zien wie er bij een bepaalde persoon denkt aan te kunnen sluiten, zonder dat je de gegevens van een ander weg kunt drukken. Onderzoeksgegevens worden zo eerlijk gedeeld, en conflicten blijven zichtbaar, zodat je zelf kan beoordelen hoe waardevol de informatie is.

De toegang is nu nog voorbehouden aan de leden van de kerk, maar een deel van de Amerikaanse software is al aangepast, en bij Ancestral Quest kan je ook al in een fimpje zien hoe het een en ander in zijn werk gaat.

De technologie is open, en dat betekent dat een koppeling dus ook in Aldfaer aangebracht zou kunnen worden, of in Gramps, of welk programma je maar wilt. Het zal denk ik wel Windows, Mac of Linux moeten zijn, omdat je anders wel veel werk krijgt aan dat web 2.0.

Hoe dan ook, het meeste is er al, dus waarom opnieuw moeilijk doen op zijn Nederlands?

P.S. Het in kaart brengen van de geschiedenis lijkt me wel waardevol, maar ook dan vraag ik me af waarom dat weer in een apart project moet. Hebben we nog niet genoeg van dit soort sites in Nederland?

Enno Borgsteede

Voor de genealogie zal een dergelijk systeem volstrekt waardeloos zijn. Met een handmatig GIN kan het nog enigszins werken, maar wij maken niet meer mee dat een computer uit de gegevens van Genlias een foutloze parenteel kan maken. Dat kunnen mensen niet eens. Daarvoor veel meer nodig. Denk maar eens aan kinderen  van ongehuwde moeders, waar je soms (maar vaak niet eens) uit de namen van aangevers en adres op de originele geboorteacte iets kunt raden. Verder verschillen per archief de beschikbare gegevens, dus interprovinciaal is er ook allerlei ruis. Om nog maar te zwijgen van internationale relaties zoals die in Zeeuws Vlaanderen in de tijd dat Belgie nog niet bestond. Een computer kan veel tegenwoordig, maar nog veel meer niet. "Razensnelle idioot" is nog altijd een prima definitie van computer.

Voor wetenschappelijke onderzoeken zal het systeem wel kunnen werken. Daar valt met een foutenmarge te leven. Ik vrees echter dat een link van het IISG al spoedig ook binnen de genealogie zijn eigen leven gaat leiden ("de computer zegt het, en die maakt geen fouten", ik hoor het ze al zeggen).

Bram

Precies. Nu maar hopen dat Bob zich die oude discussie nog herinnert. Het zou wel aardig zijn om hier op de site alvast personen uit de diverse stambomen te matchen.

Enno Borgsteede

Het projectplan (voor de link zie boven) geeft de volgende aanpak weer:

"The basic problem that has to be solved is the identification of individuals and their family relations on the basis of the civil records. This process, referred to as nominal record linkage, is complicated because names cannot be used as unique identifiers for persons. One and the same person may occur with different names, and a single name may refer to many persons."

en

"The basis for our linking process will be the combination of the names of couples: bride and groom, mother and father. Because in the Dutch civil administration everyone (also women) keeps his or her first name and surname given by birth, the combination of names of married couples are quite unique, especially if linking can be limited within ranges of time bounded by years of birth, periods of reproduction and life span. The combination of the full names of a couple forms the spine of our family reconstruction, as the parents need to be mentioned in records of birth, marriage and death. We link a) marriages to marriages (bride and groom to the marriage of their respective parents), forming pedigrees, b) births to marriages (of parents) forming families and c) deaths to marriages (with spouse(s) and from parents) forming small life histories. In general we will work by linking couples of two (married) persons. Linking birth certificates with marriage and death certificates will even use combinations of three to four names: own name, name of spouse and names of the parents."

Mgr Dirk van Leeuwen

ik hoop dat dit project dan heel wat degelijker wordt aangepakt dan met het inbrengen van de basisgegevens is gebeurd en dat men nu de kwaliteit primair stelt en niet de snelheid van verwerkelijking.

Mooi zou zijn als dan direct de overgeslagen controle bij het inbrengen van de gegevens wordt medegenomen en deze activiteiten zouden leiden tot correctie van alle onnodige fouten, die bij het inbrengen zijn gemaakt.

Fred Bergman

Wij allemaal weten dat veel wetenschappelijk onderzoek leidt tot een conclusie die, zonder dat wetenschappelijke, ook al bekend was. Je bent geneigd om te roepen: werkverschaffing en geldverspilling.

Zoals hiervoor reeds is gesteld, zijn de gegevens in Genlias helaas niet foutloos. Het is en blijft mensenwerk.

Buiten de fouten die de vele vrijwilligers hebben gemaakt met het overnemen van de gegevens, hebben ook nog ambtenaren fouten gemaakt.
Zeker in de tijd, dat men alles nog "van horen zeggen" had.
Velen konden hun eigen naam niet schrijven. Daarbij voegen we de vele dialecten toe en ja, hoe heette je dan, Arris of Erris?

En was je naam Willemina, Wilhelmina, Willemijn, Mijntje, Mina of Mien?

Ik denk dat velen van u voorbeelden kent uit de eigen omgeving.
Om twee voorbeelden te geven met achternamen.
Het eerste.
Frans de Bree ~ op 04-03-1795 te Amersfoort ? op 01-07-1882 te Amersfoort X 13-02-1818 te Leusden met Aaltje Wandertse ~ op 26-07-1795 te Leusden ? op 07-04-1873 te Amersfoort.

En om de achternaam van Aaltje gaat het.
Zij komt voor met de volgende achternamen:
Wanderse (bij geboorten van Hendrina, Evert en Ar(r)is), Wanner (bij de geboorte van Everarda), Wannardsen (bij de geboorte van Gerarda), Wannars ( bij de geboorten van Jan, Cornelia en Jannetje) en Wanners (bij de geboorten van Elbarta Wilhemina, Hendrik en Alijda).

Het tweede.
Hierbij vindt u een plaatje met een door mij gemaakte mogelijke schrijfwijze van een naam. Dit uitsluitend om te laten zien welke kanten men op kan met een naam.

Johanna van Nus

Haar doopnaam is Joanna en haar vader heet Jan Matijs van Nus.

Joanna van Nus komt ook voor als Johanna van Us, Johanna Eus, Johanna Verneus en Johanna van Nies.

Nu moet ik toegeven, tegenwoordig kan men zeer veel met geavanceerde programmatuur, maar volgens mij mist men nog steeds de interpretatiemogelijkheid, die het menselijk brein heeft.

Zoals velen van u weten, ontbreken er nog vele gegevens in Genlias. Van vele gemeenten zijn de aktes nog niet geindexeerd.

Als het wetenschappelijk onderzoek er toe bijdraagt dat de ontbrekende gegevens versneld ingevoerd worden, dan moeten wij dit initiatief zeker toejuichen.
Als dan ook nog scans van de beschreven aktes er aan gehangen worden, kunnen wij - als gebruiker - de eventuele invoerfouten rechtzetten.

Men stelt dat het onderzoek van de familierelaties gebaseerd zal worden op de combinatie van achternamen van vader, moeder, geboortedatum enz.
Nou dan hebben ze aan Friesland een hele kluif. Bij vele ontsluitingen ontbreekt de familierelatie in de beschrijving.

Om maar niet te spreken over bovenstaande voorbeelden, die ongetwijfeld in vele families zullen voorkomen.

Met vriendelijke groet,

PJ

P.J. de Bree

Fantastisch dat men zoiets probeert te realiseren maar wat hebben wij,als amateur-genealogen, hieraan?

Als ik kijk naar het drieledige doel begrijp ik daar, als A-technische computergebruiker, helemaal niets van. Als Genlias de bron wordt, zal het niet altijd compleet zijn daar er nog genoeg gemeenten in Nederland zijn die niet aan Genlias leveren b.v. de gemeente Den Haag. Dit gem. archief is, v.w.b. publicaties van de B.S. gigantisch groot en het zou toch een van de voorwaarden moeten zijn dat alle grote gemeenten aan Genlias gelieerd dienen te zijn. Dan zou men pas kunnen spreken van een geslaagd doel. Voor de wetenschappers onder ons zal dit wel een super project zijn en ik wens ze dan ook alle succes toe. Ik hoop alleen dat het Centraal Bureau voor Genealogie hierin ook mee zou kunnen participeren want ik denk dat alle knowhow welkom is.

Wim Kreffer

Als je op de weblog van Bob kijkt, zie je dat hij aan dit onderwerp ook al een kritisch woord gewijd heeft, en zelf denk ik ook dat ze zonder inbreng van gebruikers niet veel zullen bereiken. Daarnaast is het aantal medewerkers dat ik in de plannen zie ook wel heel klein.

Daarom heb ik zoals gezegd meer belang bij New Familysearch als dat voor gewone mensen open wordt gezet, en bij een site als WeRelate.org, die al een tijd bestaat. Ik heb bij die laatste gisteren een deel van mijn gegevens neergezet, en ik ga daar de komende dagen nog wat verder mee testen.

Enno Borgsteede

Professor Mandemakers deelt mij het volgende mede: "Binnen het kader van 'Mijnvoorouders.nl', de beoogde opvolger van het huidige GENLIAS, zullen we de resultaten (gelinkte akten) door gaan geven. Daarnaast zullen we ook gebruik gaan maken van internet voor informatie e.d., we zullen daar t.z.t. op terug komen (het project start niet voor 1 april)."

Mgr Dirk van Leeuwen

ik heb een deel van mijn geneologische resultaten ook geprobeerd via WeRelate.org en ik geloof wel in die opzet. Het verkeert nog in het beginstadium, het is nog niet echt idiotproof en ook niet gebruikersvriendelijk, met name updaten kan nog niet automatisch, maar moet manueel geschieden.

Er zijn automatische koppelingen ingebouwd voor het juist weergeven van alle plaatsen in de juiste landen en dat loopt erg leuk. Alle personen met de afkorting NL voor nederland, worden automatisch geplaatst in Midden Amerika. Bovendien lopen er nog al wat talen dwars door elkaar heen en laat men bij de adellijke voorouders hoofdzakelijk de engelse namen prevaleren en met name de informatie uit de Engelse Wikipedia wordt min of meer als heilig beschouwd.

Fred Bergman

@ Mgr Dirk van Leeuwen: Grappige datum, hoe komen ze er op!

LINKS - een nobel streven

Aan een ieder,

Al eens de volgende pagina bekeken? http://www.nwo.nl/nwohome.nsf/Pages/NWOA_7M9MPU

Daar is ondermeer het onderstaande te vinden:

"Vanaf 1811 is van iedereen in Nederland de akte van geboorte, huwelijk en overlijden bewaard gebleven. De personen om wie het gaat, worden door talloze vrijwilligers gedigitaliseerd in GENLIAS. Door deze personen aan elkaar te linken, is een schat aan kennis af te leiden op het terrein van bijvoorbeeld de historische demografie (kindersterfte), historische sociologie (sociale mobiliteit) en de epidemiologie en de genetica. Bij dat linken wordt rekening gehouden met bijvoorbeeld verkeerde schrijfwijze en regionale afwijkingen in de namen.
Het project LINKS beoogt de reconstructie van alle families in Nederland uit de negentiende en begin twintigste eeuw, daarbij onder andere gebruik makend van 'fuzzy' matching en self learning-technieken.

Hoofdaanvrager: prof. dr. Kees Mandemakers (Internationaal Instituut voor Sociale Geschiedenis, IISG, Erasmus Universiteit Rotterdam)
Partners: IISG, Universiteit Utrecht, Virtual Knowledge Studio (KNAW), LIACS (Leiden Institute of Advanced Computer Science, Universiteit van Leiden), P.J. Meertens Instituut, Nederlands Interdisciplinair Demografisch Instituut (NIDI), Historisch Centrum Overijssel (HCO) en Tresoar (Friesch historisch en letterkundig centrum).

Voortraject en vervolg
In april 2009 heeft NWO 29 vooraanmeldingen ontvangen op de gepubliceerde Call for Proposals. Daarvan kregen dertien aanvragers een positief advies om hun onderzoeksvoorstel uit te werken. Op basis van het advies van de International Scientific Advisory Board besloot de stuurgroep om bovenstaande vier onderzoeksvoorstellen te honoreren.
De kwaliteit van de aanvragen en het aantal vooraanmeldingen geven aan dat er in het veld duidelijk behoefte bestaat aan het onderzoek en de resultaten uit het CATCH-programma. Vervolgfinanciering voor een volgende ronde is dan ook zeer gewenst."

Ik heb zo'n idee dat ik het eerste gedeelte verkeerd lees.
Worden er nu voor het project een paar families uitgekozen en de gevonden personen gedigitaliseerd opgenomen in GENLIAS? (Wat men er ook mee bedoeld).

Als eindgebruiker heb ik begrepen dat GENLIAS niet meer dan een index is op papieren aktes van geboorte, trouw en overlijden.

Kunt u mij wijzer maken? Graag!

Met vriendelijke groet,
PJ

PS. Let vooral op het jaartal in het "Voortraject en vervolg". Aangezien de inschrijving gesloten is, hebben ze gelijk, maar of je dat in december 2008 zo moet schrijven is een tweede.

P.J. de Bree


Dag Fred,

Dus jij bent die gebruiker Bergsmit die daar zit. Handig om te weten. Ik ga er zelf wel mee door, omdat ik het heel interessant vind, maar het zou misschien nog mooier zijn als we een groepje hier in Nederland zo gek krijgen om de software van WeRelate.org hier ergens te draaien.

Zelf ben ik overigens plan om mijn stamboom daar af en toe gewoon helemaal weg te gooien en dan opnieuw vanaf GEDCOM in te laden. De matches met de anderen maak ik dan gewoon opnieuw.

vriendelijke groeten,

Enno

Enno Borgsteede
Dit onderwerp is gesloten, omdat de gebruiker die dit onderwerp startte zich heeft uitgeschreven. U kunt dus niet meer reageren.