Oproep: maak uw bronbewerkingen openbaar » Archiefinstellingen, bronnen en inventarissen

Ik loop er, naarmate mijn onderzoek vordert, steeds vaker tegenaan: Heel veel van het archiefspit- en transcriptiewerk dat ik nu doe, is al eerder door anderen gedaan. De ene keer blijkt zo'n bronbewerking getypt ingebonden in een boekenkast van een archief te staan met een nietszeggende titel, dan weer losbladig typwerk voorin een archiefmap met brieven, dan weer blijkt er een CDROM ooit gemaakt te zijn door een voor Google niet meer vindbare uitgever die nergens te koop is, of waar ik maar 1 exemplaar van in 1 bibliotheek ver weg kan vinden, of die nog wel te koop is maar met gruwelijk verouderde software werkt. En wie weet wat er allemaal nog aan fantastische bronbewerkingen op privé computers rondslingeren, wachtend op een virus of gecrashte harde schijf?

Come on, dit is 2016, pubers worden rijk door op Youtube te laten zien welke sokken ze gekocht hebben, verstandige webshops verdienen soms meer aan de data die ze via cookies vergaren dan aan hun eigen producten. Meneer Coret verdient zonder twijfel ook geld aan zijn Open Archieven en ik zal de laatste zijn om 'm dat kwalijk te nemen. Open, online vindbare data is een zegen voor ons allen!

Wordt het niet eens hoog tijd dat er een website komt waar iedereen zijn/haar bronbewerkingen naartoe kan uploaden, of het nu TXT, DOC, PDF, DB2, of welk ander format dan ook is, die dat keurig indexeert en misschien zelfs uit de wereldwijde beschikbaarheid meer geld genereert voor de uploaders dan wat ze nu verdienen aan het thuis "veilig" verdedigen van hun auteursrecht?

De meeste uploaders zullen zich uiteraard niet rijk hoeven te rekenen. Zo krijg ik gemiddeld eens per jaar een euro of 2 van Google voor een blog dat ik ooit gepubliceerd heb. Een belangrijker drijfveer lijkt me elkaar te helpen. En heel misschien kunt u 't ook van de groene kant bekijken, het kan ons allen een hoop tijd en reiskilometers schelen.

Helaas zie zelf geen kans om zo'n platform op te zetten, maar als we hier met ons allen enthousiast genoeg zijn, is er vast wel iemand (hr Coret, luister u mee?) die de draad oppakt. Wat dan nog rest is het opentrekken van kasten en laden...

Maggy - 25 jul 2016 - 11:02

Volgens mij is er al zoiets wat je bedoelt. Wel niet helemaal compleet naar mijn idee, Maar je heb helemaal gelijk. zie http://www.geneaknowhow.net/digi/bronnen.html

J. van der Linden - 25 jul 2016 - 15:58

mn telefoon liep vast bij een lang bericht, wil het later nog verder uiteenzetten masr toch in t kort: geneaknowhow is fantastisch, maar kan natuurlijk niet garanderen dat bronnen blijven bestaan. CDs zijn echt verschrikkelijk. Denk dat een doneerknop al best wat op zou leveren bij n online plaatsing, zou er zelf best een euro of 2 voor over hebben als ik wat kan vinden in zo'n bron :). Probleem zit m.vooral in bestandsformaten (openarch werkt namelijk door de uniformiteit). Er is wel een algemeen xml-formaat, maar dat moet je de gemiddelde mens niet aan willen doen, zal iets op verzonnen moeten worden. Dan is het ook allemaal wat beter doorzoekbaar. Mijn onderzoeken ga ik dit jaar wss wel CcBy/Open publiceren. :) - vanaf mn mobiel

Willem R. J. Vermeulen - 25 jul 2016 - 22:01

Inderdaad. God mag weten wat er allemaal rondzwerft. Al die cd'tjes en kleine boekjes en tijdschriftjes her en der en overal en nergens; we weten de helft niet. Wie uitgeeft in eigen beheer kan ook PDF uploaden naar de Koninklijke Bibliotheek, dan is het tenminste landelijk (en zelfs wereldwijd) bereikbaar.

Leo Bijl - 25 jul 2016 - 22:29

Dit bericht ben ik juist gaan schrijven na een paar uur spitten op geneaknowhow. De verzameling van kennis over wat er allemaal gepubliceerd is aan o.a. CD ROM en websites is natuurlijk een van de vele fantastische initiatieven, maar mijns inziens totaal niet meer van deze tijd. Veel van de genoemde bronnen zijn niet of nauwelijks terug te vinden. Niet links naar websites en namen van CDROMs, maar 't materiaal zelf verzamelen en dan graag heel slimme software gebruiken die zorgt dat elke vorm van aangeleverd materiaal direct online wordt omgevormd in een doorzoekbare vorm. En er een verdienmodel aan hangen om mensen aan te moedigen om hun data te delen. Al is het maar een cent per klik. Youtube vloggers worden rijk van een cent per klik. Ook het klakkeloos doorsluizen, ge-uploade PDFs als PDF weer laten downloaden, ge-uploade gedcoms als gedcoms laten downloaden etc werkt niet. Allereerst is de doorzoekbaarheid dan nog altijd veel te beperkt, maar ook houden dan nog altijd veel te veel mensen halstarrig vast aan hun prive-auteursrecht en zien het totaal niet zitten dat hun hele noeste werk ongecontrolleerd en onbetaald een eigen leven kan gaan leiden.

Online doorzoekbare data MET een verdienmodel voor de uploaders, daar gaat 't mij om.

Maggy - 26 jul 2016 - 12:39

Bedoel je zoiets als ik op mijn website doe? In principe komen er door de jaren veel DTB-index gegevens en gezinsreconstructies bij...

http://www.berryvanosch.net/index.php?option=com_content&view=article&id=68&Itemid=53

Berry van Osch - 27 jul 2016 - 15:36

Hallo Maggy,

Ik deel je gevoel al 30 jaar (ver voordat internet was uitgevonden). Daarom besteed ik nu elke vrije minuut om bronnen online beschkbaar te maken. Zie http://www.bonmama.nl En door alle personen in deze bronnen te koppelen aan een centraal genealogisch bestand ontvouwt zich de geschiedenis automatisch en eenduidig. Zie verder http://www.bonmama.nl/visie.html.

Helmuth Rijnhart - 28 jul 2016 - 20:03

Dat is een bijzonder indrukwekkende opzet....... niet in de laatste plaats door de macht aan werk die erin zit. Zoiets voor een hele provincie.....of zelfs het land.

Leo Bijl - 29 jul 2016 - 23:41

Bonmama en Berryvanosch zijn twee uitstekende stappen in de goede richting. En de visie pagina op bonmama sluit naadloos aan op wat ik voor ogen heb. Het idee van een Historisch Burger Service Nummer (HBSN) is op zich prima, maar op landelijke schaal enorm oppassen dat je je niet op glad ijs begeeft. Zeker in families waarin verschillende takken dezelfde vernoemingen gebruiken. Ik zie dit zowel in mijn vaders als moeders families, heel veel mensen hebben (ook gelijktijdig, ook in de zelfde plaats) Christiaan Louis Rond of Frederik George Lodewijk du Mée geheten.

Deze twee initiatieven, en veel andere lopende zoals VeleHanden en noem ze maar op, zijn allemaal stappen in de goede richting, ondanks dat ze verspreid over een groot aantal websites staan. Er zou nou's serieus werk gemaakt moeten worden met het bundelen. Maar belangrijker vind ik dat eigenlijk niemand weet of hij/zij dubbel werk zit te doen. Er is al zo verschrikkelijk veel op papier en op datadragers aan bronbewerkingen die niet of nauwelijks vindbaar zijn. Als die allemaal opgediept en gebundeld zouden kunnen worden, zou dat een enorme sprong voorwaarts zijn.

Zal me voorlopig een biet zijn als ik daar bijvoorbeeld 20x mijn opa (FGL du Mée) in 20 verschillende hoedanigheden (geboren, gehuwd, gemobiliseerd, vader, werknemer etc) met de hand tussen honderden vermeldingen van naamgenoten uit zou moeten vissen. Vooralsnog ben ik hem nog maar 3x online tegengekomen, waarvan 2x met fouten, in drie genealogieën op verschillende websites die inmiddels al niet meer bestaan. Dus prioriteit één is mijns inziens het bijeen harken van bronbewerkingen, op een site die voor zichzelf en voor de bronbewerkers een verdienmodel biedt. Voor zichzelf om continuiteit te kunnen waarborgen, voor de bronbewerkers om ze aan te moedigen om hun bronbewerkingen tevoorschijn te toveren.

Op de tweede plaats komt dan het per record doorzoekbaar maken. Voornamen, achternamen, patronymen, datering, plaatsnamen markeren. Op heel veel sites word ik er gek van als ik op achternaam Rond probeer te zoeken, dat ik heel veel mismatches krijg van personen die ROND die-en-die datum dit-en-dat deden. De achternaam du Mée is iets minder mismatch gevoelig maar levert nog vaak venDUMEEsters op, of zinnen waarin de woorden DUS en MEER voorkomen. Allemaal lastig, maar liever dat soort mismatches in beschikbare, vindbare, doorzoekbare, bronbewerkingen dan potentieel prachtige maar totaal onvindbare bronbewerkingen in boekenkasten en op onvindbare CDROMs.

Als die centrale vergaarplaats van bronbewerkingen eenmaal een feit zou zijn en lekker vol zou zijn gelopen met data, als vervolgens de doorzoekbaarheid verbetering op gang komt, dan kan eventueel heel voorzichtig een beginnetje gemaakt kunnen worden met het koppelen van zoiets als een HBSN. Of ik dat voor heel Nederland ooit verwezenlijkt ga zien betwijfel ik. Maar elk stapje in de goede richting is er eentje

Maggy - 5 aug 2016 - 14:32

De archieven (en dan allemaal, maar niet alleen zij) zouden eens moeten beginnen met de catalogus van hun bibliotheek, die ze toch allemaal hebben, te koppelen aan World Cat. Dan wordt het harken (of dreggen in de sloot) al veel efficiënter. Dan moet eigenlijk iemand ook die boekenkasten gaan digitaliseren, m.n. dan de getypte katerntjes van iemand die tientallen jaren geleden noest registers heeft zitten overnemen. Vergeten geraakt, maar zo kan het nieuw leven krijgen. Daar zou ik de KB met Delpher graag een rol in zien spelen. Copyright kan een obstakel zijn, maar als de bewerkers nog leven, vinden ze het vast heel erg leuk. En anders kan het beperkt zijn tot het gebouw van de KB.

Leo Bijl - 5 aug 2016 - 15:28

Blij dat ik op deze thread geabonneerd ben! Voor m'n scriptie heb ik de Burgerlijke Stand van Rotterdam + het werkgebied van het Regionaal Archief Tilburg volledig aan elkaar gekoppeld, met de computer. Ongeveer 10% van de gezinnen bevat een vorm van een fout (dus een kind dat mist of een overlijden ofzo), maar dat zou door nog betere naammatching naar 3% gebracht kunnen worden. In principe kun je iedereen in de Burgerlijke Stand dan een HBSN toekennen, waarbij natuurlijk wel gezegd moet worden dat de nodige fouten er nog handmatig uit zouden moeten worden gehaald.

Het kost wel ongelofelijk veel tijd om de juiste combinaties te laten berekenen, maar met een beetje mazzel (en energie) moet dat dit jaar nog wel lukken :-). In feite zou ik nu al HSBNs kunnen toekennen aan ongeveer 1.6 miljoen mensen :-).

Wat ik heel graag toe zou willen voegen is dat veel data helaas wel getranscribeerd wordt, maar dan in PDF'jes eindigt, zoals bijvoorbeeld bij Geneaknowhow. Een database is veel handiger, zeker als je taken zou willen automatiseren. (Dus zoals bij Bonmama.) Een probleem wat buiten de Burgerlijke Stand (met name) optreedt is dat je veel minder informatie hebt: als iemand trouwt, wie is dat dan? In de burgerlijke stand kun je dan vrij makkelijk een koppeling naar de namen van beide ouders maken.

Qua bronbewerkingen harken: geneaknowhow is best een goed initiatief. Het is echt wel zo dat ik merk dat ik online genealogieën eigenlijk nooit vertrouw, mede omdat er gewoon niet of nauwelijks nette bronvermeldingen bij staan. Zelf vind ik het ook lastig om de informatie correct bebrond op het internet te zetten, omdat er (helaas) genoeg mensen zijn die zomaar je stamboom overnemen en als eigen werk claimen, zonder net te documenteren.

Willem R. J. Vermeulen - 5 aug 2016 - 15:49

Zowel bij geneaknowhow als bij Worldcat kun je (van een redelijk beperkt deel van alle bestaande) bronbewerkingen vinden dat ze bestaan, dat is nog een fiks aantal stappen van ze ook werkelijk kunnen raadplegen, laat staan dat ze online fatsoenlijk te doorzoeken zouden zijn. Bij Geneanet of op Worldcat vermeld staan levert weinig eer en zelden verdiensten op, het lokt niet.

Willem, als iemand trouwt, heb je meestal met twee mensen te maken. Al gebeurt het ook nog wel eens dat meerdere mensen uit familie A met verschillende leden van familie B trouwen, beperkt de combinatie A-B en B-A de foutkans behoorlijk. Er zijn heel wat bronbewerkingen, zoals Raad van State, VOC etc, waarbij per record maar 1 persoon genoemd staat, dan is het soms echt detectivewerk om te kunnen bewijzen dat je het juiste hondje Fikkie aan de staart hebt. Daar helpt ook mijn idee niet bij, ook HBSN is pas toe te kennen na afloop van het detectivewerk...

Maggy - 5 aug 2016 - 17:24

Het probleem bij de huwelijken ligt m er vooral in dat een dtb-huwelijk (eventjes getuigen daargelaten, als je daar echt slimme dingen bij verzint kom je er waarschijnlijk ook wel, maar dan zijn we heel wat tijd verder) een partner praktisch gezien ook "een persoon" is, en als je dan Maria Jansen heet o.i.d. is het lastig zoeken. Probleem is ook het al dan niet gebruiken van patroniemen, zeker ook omdat sommige archieven niet netjes een kolom "patroniem"hebben, maar Jansen dan doodleuk als achternaam plaatsen (ook als dat dus een patroniem is, en geen versteend patroniem).

Mee eens over geneaknowhow: naast dat de site wat outdated is, heb je amper overzicht van wie jou nu eigenlijk aan het helpen zijn (met hun indices), een site als velehanden voegt door een puntensysteem toch ook een soort competitie-element toe!

Willem R. J. Vermeulen - 5 aug 2016 - 17:29

Voor mij is de essentie van het HBSN dat je personen in bronnen na identificatie eenduidig koppelt aan een centraal genealogisch bestand, waardoor die conclusie bewaard blijft, en daardoor ook de directe link naar de bron.

Dat je dat centrale genealogische bestand gedeeltelijk geautomatiseerd kunt genereren en dat je de Burgerlijke Stand vervolgens ook gedeeltelijk geautomatiseerd kunt koppelen dat is mooi meegenomen (als eenmalige actie), maar op het grensvlak van de zekerheid (die resterende 3% of 10% van de akten) zullen er volop discussies ontbranden. En dat is niet erg; dat is altijd al een van de charmes van de genealogie geweest. Tegelijkertijd zullen de informatici zich terugtrekken uit deze tak van sport en dan gaan we -zoals Maggy terecht aan geeft- aan de slag met al die andere bronnen waarin de personen zonder partners en ouders, zonder plaats en datum van geboorte en dikwijls zonder volledige voornamen staan aangegeven. Dan wordt het -als vanouds- combineren van informatie op basis waarvan we een conclusie trekken. En dat feit bezegelen we dan weer door het HBSN in die bron te zetten.

Trouwens: dat geldt zeker ook voor de Burgerlijke Stand! Alle aangevers en getuigen willen ook graag aan de vergeteldheid worden ontrukt!

Gelukkig maar dat we onze geliefde bezigheid niet in een vloek en een zucht geautomatiseerd gaan opheffen!

Helmuth Rijnhart - 5 aug 2016 - 19:21

Helmuth, helemaal mee eens, genealogie is er echt veel te leuk voor :-). Ik denk dat ik hierin je mening volledig deel. En inderdaad: op een gegeven moment is het gewoon ook niet meer te automatiseren, het is een veel te complex proces. Ik denk voornamelijk dat een automatisering van de Burgerlijke Stand een soort "kritieke massa" meegeeft aan zo'n project, want iedere genealoog met Nederlandse roots heeft dan in ieder geval zijn / haar voorouders in zo'n bestand staan (dus je hoeft niet meer vanaf nul te beginnen, wat denk ik de burger moed geeft, om het zo even uit te drukken).

Dat bronnen combineren is heel erg waardevol, dan kunnen er bijvoorbeeld beroepen worden toegevoegd, evenals adressen. Persoonlijk vind ik het heel erg jammer dat getuigen etc. nooit goed geindexeerd zijn.

Overigens heeft deze thread me wel even goed aan het denken gezet; ik zal proberen om alle feiten ook netjes met een volledig citaat (inclusief inventarisnummers en weet ik al wel niet meer) te verwerken.

Willem R. J. Vermeulen - 5 aug 2016 - 19:41

De wetenschap speelde al eens met dit idee, maar later heb ik niks meer van gezien: http://www.iisg.nl/hsn/news/links-project-nl.php

Leo Bijl - 5 aug 2016 - 21:05

Ja, klopt! In januari heb ik nog met de leider van dat project gepraat, hij vertelde ook dat ze de site eigenlijk niet zo goed up-to-date hielden.

Voor de liefhebbers overigens een print screen van de 'scriptie'versie van de database, met alle personen binnen 4 relaties afstand van een bepaald persoon:

Willem R. J. Vermeulen - 5 aug 2016 - 21:19

Ca twee jaar geleden was Gerrit Bloothooft van de Universiteit Utrecht hier ook actief mee aan de slag. Ik heb zijn rechterhand Martijn Schraagen toen een kopie van mijn genealogisch bestand ter beschikking gesteld, waarmee ze de kwaliteit van hun algoritmes zouden kunnen toetsen. Nooit meer iets van gehoord. Tijdens famillement 2015 in Leiden had Martijn een stand waarin ze lieten zien dat ze automatisch kwartierstaten konden genereren op basis van de gegevens onder wiewaswie. Het resultaat bij mijn wederzijdse grootouders viel nogal tegen vanwege de welbekende showstopper: Rijnhart is ook Reinhart, Rijnhard, Reinhardt, Reinaerd etc. etc.

Helmuth Rijnhart - 5 aug 2016 - 21:21

Een prachtig voorbeeld van hoe het niet moet op GaHet(op dezemanier niet)Na:

http://www.gahetna.nl/collectie/archief/ead/index/eadid/4.OMM/node/c01%3A1.c02%3A1.c03%3A0./open/c01%3A1.c02%3A1.c03%3A0.

Een leuke index om eens door heen te bladeren en een zondags spelletje Mens Erger Je Niet te spelen. Jawel:

265C, Klapper op het register van memoriën, geordend op namen van de ondertekenaars van de memoriën pak

Nadere toegang op inv.nrs. 265A en 265B

Met voorin een alfabetisch overzicht van de voorkomende persoonsnamen
Daar heb je wat aan!

Maggy - 7 aug 2016 - 13:39

Doorzoek discussies

Doorzoek ledenregister

Doorzoek Wie (onder)zoekt wie?

Doorzoek Open Archieven

Doorzoek alle websites

Doorzoek alle personen

Doorzoek alle publicaties

Doorzoek helpteksten

Archiefinstellingen, bronnen en inventarissen » Oproep: maak uw bronbewerkingen openbaar