stamboomforum

Forum logoGenealogie software / GEDCOMs » Bidprentjes 2.0 - het idee



Profiel afbeelding
Het idee (voor een nieuwe website) in één zin: pas crowdsourcing toe op de transcriptie van bidprentjes.

Crowdsourcing is the act of taking a job traditionally performed by a designated agent (usually an employee) and outsourcing it to an undefined, generally large group of people in the form of an open call.  Bron: Wikipedia

Bidprentjes zijn een waardevolle bron voor genealogisch onderzoek en maken deel uit van het nationale erfgoed. Deze nieuwe website faciliteert het verzamelen, presenteren en transcriberen van deze bidprentjes.

Centraal in oplossing
  • Scans van bidprentjes
  • Crowd-sourcing voor transcripties
  • Open afbeeldingen & data
Functionaliteit
  • Maak het heel makkelijk om bidprentjes te uploaden
  • Maak het heel makkelijk om bidprentjes te transcriberen
  • Maak het heel makkelijk om bidprentjes te doorzoeken
  • Stimuleer upload en transcriptie via "social statistics"

Wellicht dat je deze website een mengeling kunt noemen van websites als http://www.online-familieberichten.nl/ (traditioneel ingericht, geen scans, geen crowdsourcing),  http://www.bidprentinformatiesysteem.nl/ (traditioneel ingericht, geen scans, geen crowdsourcing) en http://www.flickr.com/ (generiek voor afbeeldingen, hoe data eruit halen, hoge drempel voor deelnemers, geen focus op crowdsourcing).

De website moet uitnodigen tot het uploaden van scans van bidprentjes, zowel de particulier als archieven! Door de transcripties open te maken (downloadbaar) worden zij "beloond" voor het beschikbaar stellen voor de scans.

Beren op de weg
  • Copyright / Creative Commons voor afbeeldingen en transcripties
  • Privacy levende personen
  • Verlies van controle over "goud" van organisatie
  • Kwaliteit van transcripties (maatregel: uploader van scan kan kwaliteitsstempel op transcriptie zetten)
  • Afspraken over datastructuur "export"
  • Kosten hosting

Toekomst
Zelfde concept kun je zo gebruiken voor:
  • Geboorte-, huwelijks- en overlijdensadvertenties
  • Rouwbrieven/kaarten
  • Geboortekaartjes (let op: privacy)
  • Andere akten...

Hieronder het idee vervat in schermafdrukken.

U kunt deze presentatie ook (schermvullend) bekijken op Slideshare.


Graag verneem ik uw feedback om dit idee beter te maken! Of is het een kansloos idee?

mvg,

Bob Coret

Bob Coret - 12 jul 2009 - 19:46

Beste Bob,

Dat lijkt me een prima idee!

Een tip: waarom geen OCR gebruiken? Dan heb je minder crowdsourcing nodig, omdat veruit de meeste tekst wel gezien en gelezen kan worden. Dat helpt in eerste instantie denk ik.

Wil je een echte database opbouwen, dan kun je dat alsog doen als gebruiker, door velden in de vullen.

Luud de Brouwer - 12 jul 2009 - 20:53

Luud,

OCR had ik inderdaad nog helemaal niet aangedacht. Ik denk omdat ik er persoonlijk geen (goede) ervaring mee heb.

Als er iemand is die een goed open source OCR pakket kent en er ervaring mee heeft dan hoor ik het graag. Ik heb net even tesseract-ocr, ocrad en gocr geprobeerd. Het beste resultaat kreeg ik met gocr:

 

Afbeeldingen zijn alleen zichtbaar als u bent ingelogd op het Stamboom Forum

 

CdeI1X in wc Dadvruhtic 9den
d ZleI vnn Z3ligcr
etug Gecacdus  Coree
Wedwnnnr van
A oneg G e eTg n
yeoren t J-Hrtognbosc 9 AprI I8SI n 0vr-
Iden nIdn8r  luIt I93I, na v0nT2o t ijn van d
IantsLc t3.. Sacrnnren dr Stervnden.
Lid rler hnrtbrodcixhap dcr H. fJmtII.
f,d der Derde r 6n den H. francscus.

Hcer, mijn hart is niec hoonodi9 e-
weest. Miin roem is dcx. dat ik in cen
voudigheid des h3rtcn in de2e werEId gE-
Igefd heb.            3I Coc l: l 2.
GeIukkig źj. die in den godsdenst Troos
en slc Ln zocken. En hij aIIcs hun oog gc-
'icht houd'n naar hnven. levend in d hop
op eerl beTer leven. Voo uwe gclJovigcn
Toch, o Heer. ordT h even ni weg
yenamen. ma ar allecn vcr'anderd. en nadaT
dc> boe>iL'n van dcze aardschc b3IIingscha
v-e'broken zijn, w'ordt hun Een hemelsche
wing bereid.         Praef pr def.
H. Maria, gij waart mijne sterhte in nijne
zwaXheid. mjn trnost n mjnc lijdcnsuren,
thans zijt gij de hoop mijner zaligheid.
Mijnc dicrhare kinderen en XleinXinderen ,
vaartwel. Tot  weerzicns in dcn HEmeI!
Houdc God voor oogen, onderhoud Zijne
gebaden. bevaarc hec 9eloof. In den hee
hlijf ik U beminnen en vooc U aIlen bidden.
Weest mijme ziel indachtig ln uve gebeden.
Hr. ncf 2il1 2il dc cuwgc rt. n 6et euig lic1
vrIicht m. Dat ij rute n urcdc. Acn. (3 d ntI t

Ur1Xri H. Slt - St. Ioritrant I6

mvg,

Bob Coret

Bob Coret - 12 jul 2009 - 23:09

Kwam net via @zbdigitaal (op Twitter) op de website http://www.free-ocr.com/ waar je een afbeelding kan uploaden en de tekst dan terugkrijgt. Resultaten op deze website zijn een stuk beter (zie onder). Ik heb contact met de maker opgenomen om te vragen of er een API is of dat ze me informatie kunnen geven over de gebruikte technologie.

mvg,

Bob Coret

Geclenk in uwe godvruchtige gebeden
de Ziel van Zaliger
Petrus Gerardus Coret
Wedixwnaar van
Antonetta Geertzen
geboren te 's­Hertogenbosch 9 April 185l en over-
leden aldaar 24 Iuli 193I. na voorzien te zijn van de
laatste H.H. Sacraipenten der Stervenden.
Lid der Anrtsbroedersghap der H. Familie.
Lid der Derde Orde van den H. Franciscus.
Heer, mijn hart is niet hoogmoedig ge-
weest. Mijn roem is deze, dat ik in een·
voudigheid des harten in deze wereld ge-
leefd heb. II Cor 1: 12.
Gelukkig zij, die in den godsdienst troost
en steun zoeken, en bij alles hun oog ge-
· richt houden naar boven, levend in de hoop
op een beter leven. Voor uwe geloovigen
toch, o Heer, wordt het leven niet weg-
genomen, maar alleen veranderd, en nadat
de boeien van deze aardsche ballingschap
verbroken zijn. wordt hun een hemelsche
woning bereid. Praef pro def.
H. Maria, gij waart mijne sterkte in mijne
zwakheid, mijn troost in mijne lijdensuren,
thans zijt gij de hoop mijner zaligheid.
Mijne dierbare kinderen en kleinkinderen.
vaartwel. Tot weerziens in den Hemel!
Houdt God voor oogen, onderhoudt Zijne
geboden, bewaart het geloof. ln den hemel
blijf ik U beminnen en voor Ll allen bidden.
Weest mijne ziel indachtig in uwe gebeden.
Heer. geef zijne ziel de eeuwige rust. en het eeuwige licht
verlichte hem. Dat hij ruste in vrede. Amen. (300 d. all.)
Drukkerij H. Smits · St. Iorisstrnat l6

Bob Coret - 15 jul 2009 - 22:52

Wat een geweldige website, Bob!

Ik heb wel eens wat met de gangbare OCR-programmaas gespeeld, maar

bij 19e eeuws drukwerk laten ze het al snel helemaal afweten.

Ik heb net als test een paar echt moeilijke scans geupload,

en viel bijna van mijn stoel toen ik zag, dat ze

nagenoeg foutloos bleken te zijn "gelezen".

Dank!

Jan.

Jan Clavaux - 15 jul 2009 - 23:41

Hallo Bob,

Ik zag dat bericht van Edwin ook langskomen en ik rekende er op dat jij die ook volgt :-)

Zo zie je maar dat OCR een mooie toekomst heeft!

Groet,

Luud

Luud de Brouwer - 17 jul 2009 - 08:58

Collega Arjen de Haas (bedankt!) kwam (via de Plaxo waar hij de Slideshare presentatie zag) met de suggestie om eens naar http://www.evernote.com/

te kijken. Ik had hier in het verleden al eens naar gekeken, maar had nog niet direct de link met OCR gelegd. Ik heb net even een deel van mijn bidprentjes in Evernote geplaatst en ik moet zeggen dat de OCR technologie erg indrukwekkend is. Ik ga er er nog meer induiken (ze hebben een API, maar ik mis ook wel wat features), maar voor nu al vast het resultaat (uiteraard via een widget).

Zoek maar eens op Coret of Schellekens of Buuren. Als je op een zoekresultaat klikt ga je naar het origineel op de Evenote site (waar ik de bidprentjes openbaar heb gemaakt, standaard zijn de notes niet publiek). Als je op de Evernote site zelf zoekt zijn de resultaten mooier: de zoekterm wordt in het bidprentjes gemarkeerd!

mvg,

Bob Coret

Bob Coret - 18 jul 2009 - 01:04

Evernote ziet er op het eerste gezicht heel handig uit :) Misschien ga ik daar ook wat bidprentjes instoppen.

Ik vraag me af of de software ook op je eigen site te integreren is. Dan bedoel ik niet de widget of de downloads, maar dat je zelf de beschikking krijgt over de scripts / executables, en dat op je site kunt zetten. In dat geval blijf je baas over je eigen data. Een nadeel van dit soort services vind ik dat je je afhankelijk blijft van de goede bedoelingen en de continuïteit van de service provider.

Frank

Frank Steggink - 18 jul 2009 - 01:56

Ben ik net, na een kritisch stuk van Eric Hennekam, bij Archief 2.0 opgestapt, gaan we hier weer 2.0 doen ... Afbeeldingen zijn alleen zichtbaar als u bent ingelogd op het Stamboom Forum

Maar het idee is goed, en als je de middelen hebt om het op te zetten, zou ik het zeer waarderen, en dan in hele brede zin, dus met al het bronmateriaal dat je op een redelijke manier kan binnenhalen. Bidprentjes zijn voor mij persoonlijk niet zo heel belangrijk namelijk.

Belangrijk is dan wel dat er naast zaken als auteursrecht enzovoort ook zicht is op continuïteit. Wie kan er bijvoorbeeld garanderen dat de boel er ook na 20 jaar nog staat? Ik heb hier videobanden van 20 jaar oud, geluidsbanden die meer dan 40 zijn, maar ken eigenlijk nauwelijks een site die zelfs maar de 10 haalt.

Enno - 18 jul 2009 - 13:44

Ik ben aan het spelen met Evernote om de OCR functionaliteit "uit te buiten".

Als u hier ook mee wilt spelen (geen garanties, geen openbaarmaking van de afbeeldingen) stuur dan een bidprentje naar teed93clip@tarpipe.net  De inhoud van de mail is niet relevant, wel dat u een bidprentje (of andere afbeelding met tekst) stuurt als bijlage in de e-mail. U krijgt automatisch (binnen enkele minuten) een transcriptie in uw mailbox!

Voor de technisch geïnteresseerden: deze "service" is in elkaar gezet met onderstaande eenvoudige tarpipe:

Afbeeldingen zijn alleen zichtbaar als u bent ingelogd op het Stamboom Forum

mvg,

Bob Coret

Bob Coret - 18 jul 2009 - 15:07

Geheel toevallig loop ik tegen dit forum(pje) aan. Het idee is op zich uitstekend; jammer dat de discussies nooit verder zijn gegaan.

Met het free online ocr krijg ik echter niet veel bruikbaars terug (een scan van een blaadje advertenties van het CBG).

Kan niet zeggen dat ik onder de indruk ben van het resultaat: (Afbeeldingen zijn alleen zichtbaar als u bent ingelogd op het Stamboom Forum

Afbeeldingen zijn alleen zichtbaar als u bent ingelogd op het Stamboom Forum

)

1970-2000 Blad: 1 *CBGO936850001*
i Geheel Onverävacht, in de leeftijd ?g 71a  . Ëvlhîràî: Êgàîârpe?ieid ?n plaats van kannen ? 7?;
is van ons eengegaan onze onverge e ij e ? ? Onver-
i moeder en Oma wacht van ons heen? Op dinsdag 3 augustus hopen onze ou-
BERENDINA L MIENTJES STOK ? ËÈÏËÏMÎË"OÀÊÊ'Ë? ga d? ?
? ' ì EVE
J d zorgzame Vader, ' ' ?
v_ ?gmg??g; gîgn?es i îîäämèïîînî: Cm W||Iem Mient|es
, ' . I O11, n
i H. I. Ambacht: E. J. M._ Mientiâs M ? Broer. Zwager en Oom . e . . ?
gh gìnglgggìgie- e a? i GIJSBERTUS Pmriws Maria Mienties-Sonde?ker
Schiedam: 1.. s. M. Mienijes _ ? ?ENÎJES 5? ? ? . ..
Schiedam: H. J. Mientjes-de Leede ? vp ?de leeftijd van b?na hUÛ 50-jarige hUWe/I/k
en kinderen ? 54 IIMF- te viererm
SCHIEDAM ?r juli 1971. U!? ?lier naam:
- A G. . .
?S?P?.??"?°Ë?Ë°.Ï?ÉÊ Ìïêo? ? ??????» B?mMmNTJES u kunifeliciteren en roesten op hun ee-
mmm?. ?°.?2?""°Ë.??â2?2?ì.ä'2i'°iîîifyá?"?°°
? - 2 januari 1910.? z "a e '
_ T Fahreiiheitstraat 212. -
Dankbaar voor alles wat zij voor ons betekend M? " "?
heeft, delen wij U mede, dat op maandag 25 juni  en
1973 geheel onverwacht, voorzien van de H. Sa-
cramenten der zieken is overleden, mijn lieve
vrouw en onze onvergetelijke moeder, dochter, WÀÛÊTRICHË m7
schoondochter, zuster, tante en nicht 0 ammvfä V99 8 ?
Manna nEGiivA JOHÀNNA van DER PERRE 7 _?_?
? l - . ? echtgenote van ' ? H. Maria. Moeder van Altijddurende Bijstand, i
Bemardiis Theodoru?: Gerardus Mlen?es md voor h?, en voor ons Ellen?
? ?? - ?í ? Heden is van ons heengegaan. na een geduldig
m deleemld van ?a Jaar? gedragen lijden een zorgvol en allesgevend leven.
Wij vragen u haar in het H. Misoífer en gebed te toch nog onverwacht. voorzien van hei H. Sacrament
willen gedenken. der zieken, onze lieve moeder en oma
De diepbedroeíde familie t? ?   ?
B. Th. G. Mientjes .
Ben - Ineke - Twan ? _    ?
Robby weduwe van Cornelis Wilhelmus Mienljes Î
Familie Va? d" per" ? in de ouderdom van 76 jaar. 0-?
/ Familie Mientjes
Blerick, 25 juni 1973. ? ? F?"?"ΰ Miemlë?
Guido Geiellesiv?ai 40- . ? ? ?s-Gravenhage, 6 september 1976
??? l? er Wete@gk_e1ge_1_5_ìÀ_#_ ?_% _ >
l ? I
l « 1? ?
W? z?n b  maar fcegel?lc dùaîikbaar dat we ??_?._????v?v?????_??????v?îv??w?vvvw
voor haar e mogen mrgen. a. een langduri- ' ?- "?
ge mam. awpe, gedmgm mams is van ons heem Ì Op vriidag 22 meias. hopen onze ouders
?g°g??' m? M dmhmq° z Comèlù G. F. Míenljes
? ? " ú N ?n
?iE?liA i ?" ? ?
op de jeugdige leeftijd van 5 jaar. Ì ?Anlo"u?"G-'  lw?entjes"
. i . van der Ryt »
? GJIBJMÄIENTJES ,? h 25? _ h ?NM, ? _ ?
T. C. lHENEJES-Jansen ? un -1arig uwe I] s eest te vieren. _
?i SILVOLDE, s augustus 1973 í De H. Mis uit dankbaarheid zal worden opge-
  _? ___ __?A l dragen om??l4.30 uur in de parochiekerk ?SI. i
? i Werenfridus" te Elst G. ' 4
? ? ? ? ? ? ?  Gelegenheid torfelîciteren van 16.30 uur tot ?
? . ? ?? --
Op woensdag 7 mei hopen onze ouders en grootou? Ì 17730 ?er in C?iî ?De Rîîîhîî Brug ? Rllkî? l
ders l weg Zuid 90, Elst. _ _
B  t. Ì Hun dankbare kinderen:
. ren 93 ? Ì ?  ?Iöoremíeke -]an Iacqueiìne
e" ?  _ ? ?Gerard ?_ ?Ëï?ê _
H. C.? Mientjes-v. d. Berg l mï?nîvllê Kîjs
hun SO-iang huweliiksieest te vieren. Ì E1 G . 1977 Marcel
Op die dag zal tot hun Intentie een H. Mis worden Ï ? ?- "î me? ? ?_
P opgedragen om 15.30 uur In de Si. Marilnuskerir te Ì Wâge?m?iwfîïml? 29 ?
Tag e|en_ i. ._. ?....._.__.._.?_____?__L?._.?__.?..??_
Gelegenheid tot feliciteren van 18.30-20.00 uur ln
Café Schreurs. Kerkho?aan 20. Tegelen. í
Hun dankbare kinderen en kleinkinderen ?
Tegelen, mei 1975 ' v ?
k Raadhuìslaan 70 i
?_?;?>?ù_ò??.??.ÀÀL

Leo Bijl - 17 aug 2011 - 13:36

Dit is hem dan in het echt:

Afbeeldingen zijn alleen zichtbaar als u bent ingelogd op het Stamboom Forum

Leo Bijl - 17 aug 2011 - 13:55


Als ik het resultaat uit de OCR zo bekijk, dan is de gehele CBG pagina in zijn geheel naar de OCR gestuurd. Daardoor komen er letters van verschillend type en formaat in een regel voor. En daar kan een OCR niet goed mee uit de voeten. De oplossing: knip in een fotobewerkingsprogramma het geheel tot losse advertenties. Als die naar de OCR worden gestuurd zal het vast beter gaan.

Mogelijk heeft iemand dit al eerder gesuggereerd, maar niet op het forum. Het lijkt mij goed om anderen welke dit onderwerp gaan lezen deze tip mee te geven.

Wim van Beek - 28 feb 2015 - 11:52







Plaats een reactie

Om reacties (en nieuwe onderwerpen) te plaatsen op het Stamboom Forum dient u eerst in te loggen! Nog geen lid? Registratie is gratis en snel!


Inloggen Registreer nu