Dat is handig! Bedankt,
mvg-Ben
Geweldig!
@Jacques,
even een technische vraag.
Momenteel is er dus sprake van een PDF, van een scan, van een gedrukt boek, dat is gebaseerd op een antieke database (misschien wel in DOS).
Stel, dat die database nog ergens in het CBG wordt bewaard, zou het dan geen idee zijn om die te converteren en rechtstreeks doorzoekbaar te maken? Of fantaseer ik nu over iets waar ik geen verstand van heb?
groeten, Jan
@Jan,
De service die Jacques nu biedt is dat je op basis van invoer van een plaatsnaam direct op de juiste bladzijde komt (tekst in de PDF kun je trouwens kopiëren). Technisch heeft hij dus de PDF van het CBG (http://www.cbg.nl/download/Repertorium-dtb-totaal-ocr.pdf) opgeknipt en de plaatsnamen geïndexeerd.
Wat zou je nog meer willen?
mvg,
Bob Coret
Hallo Bob,
het repertorium DTB ligt al 35 jaar in boekvorm naast mijn toetsenbord, dus persoonlijk ben ik meer dan tevreden 
.
Daarnaast heb ik de PDF-versie al een tijdje op mijn laptop staan, en daarin is het vinden van de plaatsnaam nooit een onoverkomelijk probleem geweest.
Maar als die database nog zou bestaan, zouden er meer zoekmogelijkheden zijn, als nu in zoekakten worden geboden. De mogelijkheden zijn dan legio. Een lijstje publiceren van alle plaatsen waar men zich grieks-ortodox, hersteld evangelisch-luthers of anglicaans kon laten dopen, om zomaar eens een willekeurige zijstraat te noemen. Dat zal jou als data man vast wel aanspreken.
groeten, Jan
@Jan,
Je fantasie is nog zo gek niet. Daar hoef je geen techneut voor te zijn. Was het maar zo zoals je betoogt.
De teksten uit het repertorium zijn nergens digitaal beschikbaar volgens de indeling van het pdf. Ook niet bij het CBG voor zover mij bekend.
Als er aan mij toestemming gegeven wordt om ook de data van het document te gebruiken (er rust immers copyright op), kan ik de boel actualiseren en er handige zoekfuncties op los laten. Bijvoorbeeld op religie !!!.
@Bob,
Tuurlijk kun je pdf-teksten omzetten in OCR en daarna kopiëren, maar het resultaat uit het repertorium is dan bedroevend vanwege allerlei "inspringende" teksten.
Als alternatief is het dus een beetje monnikenwerk geworden.
De vijf documenten zijn overigens door het CBG opgeknipt. Zie http://gen-magazine.blogspot.nl/2013/10/repertorium-dtb-als-pdf-online.html
Leuk om het totale pdf te linken, maar via de aangeboden vijf delen gaat het openen een stuk sneller.
Hallo Jacques,
bedankt voor je snelle antwoord (dat mijn laatste reactie kennelijk heeft gekruist, waarin ik als voorbeeld geef zoeken op religie).
Jammer, maar het is niet anders.
groeten, Jan