stamboomforum

Forum logoFora » FamilySearch en Zoekakten » XMLs van familysearch met URLs van images

verwijderd

Herman

Op dit moment moet je inderdaad nog op een link klikken om te zien welke akte het is maar het openen gaat - tenminste bij mij - wel degelijk sneller als via FamilySearch, als Jerry er Thumbnails bij zou weten te krijgen en je daardoor weet welke pagina je moet hebben dan gaat het downloaden verder toch t.o.v. FamilySearch supersnel, alleen moet je dan niet de pagina openen door er op te klikken maar met de rechter muisknop op de betreffende link klikken en dan te kiezen voor "doel opslaan als". Sla de afbeelding dan onder gewenste naam of nummer op in de map van keuze.

 

Jerry is nog volop bezig met deze applicatie en ik ben erg nieuwsgierig naar het uiteindelijke resultaat maar ik denk dat het op dit moment om te downloaden toch al een heel goed alternatief is voor FamilySearch.

 

M.vr.gr.

 

Leo Terlouw

 

 

Leo Terlouw

De afbeeldingen worden nog steeds van FS gedownload, ik lever met mijn scripts alleen een veel snellere manier (en hopelijk overzichtelijker, althans dat is mijn mening) om de links naar de afbeeldingen te krijgen. Als je een afbeelding aanklikt, moet je browser nog steeds de afbeelding van FS downloaden. En dat gaat nog steeds sneller dan de flash-applicatie van FS, die de afbeelding downloadt, dan blijkbaar nog iets moet verwerken, en dan pas toont.

Ik heb een scriptje gemaakt dat thumbnails kan maken. Het werkt, het maakt een thumbnail van een afbeelding en slaat die op. Dat draait echter nogal traag, want ook dat moet de afbeelding van FS downloaden. Ik heb FS gevraagd of hun scripts de mogelijkheid bieden van kleinere afbeeldingen. Zo niet, zal ik iets bedenken dat 1 voor 1 (want de grote images van FS vreten geheugen) de afbeeldingen van een bron kan ophalen, verkleinen en opslaan op mijn server. Dat kan ik ook niet ongelimiteerd doen, want ik heb nog maar 1.5 Gb vrij op de server. Een bron met 500 afbeeldingen zal neerkomen op 1.5 Mb, dus zou ik in totaal 1000 bronnen kunnen downloaden.

Ik moet dus nog iets bedenken m.b.t. die ruimte. Ik zou van bronnen die geïndexeerd zijn (notities toegevoegd) de thumbnails weer kunnen verwijderen. Dan worden de thumbnails vervangen door notities, wat nog duidelijker is dan alleen een thumbnail natuurlijk.

Andere ideeën?

Dank voor het meedenken!

Jerry

Jerry van Kooten

Ik heb het script bijna klaar waarmee mensen mee kunnen helpen om te indexeren, oftewel notities toevoegen aan afbeeldingen om aan te geven wat er op de afbeelding te zien is.

Ik wil niet zomaar iedereen dingen kunnen laten invoeren, anders moet ik steeds alle toevoegingen controleren of er geen onzin tussen staat. Ik wil dus via dit subforum mensen de mogelijkheid bieden om mee te helpen. Als je dat wil, stuur me dan een email en dan maak ik een naam en wachtwoord voor je aan.

Ik zal binnenkort beginnen met alle berichten uit dit subforum door te nemen en alle indexen vast over te nemen.

Jerry

Jerry van Kooten

Ik heb weer een update van http://familie.jvkooten.info/fs/ gemaakt.

Er kunnen nu notities worden toegevoegd. Omdat dat nog wat beter getest moet worden zal ik eerst een klein aantal mensen een naam en wachtwoord geven. Alle notities kunnen wel door iedereen worden bekeken.

Hier is een voorbeeld van Civil Records > Noord Holland > Schoorl waar ikzelf een begin heb gemaakt met indexeren van de tienjarentafels:

voorbeeld FS-indexering

Per afbeelding wordt aangegeven wat het type afbeelding is (fiche-info, voorkant register, lijsten, aktes) en dan een vrije tekst. Als alleen maar de voorkanten van de registers genoemd zouden worden zou het al veel mensen helpen met zoeken.

Later zou ik wat meer met die afbeelding-types kunnen doen. Ik zou bijvoorbeeld alle geïndexeerde bronnen kunnen laten zien en alleen de geïndexeerde afbeeldingen, zodat alle onzin (fiche-info) eruit wordt gefilterd. Ik noem maar wat. Ook hier: suggesties altijd welkom.

De tekst "afb. xx / yy" is een link naar de FS-afbeelding, die opent in een nieuw scherm.

Als je notities mag toevoegen (dus als je een naam en wachtwoord hebt) mag je je eigen notities wijzigen (maar niet verwijderen), admins kunnen alle notities wijzigen. Er kunnen meer notities per afbeelding worden toegevoegd. Ik (of mede-admins) zullen eens in de zoveel tijd controleren of er geen onzin is toegevoegd. Ik zal een extra controle inbouwen op afbeeldingen met meer dan 1 notitie - daar is altijd wat mee aan de hand.

Jerry

Jerry van Kooten

Ik denk dat je (in ieder gevel per plaats) ook enige indicatie moet geven welk percentage geindexeerd is. Zolang de meeste nog niet gedaan zijn denkt men al snel dat er helemaal niets gedaan is. Men probeert een paar bestanden en haakt weer af.

Waar kunnen we ons eigenlijk aanmelden? Ik neem aan dat je geen wachtwoorden online zet.

Je had het -meen ik- ook over een zoom-script, ik zie de afbeeldingen alleen maar in een nieuwe tab openen. Op die manier word ik gek van het switchen. De browser kent ook maar twee zoomstanden: te groot en te klein.

Ik heb zelf een experiment gedaan met een paar afbeeldingen tegelijk. Zonder echte thumbnails maakt dat de browser echter erg traag, tenminste, ik vermoed dat de grote afbeeldingen het probleem zijn. Misschien kun jij e.e.a. integreren? Of inspiratie opdoen. De pagina is hier te downloaden.

Jo Pol

Goed idee, ik zal eens kijken hoe ik dat snel kan berekenen hoeveel is ingevoerd en handig kan laten zien.

Aanmelden kan direct bij mij via dit subforum. Ik heb nog niet echt goed kunnen testen, dus wil niet de indruk wekken dat iedereen zich meteen kan aanmelden en mee kan doen. Straks moet ik iets repareren en jaag ik mensen weg omdat iets niet goed werkt. Ik stuur je een bericht met naam en wachtwoord. Tenminste, ik begrijp uit je bericht dat je ook mee wil helpen.

Ja, de afbeeldingen zijn groot (2 to 4 Mb) en dat is nou eenmaal traag.Een pagina met veel afbeeldingen is dus erg traag. Om een thumbnail te maken moet ook de grote afbeelding worden ingeladen, dan een thumbnail weggeschreven. Daarna is het laden van de thumbnail pas snel. En omdat ik zo'n thumbnail echt 1 voor 1 moet maken, moet ik even een goede manier bedenken om dat netjes te doen zonder (de server van) mijn site te overbelasten. Ook moet ik iets bedenken voor de ruimte - veel thumbnails nemen ook veel ruimte in.

Ik heb een ideetje dat ik morgen ochtend ga uitwerken en testen. Dan nog zal ik alleen een script kunnen starten voor het ophalen van afbeeldingen en het maken van thumbnails. Ik kan niet alle bezoekers zelf bepalen van welke bron zij thumbnails willen hebben omdat dat alsnog het script meerdere keren tegelijk loopt. Als het werkt, zal ik de mensen met een wachtwoord vragen welke bron zij aan het bewerken zijn en die eerst doen.

Opnieuw bedankt voor alle input, het meedenken!

Groeten,

Jerry

Jerry van Kooten

Ik ben aan het testen met een scriptje voor het binnenhalen van thumbnails. Voorbeeldje:

Nogmaals, elke afbeelding moet van FS worden binnengehaald, dus dat duurt zo lang het normaal downloaden van een afbeelding duurt.

De kwaliteit van de thumbnails kon flink omlaag, het zijn nu JPGs met compressie 50. Nog steeds blijft heel duidelijk wanneer je met aktes te maken hebt, wanneer met de voorkant van een register, enz. Het indexeren wordt zo een stuk makkelijker. De afbeeldingen zijn nu vaak onder de 2 Kb.

Jerry

Jerry van Kooten

Na wat testen moet ik concluderen dat door de grootte van de FS-afbeeldingen het script om thumbnails te maken teveel geheugen kost. De rest van de site wordt er erg traag van.

Ik ga nu een script maken dat ik op mijn eigen PC kan draaien (en dan heb ik het gehele geheugen tot mijn beschikking) die op dezelfde manier 1 voor 1 een bestand van FS download en er dan een thumbnail van maakt. Ik zal daarna per bron alle thumbnails uploaden.

Dan nog heb ik denk ik niet voldoende ruimte op de server om alle thumbnails op te slaan. Heeft iemand een idee waar we dat wel kunnen doen? Het worden dus duizenden bestanden van vaak nog geen 2 KB. Per 500 afbeeldingen is het dus 1 Mb.

Jerry

Jerry van Kooten

O, nu zie ik dat je hier onder profielen persoonlijk contact kunt opnemen. Ik verdwwal nogal eens op deze serie sites.

Maak het niet te ingewikkeld, al doende merken we wel hoe e.e.a. werkt.

Bij familysearch zelf (die veel meer details willen dan wij hier) las ik iets over werken met batches. Die kun je downloaden en ze verwachten het resulaat binnen een week terug. Het geeft niet als je maar een deel gedaan hebt, maar dan kan eventueel een ander ermee verder.

Je hoeft alvast geen thumbnails te maken van plaatsen die al voldoende zijn uitgewerkt in het spreadsheet van v.d. Velde, of hier (bijvoorbeeld van Elburg resteert nog maar een korte periode). Voor die plaatsen is het gewoon naast elkaar leggen en overtypen.

Laat degenen die hier mee willen doen maar aangeven welke plaats of plaatsen ze verder willen willen aanpakken, eventueel beperkt tot een type acte en/of periode. Markeer de plaaten waarvan thumbnails beschikbaar zijn, dat voorkomt dubbele aanvragen. Van voldoende beschreven bestanden kun je de thumbnails weer verwijderen. Hier bewijzen de percentages ook weer hun nut, die wil je misshien dan toch (ook) op bestands niveau hebben.

Op het gevaar af dat ik het toch weer te ingewikkeld maak: misschien is een optie om alle provincies open of dicht te klappen ook handig. Plaatsen schijnen soms van provincie gewisseld te hebben. Met alles opengeklapt kun je met de zoekfunctie van de browser de gewenste/gemarkeerde plaatsen vinden. Of wordt dit ook al weer te groot voor een browser? Ik heb de "childcounts" per provincie even opgeteld: momenteel 1231 plaatsen. Misschien een aparte pagina voor de plaatsen met thumbnails? Ik denk maar een beetje hardop.


Jo Pol

Ik zag nog een berichtje van je over het hoofd. Wat betreft de markering in mijn vorige bericht, zet "get images" (oeps: haal afbeeldingen / toon postzegelformaten?) een niveau hoger, daarbij in een klik openklappen.

Jo Pol

Jerry

Nog eens gespeeld met de omvang. View selected source werkt niet meer als ik alle provincies een keer open heb gehad en een groot deel van de pagina geselecteerd heb. Een veeg teken. De bezoekers zullen niet beseffen hoe groot hun pagina onder water wordt als ze een paar provincies/plaatsen/bestanden hebben open en weer dicht geklapt. Ik begrijp dat je e.e.a. geen 2e keer wilt op halen, maar je wilt ook geen browsers ophangen. Overigens kun je je pagina iets inkrimpen door bij de xml-links  het query-deel (de ?-staart) weg te halen.

Ik heb bestanden met meer dan tweeduizend afbeeldingen gezien. Die wil je zelfs op postzegelformaat niet allemaal tegelijk in een pagina hebben. Je kunt dus beter aparte pagina's per bestand maken met een maximale range van afbeeldingen, eventueel in een frame naast de plaatsen tonen. In mijn prototype kun je spieken hoe met argumenten om te gaan, je kunt die ?dgs=4537312&img=1 meegeven.

Dit alles beredenerend snap ik heel goed hoe ze bij fs op een frame van drie kolommen met daaronder de afbeelding zijn gekomen.

Jo Pol

Jo, waardevolle opmerkingen, dankjewel.

De "GET IMAGES" was voor een test en het get-images-script gaat niet meer op de webserver draaien. Ik maak een offline-versie die thumbnails op mijn eigen disk maakt die ik dan ga uploaden.

Aantal thumbnails en aantal afbeeldingen met commentaar ga ik erbij zetten, daar zie ik zeker het nut van in.

View Selected Source werkt mogelijk niet omdat ik steeds een lijst apart ophaal. Ik heb zelf niet getest met hoe Firefox hiermee omgaat. Zal ik eens proberen. Ja, de lijst wordt groot als je alles opent, maar je kunt een lijst ook weer dichtklappen. Ik zou bij dichtklappen de lijst weer uit het geheugen kunnen halen.

Lijst met 2000 thumbnails, dat is inderdaad wat veel. Ik heb een script dat images pas gaat inladen op het moment dat de gebruiker de pagina genoeg naar beneden scrollt. Op die manier worden dan zo'n 10 thumbnails tegelijk geladen. Is dat wat?

Ook mogelijk, maar lijkt me niet handig, is eerst items te tonen per 10 afbeeldingen, dus "afb 1-10", "afb. 11-20" enz. Die kun je dan openklappen voor 10 afbeeldingen.

Jerry

Jerry van Kooten

Bij het dicht klappen zie je de plaatsen weliswaar niet meer, maar open eens alle provincies, sluit ze weer en sla de pagina vanuit de browser lokaal op. Samen met de jQuery scripts 0,7MB. Ik krijg hem met geen editor meer geopend. De dichtgeklapte lijsten zijn alleen onzichtbaar gemaakt maar staan er nog steeds in.

Pas laden als ze in het zicht scrollen stelt het probleem alleen uit. Scroll je door dan heb je uiteindelijk toch alles geladen. Je moet ze er dus ook weer uit knikkeren. De boom dieper maken lijkt me net zo min wat als jou. Overigens zou het misschien wel met 100 of zo tegelijk kunnen. Ik denk in functioneel opzicht ook aan mijn prototype van gisteravond, maar dan de layout van jouw ziet er beter uit. Maar pas op dat je niet hoeft terug te scrollen naar de knoppen.

Ik zei eerder al, een serieuze applicatie...

Jo Pol


Ik denk dat images weghalen niet echt nodig is. Zelfs bij 1000 thumbnails is het maar 2 Mb aan geheugen. Lijsten uit het geheugen halen wanneer ze worden dichtgeklapt is wel een goede, ja, dat kan schelen als je veel hebt geopend. Het klopt dat ze niet worden verwijderd als je ze dichtklapt, ik dacht dat dat niet nodig was. Ik zal eens testen.

Images pas tonen als ze in beeld komen kan ik ook wel doen denk ik, maar ik heb bij tests toch al vaak de neiging om snel te scrollen, en dan is wachten op de volgende lading images weer vertragend. Ik ga eerst kijken hoe snel de pagina is als ik na dichtklappen de lijst weer uit het geheugen haal.

Jerry

Jerry van Kooten




Plaats een reactie

Om reacties (en nieuwe onderwerpen) te plaatsen op het Stamboom Forum dient u eerst in te loggen! Nog geen lid? Registratie is gratis en snel!