stamboomforum

Forum logoFora » FamilySearch en Zoekakten » XMLs van familysearch met URLs van images

Dit topic verdient meer aandacht

-----------------------

Zie meer over dit onderwerp ook in subfora:

Index pagina's Family Search "search record pilot"

http://www.stamboomforum.nl/subfora/134/0/

gr.

Everardus

-----

aanv.

zie ook:

http://www.stamboomforum.nl/actualiteit/2/27426/0/de_linken_van_familysearch_scans_burg_stand_div_provincies_op_een_rijtje

Everardus Rollema

 

Ik heb een bash script gemaakt om middels de dta file afkomstig van http://familie.jvkooten.info/fs de images te downloaden. Script is waarschijnlijk niet perfect maar doet voor mij hetgeen waar ik hem voor gemaakt heb. Input bestand is dus het .dta bestand. Deze moet je als argument meegeven aan het script.

In een volgende versie denk ik dat de XML bestanden van Familysearch ga gebruiken en er een perl programmaatje van maak.

Is er iemand die mij aan het basis XML bestand kan helpen? Dus het bestand waarin de provincies staan genoemd.

Bij deze en veel plezier ermee. Mocht je verbetering hebben laat het dan even weten.

#!/bin/bash

processLine(){
   LINE="$@"
   FIELD1=$(echo ${LINE} | awk '{ print $1 }')

   if [ ${FIELD1} == "Afbeeldingen" ]; then
         TYPE=$(echo ${LINE} | awk '{ print $3 }')
         TIMEFRAME=$(echo ${LINE} | awk '{ print $5 }')
         mkdir -p ${TYPE}/${TIMEFRAME}
   elif [ ${FIELD1:0:2} == "fs" ]; then

         FSWP=$(echo ${LINE} | awk -F"-" '{print $1}')
         DGS=$(echo ${LINE} | awk -F"_" '{print $3}')
         IMAGE=$(echo ${LINE} | awk -F"_" '{print $4}' | awk -F"." '{print $1}')
         echo -n "Download FWSWP: ${FSWP}, DGS: ${DGS}, IMAGE: ${IMAGE}: "
         if [ ! -f "${TYPE}/${TIMEFRAME}/${IMAGE}.jpg" ]; then
            curl "https://das.familysearch.org/das/v1/dgs:${DGS}_${IMAGE}/\$dist?fswp=${FSWP}" \
               --silent -o ${TYPE}/${TIMEFRAME}/${IMAGE}.jpg -q
            ErrorCode=$?
            if [ ${ErrorCode} -ne 0 ]; then
               echo "NOK, errorcode: ${ErrorCode}"
               exit ${ErrorCode}
            else
               FILETYPE=`file  ${TYPE}/${TIMEFRAME}/${IMAGE}.jpg | awk '{print $2}'`
               echo "OK, type: ${TYPE}, timeframe: ${TIMEFRAME}, filetype ${FILETYPE}"
            fi
         else
            FILETYPE=`file  ${TYPE}/${TIMEFRAME}/${IMAGE}.jpg | awk '{print $2}'`
            echo "OK, already downloaded, type: ${TYPE}, timeframe: ${TIMEFRAME}, filetype ${FILETYPE}"
         fi
   fi
}

FILE=""
if [ "$1" == "" ]; then
   FILE="/dev/stdin"
else
   FILE="$1"
   if [ ! -f ${FILE} ]; then
      echo "${FILE} : does not exists"
      exit 1
   elif [ ! -r ${FILE} ]; then
    echo "${FILE}: can not read"
      exit 2
   fi
   sed 's/  *$//;/^$/d' ${FILE} > ${FILE}.tmp
fi

exec 3<&0
exec 0<"${FILE}.tmp"
while read -r LINE
do
   processLine ${LINE}
done
exec 0<&3
rm -f ${FILE}.tmp
exit 0

Veel plezier ermee,

Karl Lovink

Karl Lovink

Herman,

Een bash script is een soort shell script. Wat je in windows op een commandoscherm kunt doen, doe je in Linux/Unix/Mac met bash/shell. Er zijn ook wel ports van bash voor windows.

Karl:

Snuffel eens rond op http://code.google.com/p/fs-thumbs/wiki/UserGuide misschien word je een tikje wijzer onder het kopje waarschuwing en commando - xml.

Jo Pol

verwijderd

Herman


Hallo,

Ik zie dat dit onderwerp vrij oud is.

Is er in 2012 een mogelijkheid om de akten van diverse jaren direct te downloaden en zoja.... graag hoe.

Bij voorbaat dank !

groetjes,

Jan

Janus




Plaats een reactie

Om reacties (en nieuwe onderwerpen) te plaatsen op het Stamboom Forum dient u eerst in te loggen! Nog geen lid? Registratie is gratis en snel!