Maintenant que vous avez compris les grands principes de MailWalker, vous avez
envie de le faire fonctionner... Ca tombe bien, avec les options par défaut vous
allez déjà pouvoir lancer une première collecte tout à fait
efficace.
Pour commencer, créez une nouvelle session, puis ajoutez un
site :
Saisissez l'adresse du site de départ puis spécifiez les
options de parcours et d'exploration.
Options de parcours
:Vous indiquez ici comment MailWalker doit parcourir les sites en
spécifiant la profondeur de lien (nombre de liens externe "en cascade" à suivre)
et la largeur de la recherche (nombre de liens externes maximum à suivre pour
chaque site).
En suivant l'exemple fourni (profondeur=2 et largeur=125), vous
indiquez à MailWalker de suivre les liens externes qui sont à une distance
maximale de 2 sites par rapport à l'URL saisie et de ne détecter que 125 liens
externes diffrérents par site. Le nombre de site maximum de rang 1 sera donc de
125 et celui de rang 2 (le rang maximum puisque l'URL saisie est au rang 0 par
convention) de 125x125. Le nombre maximum de sites à parcourir est donc
de...15750 ! Cela représente déjà une belle quantité !
Options
d'exploration :Vous indiquez ici comment MailWalker doit explorer chaque
site. La notion de profondeur et de largeur est la même que pour le parcours, à
part qu'ici elle s'applique à chaque site et que, par voie de conséquence, la
profondeur de liens n'intervient plus dans le calcul : le nombre maximal de
pages à explorer pour chaque site est celui indiqué en largeur, sans tenir
compte de la profondeur. Ainsi, en reprenant l'exemple précédant, le nombre
maximal de pages à explorer pour chaque site est de 110 et le nombre maximale de
sites est de 15750. Le total de toutes les pages à analyser sera donc de
15750x110 soit presque 2 millions de pages. Pensez-y lorsque vous réglez ces
paramètres de parcours et d'exploration...
Une fois que vous avez
ajouté le site (ou
les sites, si vous désirez démarrer une recherche
depuis plusieurs sites), vous pouvez lancer la collecte en choisissant
[exécuter].
Vous pouvez alors suivre l'état d'avancement de la collecte dans
la fenêtre principale de MailWalker : la
vue sites vous indique l'état
instantané de parcours et d'exploration et la
vue mails affiche les
adresses emails déjà collectées (et répondant aux critères de sélection choisis
dans les options).