Pour constituer effectivement une session de collecte, vous devez ajouter des sites à cette session et indiquer ce que InstantWalker doit faire de ces sites.
Constituer une session de collecte consiste donc à ajouter, modifier, supprimer, etc... des sites dans la
vue sites de InstantWalker.
Ajouter un site
Pour ajouter des sites, vous pouvez :
- les ajouter manuellement : pour ce faire, vous pouvez utiliser la touche INS, utiliser le bouton ajouter un site du groupe de commande gestion des sites, ou effectuer un clic droit dans la vue site de InstantWalker et choisir ajouter un site ;
- les importer depuis un fichier texte en choisissant l'item importer des sites / fichier texte du menu InstantWalker.
La fenêtre qui s'ouvre lors d'un ajout vous permet de paramétrer la façon dont InstantWalker va analyser un site.

URL :
Saisissez ici l'url du site. Vous pouvez aussi utiliser l'auto-complétion (commencez à saisir les premieres caractères de l'url pour voir les sites correpondants dans l'historique) ou l'historique complet (ouvrez la boite d'ascenceur à l'aide de la flêche dirigée vers le bas).
En cas d'importation, ce champs n'est pas utilisable.
Parcours des sites :
Choisissez ici les options de
parcours de ce site et des éventuels sites détectés depuis ce site :
- profondeur : fixe le nombre d'imbrication de sites à parcourir. Le site en cours d'édition a pour profondeur 0. Tous les sites détecté depuis ce site sont à la profondeur 1. Tous les sites détectés dans les sites à la profondeur 1 ont pour profondeur 2,... La profondeur est identique au rang (visible dans la vue sites).
- largeur : indique le nombre de sites à détecter par site analysé.
Attention, le nombre total de sites peut croitre très rapidement. Si
x est la largeur, au rang 0, le nombre de sites détectés sera de
x, au rang 1 il sera de
x2, au rang 2 il sera de
x3,... Ainsi, avec une profondeur de 3 et une largeur de 50, le nombre de sites ajoutés pourra être égal à 50 + 50
2 + 50
3 soit... plus de 127000 sites !
Exploration de chaque site :
Choisissez ici les options d'exploration de ce site et des éventuels sites détectés depuis ce site :
- profondeur : fixe le nombre d'imbrication de liens internes de chaque site à analyser. Le principe de fonctionnement est le même que pour la profondeur d'exploration à part qu'ici il s'agit exclusivement de liens internes à un site.
- largeur : indique le nombre total de pages à analyser pour un site.
Pour reprendre l'exemple chiffré précédent, si vous choisissez ici une largeur d'exploration de 50, le nombre total de pages à analyser sera supérieur à 6 millions...
Les onglets collecte et avancé :
Ces onglets donnent accès à des contrôles qui permettent de spécifier des paramètres et options propres à la collecte, à l'agent web,... Ces valeurs sont pré-renseignées avec les valeurs par défaut modifiables dans la fenêtre d'options de InstantWalker. Si vous les modifiez ici, ce ne sera que pour le site en cours d'édition.
Pour connaitre la signification de ces paramètres et options, veuillez consulter la page sur les options et paramètres de processus.
Modifier un site
Pour modifier un site préalablement ajouté, double-cliquez sur le nom de ce site ou faites un clic droit sur le site et choisissez
modifier le site.
Supprimer un site
Pour supprimer un ou plusieurs site, sélectionnez le ou les sites puis appuyer sur la touche
SUPPR ou faites un clic droit sur la sélection et choisissez
supprimer le(s) site(s).
Utilisation du presse-papiers
Vous pouvez utiliser les fonctions classiques du presse-papiers Windows pour ajouter des sites à votre session :
- copier (CTRL+C) : copie le site sélectionné ou l'ensemble de site sélectionné avec ses paramètres dans le presse papiers ;
- coller (CTRL+V) : colle un ou plusieurs site préalablement copiés avec les paramètres associés ;
- couper (CTR+X) : effectue une opération de copie avant de supprimer le ou les sites sélectionnés.
Le format des sites et leurs paramètres étant standard au sein des applications de la suite *Walker, vous pouvez effectuer ces opération de copier/couper/coller entre les applications de la suite. Il est donc tout à fait possible (par exemple) de copier un site et ses paramètres depuis LinkWalker vers InstantWalker.
Aide à la sélection
La
vue sites, propose un certain nombre de fonctions rendant plus aisée la sélection de site :
- Pour sélectionner un seul site cliquez sur son nom.
- Pour ajouter un site à la sélection, cliquez sur le nom d'un site qui n'est pas encore sélectionné en gardant la touche CTRL appuyée.
- Pour supprimer un site de la sélection, cliquez sur le nom d'un site qui est déjà sélectionné en gardant la touche CTRL appuyée.
- Pour sélectionner une plage continue de sites, sélectionnez le premier site normalement puis, tout en maintenant la touche SHIFT appuyée, sélectionnez le dernier site. Vous pouvez aussi faire glisser le curseur de souris sur la plage désirée en laissant le bouton gauche de la souris enfoncé.
- Pour sélectionner tous les sites présents dans la liste, utilisez la combinaison de touches CTRL+A.
- Pour inverser la sélection actuelle, appuyez sur CTRL+I.
- Pour désélectionner tout, utilisez CTRL+U.
- Pour une sélection complexe, vous pouvez combiner plusieurs de ces méthodes...
Réinjection de sites
A la suite de l'exécution d'une collecte, vous avez aussi la possibilité de créer une nouvelle session incluant tous les sites parcourus et explorés. Cette opération s'appelle la réinjection.
L'interêt d'un telle opération et d'effectuer une "première passe" sur un ou des sites, puis d'effectuer une "seconde passe" avec des options différentes.
Exemple de réinjection de sites : vous désirez extraire les adresses de messagerie instantanée de tous les sites référencés par un annuaire web. Vous choisissez pour la première passe d'ajouter l'adresse de l'annuaire avec pour options de parcours une profondeur de 0 (cas des liens scriptés) ou de 1 (cas des liens en dur) et une largeur de parcours supérieure aux nombre de sites référencés dans l'annuaire. S'il s'agit d'un annuaire dont les liens sont scriptés, vous activez les options nécessaires telles que suivi de liens scriptés et le mode anti-évasion. Puis vous exécutez la session. Une fois que tous les sites référencés ont été "découverts" par MailWalker (valeur de la colonne "liens" dans la
vue sites sur la ligne correspondant à l'annuaire - par exemple 1000/1000 pour un annuaire référençant 1000 sites webs), vous stoppez le parcours. Vous réinjectez alors la liste trouvée et choisissez une profondeur de parcours de 0 et une largeur d'exploration assez grande (n'oubliez pas de supprimer l'adresse de l'annuaire qui sera réinjecté avec les autres sites) : vous allez alors explorer l'ensemble de ces sites, et uniquements ceux-là, avec une grande précision...
RMQ : lorsque vous faites ce genre de parcours sur un annuaire, assurrez-vous que vous n'enfreignez pas les copyrights de l'annuaire en question.
Maintenant que vous avez constitué votre session de collecte, vous pouvez découvrir comment
exécuter cette collecte et extraire des adresse de messagerie instantanée.
Revenir