Une fois votre session constituée, il ne vous reste plus qu'à l'exécuter pour collecter effectivement des urls.

Pour lancer la collecte, appuyez sur le bouton exécuter du groupe de commande Contrôles ou faites CTRL+E au clavier... 

Suivi de l'exécution

Lors de l'exécution d'une session de collecte, vous êtes en permance informé de ce que fait LinkWalker :
  • la barre d'état vous indique le temps écoulé ainsi que le nombre d'urls collectées ;
  • la vue urls de la zone de résultats vous permet de visualiser les urls et noms de fichiers extraits ;
  • la vue sites vous donne un aperçu de la file de traitement : cette vue se rempli au fur et à mesure de la découverte de nouveaux sites à scanner (parcours des sites en cours d'analyse).

A n'importe quel moment de cette collecte, vous pouvez effectuer les opérations de supervision suivantes :
  • accéder au site découvert en cliquant droit sur son nom et en choisissant explorer le site ;
  • visualiser la page en cours d'analyse en cliquant droit sur le nom du site et en choisissant explorer la page en cours ; 
  • afficher la page de laquelle a été extraite une url particulière en double-cliquant sur cette adresse dans la vue urls.

File d'attente - Etats des sites

La vue sites offre en permanence l'état de la file de traitement et des sites au sein de cette liste. L'état des sites est signalé par des icônes dont la signification est la suivante :

Icone d'état du site Le site est placé dans la file d'attente, il sera traité dès que le gestionnaire de file d'attente mettra à sa disposition un thread opérationnel.
Icone d'état du site Le site est en cours d'analyse (parcours, exploration ou collecte). La page actuellement scannée est affichée dans la colonne "Page analysée" de la vue sites
Icone d'état du site L'analyse du site est terminée. L'opération s'est effectuée correctement
Icone d'état du site L'analyse du site n'a pas pu s'effectuer correctement : le site semble inaccessible. La colonne "Etat" peut donner une information complémentaire si les options d'affichage autorisent l'affichage des erreurs étendues.
Icone d'état du site LinkWalker refuse d'analyser ce site. Cela peut se produire si le site est dans la liste noire, si les options ne sont pas compatibles avec le media racine ou si ce media racine a été rejeté par une liste d'inclusion/exclusion.
Icone d'état du site Le gestionnaire de file d'attente a mis l'analyse de ce site en pause pour respecter une condition de comportement de l'agent web.
Icone d'état du site L'analyse de ce site a été annulée. La plus part du temps cela est dû à l'arrêt de l'exécution de la session par une action de l'utilisateur. Cela peut être aussi une décision prise par LinkWalker pour garantir sa sécurité ou sa stabilité.
Icone d'état du site L'analyse de ce site a été abandonnée. La plus part du temps cela est dû au dépassement d'un time-out.
Icone d'état du site L'analyse de ce site est terminée, mais le code de retour a spécifié une redirection sur un autre domaine. Si les options le permettent, un nouveau site contenant l'url de redirection a été créé et mis en file d'attente.
Icone d'état du site Le site a renvoyé un code d'erreur HTTP 4xx lors de la requête d'entête mais LinkWalker va rententer d'obtenir cette entête.  
Icone d'état du site Le booster de thread (uniquement sous Windows XP et Vista) n'a pas pu adapter son fonctionnement au site à analyser. Le booster nettoie les données et reprend l'analyse du site avec des paramètres plus adaptés. 
Icone d'état du site Le gestionnaire de file d'attente ne peut pas déterminer l'état du site. Une seule chose est sure, l'analyse de ce site est définitivement terminée.

Statistiques d'activité

Dans la zone de résultats, un onglet vous permet d'afficher les statistiques d'activité de LinkWalker. Ces statistiques fournisent un certain nombre d'indicateurs qualitatifs et quantitatifs quant à la collecte en cours. Il est donc intéressant de savoir à quoi ils correspondent.
  • Sites et Pages : propose un état chiffré de la file d'attente et de l'activité du gestionnaire de cette file.
  • URLs : indique l'état de fonctionnement du collecteur.  
  • Activité : permet de connaitre à quelle "vitesse" LinkWalker travaille. Peut donner des indication sur une éventuelle mauvaise connection internet ou un mauvais réglage du nombre de threads.
  • Sélectivité : affiche les valeur des taux de rejet pour les sites, pages et urls. Plus ces valeurs sont grandes (notamment la sélectivité pour les urls) plus votre collecte sera qualitative et moins elle sera quantitative.
  • Système : donne trois indicateurs "technique" de l'activité de LinkWalker.
Votre collecte d'urls est terminée, vous pouvez maintenant les exporter pour les utiliser...
 

Revenir