Le groupe Processus vous permet d'affiner le fonctionnement des différents processus de parcours, d'exploration et de collecte. Ce groupe se décompose en 4 catégories :

Catégorie "Parcours"

Les options de cette catégorie vous permettent de modifier le comportement de parcours de LinkWalker.
Les options disponibles sont les suivantes :
  • Moteur de parcours / Profondeur par défaut : fixe la valeur par défaut de la profondeur de parcours (celle qui sera utilisée, par défaut, dans la fenêtre d'ajout dun site).
  • Moteur de parcours / Profondeur maximale : fixe la valeur maximale de la profondeur de parcours (cette valeur sera la limite supérieure du slider de sélection de profondeur dans la fenêtre d'ajout dun site).
  • Moteur de parcours / Largeur par défaut : fixe la valeur par défaut de la largeur de parcours (celle qui sera utilisée, par défaut, dans la fenêtre d'ajout dun site).
  • Moteur de parcours / Largeur maximale : fixe la valeur maximale de la largeur de parcours (cette valeur sera la limite supérieure du slider de sélection de largeur dans la fenêtre d'ajout dun site).
  • Options avancées / Mode anti-évasion : mode spécial indiquant que ne doivent être ajoutés à la file d'attente que les sites de rang 1, s'il s'agit de redirections scriptées. Ce mode est particulièrement utile pour scanner des annuaires n'utilisant pas de liens en dur.
  • Options avancées / Utiliser la liste noire : demande à LinkWalker d'exclure systématiquement toute url ayant une correspondance dans la liste noire.
  • Options avancées / Liste noire : voir l'utilisation des expressions régulières.

Catégorie "Exploration"

Les options de cette catégorie vous permettent de modifier le comportement d'exploration de LinkWalker.
Les options disponibles sont les suivantes :
  • Moteur d'exploration / Profondeur par défaut : fixe la valeur par défaut de la profondeur d'exploration (celle qui sera utilisée, par défaut, dans la fenêtre d'ajout dun site).
  • Moteur d'exploration / Profondeur maximale : fixe la valeur maximale de la profondeur d'exploration (cette valeur sera la limite supérieure du slider de sélection de profondeur dans la fenêtre d'ajout dun site).
  • Moteur d'exploration / Largeur par défaut : fixe la valeur par défaut de la largeur d'exploration (celle qui sera utilisée, par défaut, dans la fenêtre d'ajout dun site).
  • Moteur d'exploration / Largeur maximale : fixe la valeur maximale de la largeur d'exploration (cette valeur sera la limite supérieure du slider de sélection de largeur dans la fenêtre d'ajout dun site).

Catégorie "Analyse"

Les options de cette catégorie vous permettent de modifier la façon dont LinkWalker analyse les pages web.
Les options disponibles sont les suivantes :
  • Recherche de liens / Mode / Inclusion de page / Exclusion de page : voir l'utilisation des expressions régulières.
  • Analyse (en vue de la collecte) / Mode / Inclusion de page / Exclusion de page : voir l'utilisation des expressions régulières.
  • Options avancées / Rejeter les gros documents : permet de ne pas effectuer l'analyse des gros documents.
  • Options avancées / Taille limite : fixe la limite de taille pour un gros document (au dessus de cette taille un document sera considéré comme volumineux).
  • Options avancées / Filtrer par type de média : vérifier si le type de média est nativement exploitable par LinkWalker. Si ce n'est pas le cas, le rejeter.
  • Options avancées / Filtrer par extensions : vérifier si l'extension correspond à un document non exploitable par LinkWalker. Si c'est le cas, le rejeter.
  • Options avancées / Nettoyage préemptif : nettoyer la page (entités, codes, erreurs,...) avant toute analyse.

Catégorie "Collecte des URLs"

Les options de cette catégorie vous permettent de paramétrer comment LinkWalker collecte les urls.
Les options disponibles sont les suivantes :
  • Collecte d'URL / Mode / Inclusion d'url / Exclusion d'url : voir l'utilisation des expressions régulières.
  • Schéma d'URI / Accepter les protocoles suivants : permet de spécifier quels types de protocoles vous souhaitez capturer.
  • Types de fichiers / Accepter les types suivants : permet de spécifier quels types de fichiers vous souhaitez capturer. La reconnaissance du type s'effectue sur l'extension du fichier.
Pour connaitre le détails et la signification des autres options, vous pouvez consulter les pages suivantes :
Ou alors, passez directement à l'utilisation des expressions régulières.