Le groupe Processus vous permet d'affiner le fonctionnement des différents processus de parcours, d'exploration et de collecte. Ce groupe se décompose en 4 catégories :

Catégorie "Parcours"

Les options de cette catégorie vous permettent de modifier le comportement de parcours de InstantWalker.
Les options disponibles sont les suivantes :
  • Moteur de parcours / Profondeur par défaut : fixe la valeur par défaut de la profondeur de parcours (celle qui sera utilisée, par défaut, dans la fenêtre d'ajout dun site).
  • Moteur de parcours / Profondeur maximale : fixe la valeur maximale de la profondeur de parcours (cette valeur sera la limite supérieure du slider de sélection de profondeur dans la fenêtre d'ajout dun site).
  • Moteur de parcours / Largeur par défaut : fixe la valeur par défaut de la largeur de parcours (celle qui sera utilisée, par défaut, dans la fenêtre d'ajout dun site).
  • Moteur de parcours / Largeur maximale : fixe la valeur maximale de la largeur de parcours (cette valeur sera la limite supérieure du slider de sélection de largeur dans la fenêtre d'ajout dun site).
  • Options avancées / Mode anti-évasion : mode spécial indiquant que ne doivent être ajoutés à la file d'attente que les sites de rang 1, s'il s'agit de redirections scriptées. Ce mode est particulièrement utile pour scanner des annuaires n'utilisant pas de liens en dur.
  • Options avancées / Utiliser la liste noire : demande à InstantWalker d'exclure systématiquement toute url ayant une correspondance dans la liste noire.
  • Options avancées / Liste noire : voir l'utilisation des expressions régulières.

Catégorie "Exploration"

Les options de cette catégorie vous permettent de modifier le comportement d'exploration de InstantWalker.
Les options disponibles sont les suivantes :
  • Moteur d'exploration / Profondeur par défaut : fixe la valeur par défaut de la profondeur d'exploration (celle qui sera utilisée, par défaut, dans la fenêtre d'ajout dun site).
  • Moteur d'exploration / Profondeur maximale : fixe la valeur maximale de la profondeur d'exploration (cette valeur sera la limite supérieure du slider de sélection de profondeur dans la fenêtre d'ajout dun site).
  • Moteur d'exploration / Largeur par défaut : fixe la valeur par défaut de la largeur d'exploration (celle qui sera utilisée, par défaut, dans la fenêtre d'ajout dun site).
  • Moteur d'exploration / Largeur maximale : fixe la valeur maximale de la largeur d'exploration (cette valeur sera la limite supérieure du slider de sélection de largeur dans la fenêtre d'ajout dun site).

Catégorie "Analyse"

Les options de cette catégorie vous permettent de modifier la façon dont InstantWalker analyse les pages web.
Les options disponibles sont les suivantes :
  • Recherche de liens / Mode / Inclusion de page / Exclusion de page : voir l'utilisation des expressions régulières.
  • Analyse (en vue de la collecte) / Mode / Inclusion de page / Exclusion de page : voir l'utilisation des expressions régulières.
  • Options avancées / Rejeter les gros documents : permet de ne pas effectuer l'analyse des gros documents.
  • Options avancées / Taille limite : fixe la limite de taille pour un gros document (au dessus de cette taille un document sera considéré comme volumineux).
  • Options avancées / Filtrer par type de média : vérifier si le type de média est nativement exploitable par InstantWalker. Si ce n'est pas le cas, le rejeter.
  • Options avancées / Filtrer par extensions : vérifier si l'extension correspond à un document non exploitable par InstantWalker. Si c'est le cas, le rejeter.
  • Options avancées / Nettoyage préemptif : nettoyer la page (entités, codes, erreurs,...) avant toute analyse.

Catégorie "Collecte des IMs"

Les options de cette catégorie vous permettent de paramétrer comment InstantWalker collecte les adresses de messagerie instantanée.
Les options disponibles sont les suivantes :
  • Collecte de IMs / Mode / Inclusion d'IMs / Exclusion d'IMs : voir l'utilisation des expressions régulières.
  • Collecet des IMs / Collectera aussi les informations de présence : demande à InstantWalker de chercher les adresses en essayant aussi de comprendre les informations de présences des utilisateurs.
  • Nettoyage / Nettoyer les erreurs d'entité : demande à InstantWalker de traduire et nettoyer les éventuelles erreurs d'entités HTML présentes dans l'adresses (cas relativement fréquent).
  • Nettoyage / Nettoyer les caractères : demande à InstantWalker de nettoyer ce qui peut l'être notamment les paramètres situés dans l'adresse de messagerie instantanée.
  • Contre-mesures / Tenter de décoder : dans le cas du codage/encryptage de l'adresse, essayer de la décoder/décrypter.
  • Protection contre l'empoisonement / Activer la protection : vérifier que la page en cours d'analyse n'est pas une page d'empoisonement (page destinnée à saturer de fausses adresse les robots collecteurs).
  • Protection contre l'empoisonement / Nombre maximum d'IMs avant déclenchement : limite de déclenchement de la protection contre l'empoisonement.
Pour connaitre le détails et la signification des autres options, vous pouvez consulter les pages suivantes :
Ou alors, passez directement à l'utilisation des expressions régulières.