Le groupe
Connexion vous permet de spécifier comment InstantWalker va se connecter à Internet ainsi que les options de l'agent web. Ce groupe se décompose en 3 catégories :
Catégorie "Réseau"
Les options de cette catégorie vous permettent de configurer l'accès au réseau internet.
Les options disponibles sont les suivantes :
- Serveur proxy / Utiliser un serveur proxy pour accéder à internet : indique à  InstantWalker de passer par un serveur proxy pour accéder à Internet.
- Serveur proxy / Authentification basique : active l'authentification basique pour l'accès au proxy.
- Serveur proxy / Serveur - Port - Utilisateur - Mot de passe : paramètres nécessaires à  InstantWalker pour accéder au proxy.
Une méthode simple pour savoir si InstantWalker doit utiliser un serveur proxy et de vérifier ces paramètres dans votre navigateur internet. Par exemple dans Microsoft Internet Explorer, allez outils / options internet / connexions puis cliquez sur le bouton paramètres réseau...
Catégorie "Agent Web"
Les options de cette catégorie vous permettent de modifier le fonctionnement du robot d'exploration (spider) intégré à  InstantWalker.
Les options disponibles sont les suivantes :
- Options générales / Activer le mode furtif : modifie le user agent de InstantWalkerpour qu'il ne soit pas détecté comme robot par les sites qu'il scanne.
- Options générales / Agressivité : modifie l'agressivité de l'agent web, en dehors de toute considération liée au comportement et support des sites lents.
- Options générales / Timeout http : temps maximal d'attente d'une page web. Au delà de ce temps, l'agent web considerera que la page ne peut pas être atteinte.
- Options générales / Reprises sur erreur : nombre de fois ou l'agent web doit retenter d'obtenir une page (dans le cas d'erreur dans la page ou de timeout).
- Options générales / Pause maximale : temps maximal entre deux requêtes à un même serveur.
- Comportement / Méthode adaptative : permet à l'agent web de moduler son agressivité en fonction des conditions réseau et temps de réponse du serveur web.
- Comportement / Simuler le comportement humain : demande à l'agent web de se comporter comme s'il était un navigateur internet utilisé par un humain.
- Comportement / Mais sans dépasser x millisecondes : limite de temps de la pause induite par la simulation du comportement humain.
- Gestion des cookies / Activer le gestionnaire de cookies : permet à  InstantWalker de recevoir des cookies et d'en envoyer lorsque cela est nécessaire pour les sites parcourus.
- Support des sites lents / Accepter les sites dont les temps de réponses sont dégradés : demande à l'agent web d'accepter de scanner quand même les sites très lents.
- Support des sites lents / Adapter l'activité de l'agent pour les sites dont les temps de réponses sont dégradés : demande à l'agent web de complètement modifier son comportement pour les sites très lents.Â
- Support des sites lents / Facteur d'adaptation : pour ne pas trop pénaliser les perfomances de InstantWalker, vous pouvez dire à l'agent web de ne s'adapter que modérément (faible) ou totalement (extrème) aux temps de réponses constatés pour les sites très lents.
- Version de l'agent web : affiche le user agent de InstantWalker lorsqu'il n'est pas en mode furtif.
Catégorie "Technologies"
Les options de cette catégorie vous permettent de sélectionner les technologies et standards que InstantWalker peut utiliser.
Les options disponibles sont les suivantes :
- Redirections / Support des redirections HTTP : demande à  InstantWalker d'interpréter les codes HTTP 301, 302 et 307 qui correpondent à des redirections de pages web.
- Redirections / Support des redirections meta-refresh : demande à  InstantWalker de suivre les redirections incluses dans la section header des pages web.
- Redirections / Support des redirections scriptées : demande à  InstantWalker de détecter et suivre les redirections scriptées en utilisant le paramétrage du détecteur et du nettoyeur.
- Redirections / Rebonds maximum : pour ne pas rentrer dans une "boucle infinie" de redirection, vous devez indiquer une valeur maximale de redirections imbriquées.
- Redirections / Détecteur de liens scriptés : voir l'utilisation des expressions régulières.
- Redirections / Nettoyeur de liens scriptés : voir l'utilisation des expressions régulières.
- Particularité HTML/XML / Support des frames et iframes : demande à  InstantWalker de scanner aussi les frames et iframes telles que définies par le W3C.
- Particularité HTML/XML / Support des flux XML : demande à  InstantWalker de détecter et scanner les flux XML.
- Particularité HTML/XML / Support des champs [cdata[...]] : demande à  InstantWalker de tenter d'exploiter les données présentes dans les champs [cdata[...]].
- Sites spéciaux / Support des sites sécurisés : active la gestion des sites SSL (sites dont l'url commence par https://...).
- Sites spéciaux / Support des sites compressés : active la gestion des sites nativement compressés.
- Options avancées / Forcer l'encodage URL des paramètres de requête HTTP : demande à  InstantWalker de toujours encoder les paramètres de la requête HTTP même quand il estime que cela n'est pas nécessaire.
Pour connaitre le détails et la signification des autres options, vous pouvez consulter les pages suivantes :
Ou alors, passez directement à l'
utilisation des expressions régulières.