Bonjour,
Pour réaliser ce que vous souhaitez, il y a trois manières de faire :
-
Utiliser LinkWalker pour extraire les bonnes URLs et les importer dans MailWalker. Inconvénient : il faut acheter LinkWalker (ceci dit, il y a 40% de réduction jusqu'au 20 juin...) !
-
Attendre la version 2.2 de MailWalker qui intégrera un module d'interrogation des moteurs de recherche les plus courants. Inconvénient : cette version ne sera pas dispo avant la rentrée et quand on a un mois de location devant soi, ce n'est pas jouable.
-
"Mettre les mains dans la graisse" avec les expressions régulières, car même si ce n'est pas une fonctionnalité prévue en standard dans MailWalker, il y a moyen de contourner le problème.
Nous allons ici explorer la troisième possibilité (pour les deux autres, je vous laisse seul juge).
Pour commencer, sachez que les modes d'exclusion et inclusion ne concernent que la présence de mots clés ou expressions au sein des pages (c'est d'ailleurs grâce à cela que MailWalker est aussi sélectif), inutile donc de souhaiter filtrer les urls avec ces listes... Ce que nous allons utiliser pour réaliser ce filtrage, c'est la liste noire. C'est elle qui permet de faire du filtrage d'url...
Après une rapide analyse de la page google, voici les quatre règles qu'il faut créer dans la liste noire :
Code :
Il y a moyen de "factoriser" en écrivant qu'une seule règle, mais avec quatre cela parait plus clair (enfin j'espère).
Une fois ceci fait, voici une des méthodes permettant d'arriver au résultat (il doit bien en avoir une bonne dizaine...) : scanner en deux passes (avec la réinjection)
-
Ajoutez les 8 ou 9 urls de recherche avec une largeur de parcours de 100 (il y a 100 urls par page) et une valeur de 1 pour les trois autres paramètres de parcours et exploration.
-
Vérifiez que l'utilisation de la liste noire est bien activée.
-
Exécutez la session.
- Une fois la session totalement exécutée,
réinjectez la liste (CTRL+R) avec 0 pour largeur et profondeur de parcours et des valeurs supérieures 1 pour la largeur et profondeur d'exploration (pour explorer en détail chacun de ces sites).
- Avant de lancer la deuxième exécution
supprimez les urls inutiles qui ont aussi été réinjectées (google).
-
Exécutez...
Voilà, j'espère que l'idée est à peu près claire pour vous. Si ce n'est pas le cas, n'hésitez pas à poser vos questions.
Pierre