Accueil > Support > Forums > Expressions Régulières > Prise en main de MW
Aller à la page 1Aller à la page 012Aller à la page 2Aller à la page 2
Avatar
collier
Messages : 10
Bonjour !

j'ai essayé de prendre MW en main il y a deux jours après avoir essayé d'autres versions d'essai de logiciels. MW me séduit cependant avec une liste d'url identique, j'obtiens plus de résultats avec un logiciel concurrent, "MailingBuilder".
Je préfèrerais vraiment m'abonner à MW mais comment affiner ou améliorer les performances afin de trouver également autant de résultats qu'avec l'autre logiciel ?
Mes recherches concerne surtout les emails uniquement sur le nom de domaine et pas sur les domaines liés.
Par exemple, je ne comprends pas pourquoi MW ne "pêche" pas les emails sur les sites suivants alors qu'ils figurent bien en évidence sur les pages de ceux-ci. Exemple : www.gci-inge.com et www.aamima.fr qui ont chacun une page contact avec l'email en évidence et cliquable.
Dois apprendre à mieux configurer MW ?

Cordialement
28-01-2009 19:43
Avatar
Pierre Lannoy
Modérateur
Messages : 174
Bonjour,

Je suis allé voir (et j'ai testé avec MailWalker) les deux sites dont vous parlez.
Concernant le premier (www.gci-inge.com) MailWalker ne pourra jamais collecter le mail présent (ni aucun autre collecteur de mail de ma connaissance) car l'adresse mail est en fait une image (non cliquable)...
Concernant le second site (www.aamima.fr), cela fonctionne très bien à condition de choisir une profondeur d'exploration supérieure à 2 (de manière générale, quand vous pensez que vous allez scanner des sites "pages persos" de Orange, choisissez une profondeur d'exploration beaucoup plus grande que la normale).

Pour répondre à votre question de manière plus générale, MailWalker est plus sélectif que ses concurents : si vous choisissez d'activer des options de type inclusion/exclusion, cela est normal de trouver moins de mail que les autres (et encore...). Mais si vous n'activez aucune de ces options (inclusion/exclusion), vous trouverez bien plus de mail qu'avec les concurents...
Je vous conseille de lire notre étude comparative (http://www.websynaptics.com/fr/article/benchmarking/mailwalker.html) pour vous rendre compte, en chiffres, que ce que j'avance n'est pas juste "pour faire de la pub"... Et si vous avez envie de reproduire ces test, vous pouvez suivre cette procédure : http://www.websynaptics.com/fr/forums/topic/58.html ...

Enfin, pour finir, une règle générale, quand on estime que des sites ne sont pas explorés correctement par MailWalker : augmenter les valeurs de largeur et profondeur d'exploration résoud souvent le problème.

Voilà, j'espère que je vous aurais été d'une quelconque aide..
N'hésitez pas à me tenir au courant.

Pierre
28-01-2009 22:54
Avatar
collier
Messages : 10
Merci bcp pour votre réponse, bien sûr fort utile.

En effet l'adresse de GCI est une image.

Peut-être pour vous aider à me répondre, je vais préciser ce pourquoi j'ai besoin de MW. J'ai sélectionné grâce à une base de données à laquelle je suis abonné une liste d'entreprises selon des critères économiques et d'activité. Je possède pour cette liste les url des sociétés. C'est pour pouvoir leur écrire que je souhaite récolter les adresses emails, mais uniquement des sociétés de ma liste. C'est la raison pour laquelle je souhaite utiliser la fonction de profondeur avec parcimonie pour ne pas me retrouver avec des adresses emails de sociétés qui n'ont rien à voir avec les sociétés ciblées.
J'espère que cela est un peu plus clair et pourra vous aider à me répondre plus concrètement également.
Cordialement
CO
28-01-2009 23:08
Avatar
Pierre Lannoy
Modérateur
Messages : 174
Je comprends votre démarche... et persiste : la profondeur d'exploration n'est pas la profondeur de parcours :

exploration = dans le même site (visite d'un seul et même site)
parcours = dans des sites différents (suivi des liens pointants vers des sites externes)

Ainsi, pour être certain de visiter intégralement un site (votre cas), c'est la profondeur et largeur d'exploration qu'il faut augmenter. Et pour visiter un maximum de sites externes, c'est la profondeur et largeur de parcours qu'il faut augmenter.

Est-ce que cela vous parait plus clair, dit comme cela ?
Si ce n'est pas le cas, n'hésitez pas à me le dire, je n'ai pas l'habitude d'être un modèle de clareté :P

Pierre
28-01-2009 23:17
Avatar
collier
Messages : 10
Merci
C'est de plus en plus clair... Donc si j'ai bien compris, dans mon cas, je dois paramétrer la profondeur de parcours à 0 pour ne pas aller sur les liens d'autres sites et je dois augmenter la profondeur d'exploration de chaque site à 3 ou 4 par exemple!
Mais dans le cas concret de www.aamima.fr, comment dois paramétrer pour qu'enfin apparaisse son adresse email ?

Christophe
28-01-2009 23:24
Avatar
Pierre Lannoy
Modérateur
Messages : 174
Dans votre cas, si vous êtes sur de ne vouloir sortir de votre liste sous aucun pretexte, allez dans les options de parcours et cochez le "mode anti-évasion" (c'est exactement à cela qu'il sert) vous n'aurez plus alors à vous soucier de largeur et profondeur de parcours... Puis augmenter la profondeur d'exploration (n'hésitez pas à aller jusqu'à 6 ou 7 au moins si vous n'etes pas sur...). Concernant la largeur d'exploration (nombre de page max visitée par site) si tous ceux que vous voulez scanner sont du même type que les deux exemples, 20 sera largement suffisant (rien ne vous empêche de mettre à 200 ou 300, pour être sur de bien "ratisser").

Dans le cas concret que vous citez avec une profondeur d'exploration de 3 cela fonctionne parfaitement...

Pierre
28-01-2009 23:36
Avatar
collier
Messages : 10
Je suis désolé de revenir à la charge avec aamima mais je n'arrive jamais quelle que soit la configuration à obtenir son adresse email... c'est commme s'il ne visitait jamais la page http://pagesperso-orange.fr/aamima/0200/index.html

A votre avis, selon les sites, suis-je obligé de déroger à l'anti-évasion et le laisser butiner autre part ? car par exemple dans la courte liste que je vous envoie, il semblerait que je n'obtienne rien chez www.abllights.com tant que je l'empêche d'avoir recours à des liens !
Il faudra certainement du temps avant que je comprenne toutes les subtilités...

Sinon, concernant l'abonnement, si je m'abonne là ce soir, ça peut déjà fonctionner ? quitte à laisser tourner mon pc cette nuit pour qu'il aille à la chasse ? Cependant, il faut que je sache exactement comment configurer ma recherche avec de lancer mon fichier d'url, pour éviter d'avoir de mauvaises surprises demain matin...
29-01-2009 00:01
Avatar
Pierre Lannoy
Modérateur
Messages : 174
Vous avez effectivement raison, en mode anti-évasion, les pages persos orange avec domaine ne peuvent pas fonctionner (comme quoi, je ferais mieux de me relire parfois...). Donc soit vous saisissez http://pagesperso-orange.fr/aamima et vous pouvez utiliser le mode anti-évasion, soit vous saisissez http://www.aamima.fr/ sans le mode anti-évasion.
Les deux fonctionnent correctement, je viens de tester...

Concernant l'abonnement, il s'agit d'une clé qui vous est envoyée par mail (généralement dans la demi-heure qui suit votre achat) et que vous saisissez dans MailWalker (menu "?/activation de licence") pour le "débrider" pour un mois, deux mois,...

Pierre


PS : pour des raisons légales et de confidentialité, j'ai supprimé votre pièce jointe...
29-01-2009 00:32
Avatar
collier
Messages : 10
Je viens de passer la commande pour un abonnement d'un mois...
Après qques tests, je vais laisser tourner ma liste cette nuit et voir ce qui ressort.
La difficulté sera certainement de séparer les emails trouvés correspondant réellement à ma liste d'url et ceux émanant de liens et dont je n'ai pas besoin.
Dans tous les cas, merci pour votre rapidité de réponse.
Cordialement
CO
29-01-2009 02:03
Avatar
collier
Messages : 10
Suite à l'achat de MW, celui-ci tourne depuis hier soir à l'obtention d'emails...
Cependant qques questions :
- étant donné qu'il monopolise quasiment toutes les ressources du pc, je ne peux plus vraiment travailler pendant ce temps. Est-il possible d'arrêter les actions en cours et de les sauvegarder afin de le relancer plus tard ou est-ce qu'on prend le risque de tout perdre en faisant cela et donc les 3500 emails déjà trouvés ?
- Abonnement sur un poste signifie-t-il que je ne peux enregistrer le logiciel que sur un poste ou qu'il n'est possible possible de travailler que de manière individuelle dessus. Car je serai en fait prêt à installer le logiciel sur un autre pc un peu moins puissant mais que je puisse laisser tourner uniquement à cet effet, pendant que je travaillerai sur mon poste principal.
Merci
Cdlt
Christophe
29-01-2009 18:53
Avatar
Pierre Lannoy
Modérateur
Messages : 174
Bonjour,

Pour répondre à vos deux questions :

- après avoir fait cela (arrêter), lorsque MailWalker aura effectivement arrêté tous les threads, vous aurez, bien sur, la possibilité d'exporter les mails trouvés. Néanmoins vous ne pourrez pas "reprendre" l'exécution où elle en était. Vous ne pourrez que recommencer depuis le début... Vous avez aussi la possibilité d'exporter (CTRL+F1) les mails ou les copier dans le presse-papiers windows (CTRL+C) à n'importe quel moment (même pendant l'exécution de la session).
Si votre PC est trop monopolisé lorsque vous exécutez une session, nous vous recommandons de baisser le nombre de threads (25 est un chiffre raisonnable) et, de manière générale, quelque soit la puissance de votre PC de ne pas laisser MailWalker utiliser tous les processeurs (laissez-en au moins 1 de libre).

- Concernant les licences, le fonctionnement est différent selon que vous avez une licence "location" ou "complète". En mode location pour 1 mois (je crois que c'est votre cas), vous ne pouvez effectivement activer la licence que sur un seul PC et une seule et une seule fois... Tous les détails de licences sont sur cette page : http://www.websynaptics.com/articles_4_FR-MailWalker--5-editions-differentes.html

Voilà, j'espère que cela répond à vos questions.

Pierre
29-01-2009 19:46
Avatar
collier
Messages : 10
Oui merci, tout est tjs très clair... Il le faut d'ailleurs, vu le nombre de questions que je suis capable de générer...

C'est dommage, en effet que je ne puisse pas utiliser mon abonnement sur un autre poste, même en utilisant à chaque fois uniquement un seul poste à la fois car je suis obligé finalement d'uniquement l'utiliser au bureau et je ne pourrai pas continuer à travailler ce WE depuis mon home office.

Sinon, autre question : pendant le process de recherche lorsque des sites issus de la visite des liens ne nous intéressent pas, y-a-t-il la possibilité de les supprimer de la liste et ainsi éviter que du temps soit consacré à leur exploration?
29-01-2009 20:50
Avatar
Pierre Lannoy
Modérateur
Messages : 174
Malheureusement, la modification de la file d'attente (supprimer, modifier,... un site en cours d'exécution) n'existe pas dans la version 1.x de MailWalker.

Cela est prévu dans la 2.1. Sachant que la 2.0 devrait sortir dans moins de 15 jours...
29-01-2009 21:08
Avatar
collier
Messages : 10
Ah d'accord, alors je vais prendre mon mal en patience et laisser tourner jusqu'au bout alors... Cela veut dire que ma demande n'est pas un cas unique si cette fonctionnalité a été retenue pour les nouvelles fonctionnalités.
Mon interrogation la plus pressante lorsque MW aura fini de trouver tous les emails, ce sera de savoir comment trier efficacement les emails se rapportant à mes url d'origine et ceux issus des "divagations" de visites de liens...
29-01-2009 21:27
Avatar
Pierre Lannoy
Modérateur
Messages : 174
Bonjour,

Il n'y a pas de limitation concernant le nombre de mails, donc pas de soucis de ce côté là.

En revanche je ne vois pas de quelles options vous parlez :confused:

Pierre
30-01-2009 21:01
Aller à la page 1Aller à la page 012Aller à la page 2Aller à la page 2