Dernière mise à jour : 17 mai 2024
Pour une raison ou pour une autre vous désirez extraire tous les emails d'un site web ? Le script The Harvester va automatiser la tâche et rechercher des e-mails en utilisant une dizaine de ressources et moteurs de recherche.
The Harvester permet de récupérer rapidement et précisément les adresses mails et également les sous-domaines liés à un site web.
C'est est une sorte de web crawler ou web spider, un programme qui explore automatiquement Internet à la recherche de contenu ciblé.
Domaines d'application de l'outil The Harvester
The Harvester est souvent utilisé par les spammeurs pour collecter des adresses email à qui envoyer du spam, mais peut aussi être utilisé pour des tâches plus nobles:
- Vous pouvez par exemple récupérer les adresses d'une société pour l'envoi de CV
- Trouver l'email d'une ancienne connaissance.
- Couplé avec Maltego, il est possible d'auditer et tester un système d'information d'une entreprise
- Tester votre propre Site Web pour vous prémunir du spam ou du mail bombing.
Comment fonctionne The Harvester ?
Le script The Harvester va chercher sur la toile les adresses internet en cherchant le caractère @ puis en analysant les caractères avant et après. Si l'e-mail est validé par le programme, il sera ajouté à la base. C'est pour cela qu'il est déconseillé d'écrire son e-mail "en clair" sur les forums, les blogs, etc. Vous avez pu voir que sur certains sites les e-mails de contacts sont écrits sur des Jpeg ou omettent le caractère@ en écrivant pat exemple contact_gmail.com.
Comment utiliser The Harvester ?
The Harvester est intégré à Kali Linux. La façon la plus facile d'y accéder consiste à ouvrir une fenêtre de terminal et à exécuter la commande suivante: theharvester.
Si vous utilisez un système d'exploitation autre que Kali Linux, vous pouvez télécharger l'outil directement sur le site : http://www.edge-security.com.
Pour l'installer, ouvrez un terminal linux et clonez le repo Git :
Puis rendez-vous dans le dossier créé :
Il va falloir ensuite ajouter les librairies nécessaires pour la version de Python que nous devons utiliser
Pour rendre le script exécutable, faites un...
Terminez en lançant cette commande par exemple:
sur Kali Linux: theharvester -d www.funinformatique.com -b all
Cette dernière aura pour effet d'extraire les emails du site web www.funinformatique.com sur tous les moteurs de recherche et le réseaux sociaux connus par TheHarvester.
Examinons de plus près cette ligne de commande:
- L'option -d permet de préciser le site web cible.
- L'option -b précise le moteur de recherche employé pour trouver les adresse emails.
Nous avons plusieurs choix, notamment Google, Bing, Baidu, LinkedIn, Twitter et d'autres; dans mon cas, j'ai choisi l'option all qui permet d'effectuer la recherche dans tous les serveurs cités précédemment.
Après le lancement de cette commande, voici ce que j’obtiens:
J'ai pu récupéré 4 adresses emails affiché en clair sur le Web et 5 sous domaine.
The Harvester se relève très utile pour extraire les adresses mails d'un site web. A mettre dans sa trousse à outils des pentesters.
pour que sa fonctionne oubliée pas ( pip install requirements ) faut etre dans la racine du dossier
N’y a t-il pas un programme similaire pour la même tâche pour téléphone androïde?
J’ai la même erreur que toi, pourtant j’ai bien check et le module est présent : Requirement already satisfied: validators in /usr/local/lib/python2.7/dist-packages
Si quelqu’un a une idée..
[+] User-Agent in use: Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.1
[+] Searching everywhere
[+] Searching in Google: 100 results
[+] Searching in Github
[+] Searching in Yahoo + Github: 101 results
^CTraceback (most recent call last):
File « ./EmailHarvester.py », line 273, in
all_emails += plugins[search_engine][‘search’](domain, limit)
File « plugins/github.py », line 39, in search
app_emailharvester.process()
File « ./EmailHarvester.py », line 146, in process
time.sleep(1)
KeyboardInterrupt
Est ce normal ?
S’il vous plait j’ai suivis votre tutoriel , mais quand je lance la dernière commande j’ai l’erreur suivant :
Traceback (most recent call last):
File « ./EmailHarvester.py », line 42, in
import validators
ImportError: No module named ‘validators’
avez-vous une idée .
Merci pour l’aide.
Essayez d’exécuter cette commande: pip install validators