Extraer direcciones de correo electrónico de un sitio web

extraer correo electrónico del sitio web
extraer correo electrónico del sitio web

Última actualización: 17 de mayo de 2024

Por una razón u otra quieres extraer todos los correos electrónicos de un sitio web ? La secuencia de comandos La cosechadora va automatizar la tarea y busque correos electrónicos utilizando una docena de recursos y motores de búsqueda.

La cosechadora permite recuperar direcciones de correo electrónico de forma rápida y precisa y también los subdominios vinculados a un sitio web.

Es una especie de rastreador web o araña web, un programa que rastrea automáticamente Internet en busca de contenido específico.

Áreas de aplicación de la herramienta The Harvester

Los spammers suelen utilizar Harvester para recopilar direcciones de correo electrónico a quién enviar spam, pero también se puede utilizar para tareas más nobles:

  • Por ejemplo, puede recuperar las direcciones de una empresa para enviar CV
  • Encuentra el correo electrónico de un viejo conocido.
  • Junto con Maltego, es posible auditar y probar el sistema de información de una empresa
  • Pruebe su propio sitio web para evitar el spam o bombardeo de correo.

¿Cómo funciona The Harvester?

El script de Harvester buscará direcciones de Internet en la web buscando el carácter @ y luego analizando los caracteres antes y después. Si el correo electrónico es validado por el programa, se agregará a la base de datos. Es por esto que no se recomienda escribir su correo electrónico "en claro" en foros, blogs, etc. Es posible que haya visto que en algunos sitios, los correos electrónicos de contacto están escritos en archivos JPEG u omiten el carácter @ escribiendo, por ejemplo, contact_gmail.com.

¿Cómo utilizar The Harvester?

La cosechadora está integrada con Kali Linux. La forma más fácil de acceder es abrir una ventana de terminal y ejecutar el siguiente comando: el recolector.

Si está utilizando un sistema operativo que no sea Kali Linux, puede descargar la herramienta directamente desde el sitio: http://www.edge-security.com.

Para instalarlo, abra una terminal de Linux y clone el repositorio de Git:

clon de git https://github.com/laramies/theHarvester

Luego vaya a la carpeta creada:

cd la cosechadora

Luego tendremos que agregar las bibliotecas necesarias para la versión de Python que debemos usar

solicitudes de instalación de pip

Para hacer que el script sea ejecutable, haga un...

chmod + x theHarvester.py

Termine ejecutando este comando, por ejemplo:

./laCosechadora.py -d www.funinformatique.com -b todo
en Kali Linux: theharvester -d www.funinformatique.com -b todo

Este último tendrá el efecto deextraer correos electrónicos del sitio web www.funinformatique.com en todos los motores de búsqueda y redes sociales conocidos por TheHarvester.

Echemos un vistazo más de cerca a esta línea de comando:

  • La opción -d le permite especificar el sitio web de destino.
  • La opción -b especifica el motor de búsqueda utilizado para encontrar direcciones de correo electrónico.

Tenemos varias opciones que incluyen Google, Bing, Baidu, LinkedIn, Twitter y otras; en mi caso, elegí la opción all que te permite buscar en todos los servidores mencionados anteriormente.

Después de ejecutar este comando, esto es lo que obtengo:

Pude recuperar 4 direcciones de correo electrónico que se muestran en texto sin formato en la Web y 5 subdominios.

El Harvester se levanta muy útil para extraer direcciones de correo electrónico de un sitio web. Para poner en tu estuche de lápices herramientas pentesters.