Skip to content

Script Python ini adalah web scraper sederhana yang dirancang untuk mengekstrak alamat email dari URL

Notifications You must be signed in to change notification settings

mamanwhide/EmailScrapper

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 

Repository files navigation

Email Scraper

██████╗ ███████╗  ██████╗      
██╔══██╗██╔════╝ ██╔═══██╗    
██████╔╝█████╗   ██╔═══██╝    
██╔═══╝ ██╔══╝   ███████      
██║     ███████╗ ███  ███     
╚═╝     ╚══════╝ ╚═╝  ╚═╝     

Made with ❤️ by Mamanwhide

Deskripsi

Script Python ini adalah web scraper sederhana yang dirancang untuk mengekstrak alamat email dari URL yang diberikan. Script ini menggunakan library requests untuk mengambil halaman web dan BeautifulSoup untuk mem-parsing konten HTML. Script ini dapat mengikuti link secara rekursif hingga batas tertentu dan mengumpulkan alamat email yang ditemukan di halaman tersebut.

Kebutuhan

  • Python 3.x
  • Library requests
  • Library BeautifulSoup

Anda dapat menginstal library yang diperlukan menggunakan pip:

pip install requests beautifulsoup4

Penggunaan

  • Clone atau unduh repositori ini.
  • Buka direktori tempat script berada.
  • Jalankan script menggunakan Python.
python3 email_scraper.py
  • Masukkan URL yang ingin Anda mulai scraping.
  • Masukkan batas jumlah halaman yang ingin di-scrape.

Ketergantungan

Pastikan ketergantungan berikut sudah terinstal:

  • BeautifulSoup4
  • requests Anda dapat menginstal ketergantungan ini melalui pip:
pip install -r requirements.txt

Disclaimer

Script ini dimaksudkan hanya untuk tujuan pendidikan. Scraping situs web tanpa izin dapat melanggar ketentuan layanan mereka. Gunakan script ini dengan bertanggung jawab dan hanya pada situs web di mana Anda memiliki izin eksplisit untuk scraping dat

About

Script Python ini adalah web scraper sederhana yang dirancang untuk mengekstrak alamat email dari URL

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages