Ekstrak semua URL menggunakan sup yang indah dan python3
- 4377
- 680
- Dwayne Hackett
Tautan berikut akan mengekstrak semua URL untuk halaman web yang diberikan.
#!/usr/bin/env python3 # Python Versi: 3.4.2 # BS4 Versi: 4.3.2-2 dari Urllib.Minta impor urlopen dari bs4 impor html indah = urlopen ("http: // gnu.org ") # Masukkan URL Anda untuk mengekstrak bsobj = Beautifulsoup (html.membaca()); untuk tautan di dalam BSOBJ.find_all ('a'): mencetak(tautan.get ('href'))
Simpan skrip di atas ke dalam file misalnya. ekstrak-url.py
dan membuatnya dapat dieksekusi:
$ chmod +x ekstrak-url.py
Jalankan skrip:
$ ./ekstrak-url.py
Tutorial Linux Terkait:
- Cara Membangun Aplikasi Tkinter Menggunakan Objek Berorientasi…
- Bagaimana bekerja dengan WooCommerce Rest API dengan Python
- Cara Mengatur Server OpenVPN di Ubuntu 20.04
- Unduh File dari URL di Linux Menggunakan Baris Perintah
- Pengantar Otomatisasi Linux, Alat dan Teknik
- Hal -hal yang harus diinstal pada ubuntu 20.04
- Cara mengatur program default menggunakan alternatif pembaruan di…
- Cara Membaca dan Membuat File CSV Menggunakan Python
- Cara mengikis halaman web dari baris perintah menggunakan htmlq
- Cara menulis ekstensi nautilus dengan nautilus-python
- « Instalasi Alat S3 Command S3CMD Amazon di Debian Linux
- Uji kerentanan sistem bug shellshock bug linux »