Ekstrak semua URL menggunakan sup yang indah dan python3

Ekstrak semua URL menggunakan sup yang indah dan python3

Tautan berikut akan mengekstrak semua URL untuk halaman web yang diberikan.

#!/usr/bin/env python3 # Python Versi: 3.4.2 # BS4 Versi: 4.3.2-2 dari Urllib.Minta impor urlopen dari bs4 impor html indah = urlopen ("http: // gnu.org ") # Masukkan URL Anda untuk mengekstrak bsobj = Beautifulsoup (html.membaca()); untuk tautan di dalam BSOBJ.find_all ('a'): mencetak(tautan.get ('href'))

Simpan skrip di atas ke dalam file misalnya. ekstrak-url.py dan membuatnya dapat dieksekusi:

$ chmod +x ekstrak-url.py 

Jalankan skrip:

$ ./ekstrak-url.py 

Tutorial Linux Terkait:

  • Cara Membangun Aplikasi Tkinter Menggunakan Objek Berorientasi…
  • Bagaimana bekerja dengan WooCommerce Rest API dengan Python
  • Cara Mengatur Server OpenVPN di Ubuntu 20.04
  • Unduh File dari URL di Linux Menggunakan Baris Perintah
  • Pengantar Otomatisasi Linux, Alat dan Teknik
  • Hal -hal yang harus diinstal pada ubuntu 20.04
  • Cara mengatur program default menggunakan alternatif pembaruan di…
  • Cara Membaca dan Membuat File CSV Menggunakan Python
  • Cara mengikis halaman web dari baris perintah menggunakan htmlq
  • Cara menulis ekstensi nautilus dengan nautilus-python