Cara Menginstal dan Mengkonfigurasi Hive dengan Ketersediaan Tinggi - Bagian 7
- 1783
- 549
- Dwayne Hackett
Sarang lebah adalah Gudang data model dalam Hadoop Eco-System. Itu dapat melakukan sebagai alat ETL di atas Hadoop. Mengaktifkan Ketersediaan Tinggi (HA) di Hive tidak serupa seperti yang kami lakukan dalam layanan master seperti namenode dan manajer sumber daya.
Failover otomatis tidak akan terjadi Sarang lebah (Hiveserver2). Jika ada Hiveserver2 (HS2) Gagal, menjalankan pekerjaan yang gagal itu HS2 akan gagal. Kita perlu mengirimkan kembali pekerjaannya sehingga pekerjaan itu dapat berjalan di tempat lain Hiveserver2. Jadi, memungkinkan HA pada HS2 tidak lain adalah, meningkatkan jumlah HS2 komponen di Gugus.
Di artikel ini, kita akan melihat langkah -langkah untuk menginstal dan mengaktifkan Ketersediaan tinggi dari Sarang lebah.
Persyaratan
- Praktik Terbaik untuk Menyebarkan Hadoop Server di CentOS/RHEL 7 - Bagian 1
- Menyiapkan Prasyarat Hadoop dan Pengerasan Keamanan - Bagian 2
- Cara Menginstal dan Mengkonfigurasi Manajer Cloudera di CentOS/RHEL 7 - Bagian 3
- Cara menginstal CDH dan mengonfigurasi penempatan layanan di CentOS/RHEL 7 - Bagian 4
- Cara Mengatur Ketersediaan Tinggi untuk Namenode - Bagian 5
- Cara Mengatur Ketersediaan Tinggi untuk Manajer Sumber Daya - Bagian 6
Mari kita mulai…
Instalasi dan konfigurasi sarang
1. Masuk ke Manajer Cloudera di URL di bawah dan navigasikan ke Manajer Cloudera -> Tambahkan Layanan.
http: // 13.233.129.39: 7180/cmf/rumahTambahkan Layanan di Manajer Cloudera
2. Pilih Layanan 'Sarang lebah'.
Pilih Layanan Hive3. Tetapkan Layanan di Node.
- Gerbang - Itu adalah layanan klien tempat pengguna dapat mengakses sarang. Biasanya, layanan ini akan ditempatkan di Tepian node yang didedikasikan untuk pengguna.
- Hive Metastore - Ini adalah repositori pusat untuk menyimpan metadata sarang.
- Server webhcat - Ini adalah API web untuk hcatalog dan layanan hadoop lainnya.
- Hiveserver2 - Ini adalah antarmuka klien untuk eksekusi kueri di Hive.
Setelah dipilih server, klik 'Melanjutkan' untuk melanjutkan.
Tetapkan layanan sebagai node4. Hive Metastore membutuhkan database yang mendasari untuk menyimpan metadata. Di sini kami menggunakan default PostgreSQL database yang didirikan dengan CDH.
Detail database yang disebutkan di bawah ini akan dimasukkan secara otomatis, 'Tes koneksi'Akan dilewati karena database yang disebutkan akan dibuat dengan cepat. Secara real-time, kita perlu membuat database di database eksternal dan menguji koneksi untuk melanjutkan lebih lanjut. Setelah selesai, silakan klik 'Melanjutkan'.
Pengaturan Basis Data5. Konfigurasikan Hive Warehouse direktori, /pengguna/sarang/gudang adalah jalur direktori default untuk menyimpan tabel sarang. Klik 'Melanjutkan'.
Pilih Direktori Warehouse Hive6. Pemasangan sarang dimulai.
Kemajuan instalasi sarang7. Setelah instalasi selesai, Anda bisa mendapatkan 'Selesai'Status. Klik 'Melanjutkan'Untuk melangkah lebih jauh.
Instalasi Hive selesai8. Instalasi dan konfigurasi sarang berhasil diselesaikan. Klik 'Menyelesaikan'Untuk menyelesaikan prosedur pemasangan.
Selesaikan instalasi sarang9. Kamu dapat melihat Sarang lebah layanan ditambahkan Gugus melalui Dasbor Manajer Cloudera.
Layanan Hive ditambahkan10. Anda dapat melihat Hiveserver2 di dalam Contoh dari Sarang lebah. Kami telah menambahkan Hiveserver2 di dalam master1.
Manajer Cloudera -> Sarang lebah -> Contoh -> Hiveserver2.
Lihat instance hiveserver2Memungkinkan ketersediaan tinggi di sarang
11. Selanjutnya tambahkan peran sarang dengan pergi ke Manajer Cloudera -> Sarang lebah -> Tindakan -> Tambahkan peran Contoh.
Tambahkan contoh peran sarang12. Pilih server tempat Anda ingin menempatkan tambahan Hiveserver2. Anda dapat menambahkan lebih dari dua, tidak ada batasan. Di sini kami menambahkan satu tambahan Hiveserver2 di dalam master2.
Pilih Server untuk Hive Pilih server host13. Setelah dipilih server, klik 'Melanjutkan'.
Server ditambahkan14. A Hiverserver2 akan ditambahkan ke Instance sarang, Anda harus memulainya dengan pergi ke Manajer Cloudera -> Sarang lebah -> Contoh -> (Pilih Hiveserver2 ditambahkan baru) -> Tindakan untuk dipilih -> Awal.
Pilih Hive Server Mulai server Hive Mulai server Hive15. Sekali Hiveserver2 dimulai master2, Anda akan mendapatkan statusnya 'Selesai'. Klik Menutup.
Status selesai16. Anda dapat melihat, keduanya Hiveserver2s berlari.
Verifikasi status server sarangMemverifikasi ketersediaan sarang
Kita dapat menghubungkan Hiveserver2 Melalui Beeline yang merupakan klien tipis dan baris perintah. Itu menggunakan driver JDBC untuk membuat koneksi.
17. Masuk ke server dimana Gateway Hive sedang berlari.
[[Email Dilindungi] ~] $ BeelineTerhubung ke hiveserver2
18. Masukkan Jdbc String koneksi untuk menghubungkan Hiveserver2. Dalam hubungan ini, rangkaian Kami menyebutkan Hiverserver2 (master2) dengan nomor port defaultnya 10000. String koneksi ini hanya akan terhubung ke Hiveserver2 yang sedang berjalan master2.
menuju> !Hubungkan "JDBC: Hive2: // Master1.tecmint.com: 10000 "String koneksi JDBC
19. Jalankan Kueri Sampel.
0: jdbc: hive2: // master1.tecmint.com: 10000> Tampilkan basis data;Jalankan kueri sampel
Ini adalah database default yang datang.
20. Gunakan perintah di bawah ini untuk mengakhiri sesi sarang.
0: jdbc: hive2: // master1.tecmint.com: 10000> !berhentiBerhenti sesi sarang
21. Anda dapat menggunakan cara yang sama untuk terhubung Hiveserver2 berjalan terus master2.
menuju> !Hubungkan "JDBC: Hive2: // Master2.tecmint.com: 10000 "Sambungkan ke Hive Server
23. Kita dapat menghubungkan Hiveserver2 di dalam Penemuan Zookeeper mode. Dalam metode ini, kita tidak perlu menyebutkan Hiveserver2 di string koneksi sebagai gantinya kami menggunakan Penjaga kebun binatang untuk menemukan yang tersedia Hiveserver2.
Di sini kita dapat menggunakan penyeimbang beban pihak ketiga untuk menyeimbangkan beban di antara yang tersedia Hiverserver2. Konfigurasi di bawah ini perlu diaktifkan Mode Penemuan Zookeeper dengan pergi ke Manajer Cloudera -> Sarang lebah -> Konfigurasi.
Aktifkan Mode Penemuan Zookeeper24. Selanjutnya, cari properti "Hiveserver2 cuplikan konfigurasi lanjutan”Dan klik +
Simbol untuk menambahkan properti di bawah ini.
Nama: Hive.server2.mendukung.dinamis.melayani.Nilai Penemuan: Deskripsi Benar:Hiveserver2 cuplikan konfigurasi lanjutan
25. Setelah memasukkan properti, klik 'Simpan perubahan'.
Tambahkan properti26. Saat kami membuat perubahan pada konfigurasi, perlu memulai kembali layanan yang terkena dampak dengan mengklik simbol warna oranye untuk memulai kembali layanan.
Layanan restart27. Klik 'Restart basi' jasa.
Restart Layanan Basi28. Ada dua opsi yang tersedia. Jika cluster dalam produksi langsung, kita perlu lebih memilih restart bergulir untuk meminimalkan pemadaman. Seperti yang baru kami instal, kami dapat memilih opsi kedua 'Menggunakan kembali konfigurasi klien', dan klik'Restart sekarang'.
Menggunakan kembali konfigurasi klien29. Setelah restart selesai dengan sukses, Anda akan mendapatkan status 'Selesai'. Klik 'Menyelesaikan'Untuk menyelesaikan prosesnya.
Selesaikan prosesnya30. Sekarang kami akan menghubungkan Hiveserver2 menggunakan Penemuan Zookeeper mode. Dalam Jdbc koneksi, string yang perlu kita gunakan Penjaga kebun binatang server dengan nomor portnya 2081. Kumpulkan server Zookeeper dengan pergi ke Manajer Cloudera -> Penjaga kebun binatang -> Contoh -> (Catat nama server).
Server ZookeeperIni adalah tiga server yang memiliki Zookeeper, 2181 adalah nomor port.
master1.tecmint.com: 2181 master2.tecmint.com: 2181 pekerja1.tecmint.com: 2181
31. Sekarang masuk ke menuju.
[[Email Dilindungi] ~] $ BeelineTerhubung ke reeline
32. Masukkan Jdbc String koneksi seperti yang disebutkan di bawah ini. Kami harus menyebutkan Mode Penemuan Layanan Dan Namespace Zookeeper. 'hiveserver2'adalah namespace default dari hiveserver2.
menuju>!Hubungkan "JDBC: Hive2: // Master1.tecmint.com: 2181, master2.tecmint.com: 2181, pekerja1.tecmint.com: 2181/; servicediscoverymode = zooKeeper; zookeepernamespace = hiveserver2 "Masukkan string koneksi JDBC
33. Sekarang sesi terhubung Hiveserver2 berjalan terus master1. Jalankan kueri sampel untuk divalidasi. Gunakan perintah di bawah ini untuk membuat database.
0: jdbc: hive2: // master1.tecmint.com: 2181, Mast> Buat tecmint basis data;Buat database
34. Gunakan perintah di bawah ini untuk mendaftar database.
0: jdbc: hive2: // master1.tecmint.com: 2181, Mast> Show Database;Daftar database
35. Sekarang kami akan memvalidasi ketersediaan tinggi Mode Penemuan Zookeeper. Pergi ke Manajer Cloudera dan hentikan Hiveserver2 pada master1 bahwa kami telah menguji di atas.
Manajer Cloudera -> Sarang lebah -> Contoh -> (Pilih Hiveserver2 pada master1) -> Tindakan untuk dipilih -> Berhenti.
Pilih Hive Server Hentikan server Hive36. Klik 'Berhenti'. Setelah berhenti, Anda akan mendapatkan statusnya 'Selesai'. Verifikasi Hiveserver2 pada master1 dengan menavigasi ke Sarang lebah -> Contoh.
Hentikan server Hive Verifikasi Hive Server37. Masuk ke menuju dan hubungkan Hiveserver2 menggunakan hal yang sama Jdbc string koneksi dengan Mode Penemuan Zookeeper seperti yang kami lakukan dalam langkah -langkah di atas.
[[Email Dilindungi] ~] $ Beeline Beeline>!Hubungkan "JDBC: Hive2: // Master1.tecmint.com: 2181, master2.tecmint.com: 2181, pekerja1.tecmint.com: 2181/; servicediscoverymode = zooKeeper; zookeepernamespace = hiveserver2 "Hubungkan hiveserver2
Sekarang Anda akan terhubung ke Hiveserver2 berjalan terus master2.
38. Validasi dengan kueri sampel.
0: jdbc: hive2: // master1.tecmint.com: 2181, Mast> Show Database;Validasi kueri sampel
Kesimpulan
Dalam artikel ini, kami telah melalui langkah -langkah terperinci untuk memiliki Hive Data Warehouse model di kami Gugus dengan Ketersediaan tinggi. Dalam lingkungan produksi real-time, lebih dari tiga Hiveserver2 akan ditempatkan dengan Mode Penemuan Zookeeper diaktifkan.
Di sini, semua Hiveserver2 mendaftar dengan Penjaga kebun binatang di bawah umum Namespace. Zookeeper secara dinamis menemukan yang tersedia Hiveserver2 dan menetapkan sesi sarang.
- « Cara menginstal vmware workstation 16 pro pada sistem linux
- Cara memasang cluster kubernetes di centos 8 »