Fungsi string awk

Fungsi string awk

AWK adalah alat pemrosesan teks yang kuat yang biasanya digunakan untuk memanipulasi dan menganalisis data di lingkungan UNIX dan Linux. Salah satu fitur utama AWK adalah kemampuannya untuk memanipulasi string menggunakan berbagai fungsi bawaan.

Dalam artikel ini, kami akan mengeksplorasi beberapa fungsi manipulasi string yang paling umum digunakan dalam AWK.

  • panjang (string): Mengembalikan panjang string yang ditentukan.
  • substr (string, start, length): Mengembalikan substring dari string yang ditentukan, mulai dari posisi yang ditentukan dan dengan panjang yang ditentukan.
  • indeks (string, substring): Mengembalikan posisi kemunculan pertama dari substring yang ditentukan dalam string yang ditentukan.
  • split (string, array, pemisah): Membagi string yang ditentukan menjadi array substring, menggunakan pemisah yang ditentukan untuk menentukan di mana harus membagi string.
  • sub (regexp, penggantian, string): Ini menggantikan pencocokan ekspresi reguler pertama yang terjadi dari string dengan "penggantian".
  • GSUB (RegExp, penggantian, string): Mengganti semua kemunculan ekspresi reguler yang ditentukan dalam string yang ditentukan dengan string penggantian yang ditentukan.
  • cocok (string, regexp): Mencari string yang ditentukan untuk kemunculan pertama dari ekspresi reguler yang ditentukan, dan mengembalikan posisi pertandingan dan panjang substring yang cocok dalam array.
  • Tolower (String) dan Toupper (String): Konversi semua karakter huruf besar atau kecil di string yang ditentukan ke karakter kecil atau huruf besar, masing -masing.

Mari kita pahami semua fungsi string satu per satu termasuk contoh:

1. panjang (string)

Itu panjang (string) fungsi mengembalikan panjang string yang ditentukan. Misalnya, jika kita ingin menemukan panjang string "Halo Dunia!", kita dapat menggunakan kode berikut:

awk 'begin cetak panjang ("halo, dunia!") '
1awk 'begin cetak panjang ("halo, dunia!") '

Ini akan menghasilkan "13", Sejak string “Halo, dunia!”Memiliki 13 karakter.

2. substr (string, start, length)

Itu substr (string, start, length) fungsi mengembalikan substring dari string yang ditentukan, mulai dari posisi yang ditentukan dan dengan panjang yang ditentukan. Misalnya, jika kita ingin mengekstrak 5 karakter pertama dari string "Halo Dunia!", kita dapat menggunakan kode berikut:

AWK 'Begin Print Substr ("Halo, Dunia!", 1, 5) '
1AWK 'Begin Print Substr ("Halo, Dunia!", 1, 5) '

Ini akan menghasilkan "Halo", Karena 5 karakter pertama dari string adalah "halo".

3. indeks (string, substring)

Itu indeks (string, substring) Fungsi Mengembalikan posisi kemunculan pertama dari substring yang ditentukan dalam string yang ditentukan. Misalnya, jika kita ingin menemukan posisi "dunia" substring dalam string "Halo, dunia!”, Kita dapat menggunakan kode berikut:

awk 'begin cetak indeks ("halo, dunia!", "Dunia")'
1awk 'begin cetak indeks ("halo, dunia!", "Dunia")'

Ini akan menghasilkan "8", Karena "dunia" substring dimulai pada posisi ke -8 di string.

4. split (string, array, pemisah)

Itu split (string, array, pemisah) Fungsi membagi string yang ditentukan menjadi array substring, menggunakan pemisah yang ditentukan untuk menentukan di mana harus membagi string. Misalnya, jika kita ingin membagi string "apel, pisang, oranye" menjadi array substring menggunakan koma sebagai pemisah, kita dapat menggunakan kode berikut:

awk 'begin split ("apel, pisang, oranye", a, ","); untuk (i dalam a) cetak [i] '
1awk 'begin split ("apel, pisang, oranye", a, ","); untuk (i dalam a) cetak [i] '

Ini akan menghasilkan:

Output apel pisang oranye 

5. sub (regexp, penggantian, string)

Itu sub (regexp, penggantian, string) Fungsi menggantikan kemunculan pertama dari ekspresi reguler yang ditentukan dalam string yang ditentukan dengan string penggantian yang ditentukan. Misalnya, jika kita hanya ingin mengganti kejadian pertama huruf "o" di string "Halo, dunia!"Dengan huruf" A ", kita dapat menggunakan kode berikut:

AWK 'Begin Sub ("O", "A", "Hello, World!"); cetak '
1AWK 'Begin Sub ("O", "A", "Hello, World!"); cetak '

Ini akan menghasilkan “Hella, dunia!", Karena hanya kemunculan pertama huruf "o" telah diganti dengan huruf "a".

6. GSUB (RegExp, penggantian, string)

Fungsi GSUB (RegExp, Penggantian, String) menggantikan semua kejadian dari ekspresi reguler yang ditentukan dalam string yang ditentukan dengan string penggantian yang ditentukan. Misalnya, jika kita ingin mengganti semua kemunculan huruf "o" di string "Halo, dunia!"Dengan huruf" A ", kita dapat menggunakan kode berikut:

awk 'begin gsub ("o", "a", "halo, dunia!"); cetak '
1awk 'begin gsub ("o", "a", "halo, dunia!"); cetak '

Ini akan menghasilkan “hella, warld!", Karena semua kemunculan huruf" o "telah diganti dengan huruf" A ".

7. cocok (string, regexp)

Itu cocok (string, regexp) Fungsi mencari string yang ditentukan untuk kemunculan pertama dari ekspresi reguler yang ditentukan, dan mengembalikan posisi pertandingan dan panjang substring yang cocok dalam array. Misalnya, jika kita ingin menemukan posisi dan panjang kemunculan pertama kata "dunia" dalam string "Halo, dunia!”, Kita dapat menggunakan kode berikut:

awk 'begin match ("halo, dunia!", /Dunia /); cetak rstart, rlength '
1awk 'begin match ("halo, dunia!", /Dunia /); cetak rstart, rlength '

Ini akan menghasilkan "8 5", Karena kata "dunia" dimulai pada posisi ke -8 dalam string dan memiliki panjang 5 karakter.

8. Tolower (String) dan Toupper (String)

Itu Tolower (String) Fungsi mengubah semua karakter huruf besar dalam string yang ditentukan ke karakter huruf kecil, sedangkan fungsi toupper (string) mengonversi semua karakter huruf kecil dalam string yang ditentukan ke karakter huruf besar. Misalnya, jika kita ingin mengonversi string “Halo, dunia!”Untuk semua huruf kecil, kita dapat menggunakan kode berikut:

AWK 'Begin print tolower ("Halo, dunia!") '
1AWK 'Begin print tolower ("Halo, dunia!") '

Ini akan menghasilkan "Halo Dunia!".

Demikian pula, jika kita ingin mengonversi string yang sama ke semua huruf besar, kita dapat menggunakan kode berikut:

AWK 'Begin print Toupper ("Halo, Dunia!") '
1AWK 'Begin print Toupper ("Halo, Dunia!") '

Ini akan menghasilkan "HALO DUNIA!".

Kesimpulan

Dalam artikel ini, kami telah menjelajahi beberapa fungsi manipulasi string yang paling umum digunakan dalam AWK. Fungsi -fungsi ini memungkinkan kami untuk melakukan berbagai tugas, seperti menemukan panjang string, mengekstraksi substring, mencari pola, membelah string menjadi array, dan mengubah teks ke kasus yang berbeda. Dengan menguasai fungsi -fungsi ini, kita dapat menjadi lebih mahir dalam bekerja dengan data teks di lingkungan UNIX dan Linux dan meningkatkan produktivitas kita sebagai analis data dan pemrogram.