Oct 30, 2023

awk

awk je moćan alat za obradu teksta i izveštavanje u Linux okruženju. Koristi se za analizu, transformaciju i formatiranje teksta, često u kombinaciji s drugim komandama i alatima. awk radi tako da razdvaja tekst na polja (delove) koristeći razdelnike (obično razmake ili tabulatore), a zatim možete primeniti različite akcije na ta polja. Evo osnovne strukture awk komande i nekoliko primera:

Osnovna struktura awk komande:

awk 'pattern { action }' fajl
  • 'pattern': Specificira obrazac koji se koristi za odabir određenih redova za obradu.
  • { action }: Specificira akciju koja se izvršava na redovima koji se podudaraju sa obrascem.
  • fajl: Specificira fajl koji se obrađuje.

Primeri korišćenja awk:

  1. Prikazivanje određenih kolona iz CSV fajla:
awk -F ',' '{print $1, $3}' csv_fajl.csv

Ova komanda će razdvajati linije u CSV fajlu koristeći zarez kao separator i prikazivati prvu i treću kolonu svake linije.

  1. Računanje proseka brojeva iz fajla:
awk '{total += $1} END {print total / NR}' brojevi.txt

Ova komanda će sabirati brojeve iz prve kolone fajla "brojevi.txt" i na kraju ispisati prosečnu vrednost.

  1. Prikazivanje linija koje sadrže određeni obrazac:
awk '/neki_obrazac/' tekst.txt

Ova komanda će prikazivati sve linije iz "tekst.txt" koje sadrže "neki_obrazac".

  1. Prikazivanje broja reči u svakoj liniji teksta:
awk '{print NF}' tekst.txt

Ova komanda će prikazivati broj reči u svakoj liniji teksta iz "tekst.txt".

awk je veoma fleksibilan alat koji vam omogućava da vršite razne transformacije i analize teksta. Može se koristiti za parsiranje i obradu podataka u različitim formatima, generisanje izveštaja, računanje statistika i još mnogo toga.

sort

sort je Linux komanda koja se koristi za sortiranje linija teksta u fajlovima ili standardnom ulazu. Osnovna svrha sort komande je da organizuje linije teksta u leksikografskom redosledu, tj. abecednim ili numeričkim redosledom, kako bi se olakšala pretraga i analiza podataka. Evo osnovne strukture sort komande i nekoliko primera:

Osnovna struktura sort komande:

sort [opcije] fajl
  • opcije: Specificiraju različite opcije i ponašanje sort komande.
  • fajl: Specificira fajl čiji sadržaj želite da sortirate.

Neki od najčešće korišćenih opcija za sort su:

  • -r ili --reverse: Ova opcija omogućava obrnuto sortiranje, tj. opadajući redosled.
  • -n ili --numeric-sort: Ova opcija omogućava numeričko sortiranje umesto leksikografskog sortiranja.
  • -u ili --unique: Ova opcija uklanja duplikate iz rezultata sortiranja.

Primeri korišćenja sort:

  1. Sortiranje fajla leksikografski:
sort fajl.txt

Ova komanda će sortirati linije u fajlu "fajl.txt" u leksikografskom (abecednom) redosledu i prikazati rezultat na ekranu.

  1. Sortiranje fajla numerički:
sort -n brojevi.txt

Ova komanda će sortirati linije u fajlu "brojevi.txt" u numeričkom redosledu, što znači da će brojevi biti sortirani po veličini.

  1. Obrnuto sortiranje fajla:
sort -r fajl.txt

Ova komanda će obrnuto sortirati linije u fajlu "fajl.txt," tj. u opadajućem redosledu.

  1. Uklanjanje duplikata iz sortiranog fajla:
sort -u fajl.txt

Ova komanda će sortirati i ukloniti duplikate iz fajla "fajl.txt," prikazujući samo jedinstvene linije.

sort komanda je korisna za sortiranje i organizaciju podataka u tekstualnim fajlovima. Može se koristiti za sortiranje velikih datoteka, eliminaciju duplikata, generisanje izveštaja i analizu podataka.

cut

cut je Linux komanda koja se koristi za izdvajanje (sečenje) određenih delova teksta iz linija teksta ili iz fajlova. cut se često koristi kada želite da izdvojite određene delove teksta, na primer, kolone iz CSV fajlova ili polja iz linija teksta. Evo osnovne strukture cut komande i nekoliko primera:

Osnovna struktura cut komande:

cut [opcije] -d DELIMITER -f FIELDS fajl
  • opcije: Specificiraju različite opcije i ponašanje cut komande.
  • -d DELIMITER: Specificira separator (delimiter) koji se koristi za razdvajanje delova teksta.
  • -f FIELDS: Specificira polja (kolone) koja želite da izdvojite.
  • fajl: Specificira fajl iz kojeg izdvajate podatke.

Neki od najčešće korišćenih opcija za cut su:

  • -d ili --delimiter: Ova opcija specificira separator (delimiter) koji se koristi za razdvajanje polja u linijama teksta.
  • -f ili --fields: Ova opcija specificira koja polja (kolone) se izdvajaju iz linija teksta. Može se koristiti sa jednim ili više brojeva polja, npr. -f 1,3 će izdvojiti prvo i treće polje.

Primeri korišćenja cut:

  1. Izdvajanje prve kolone iz CSV fajla sa zarezom kao separatorom:
cut -d ',' -f 1 csv_fajl.csv

Ova komanda će izdvojiti prvu kolonu iz CSV fajla "csv_fajl.csv" koristeći zarez kao separator.

  1. Izdvajanje drugog i trećeg polja iz fajla sa razmacima kao separatorom:
cut -d ' ' -f 2,3 tekst.txt

Ova komanda će izdvojiti drugo i treće polje iz linija teksta u fajlu "tekst.txt" koristeći razmak kao separator.

  1. Izdvajanje prvih 10 karaktera iz svake linije teksta:
cut -c 1-10 tekst.txt

Ova komanda će izdvojiti prvih 10 karaktera iz svake linije teksta iz "tekst.txt".

cut komanda je korisna za sečenje (izdvajanje) delova teksta iz fajlova ili linija teksta. Može se koristiti za analizu, transformaciju i obradu tekstualnih podataka.