Pandas je Pajton biblioteka za rad sa podacima. Popularnost joj raste iz dana u dan, a sa podacima baratate kako hoćete.
Sa njom možemo da učitavamo podatke iz različitih formata (CSV, JSON, Excel …), i iz baza podataka. Potom možemo da čistimo, grupišemo i prerađujemo, vršimo osnovnu analizu i prikazujemo.
Efikasniji je od Excela, i za razliku od njega daje prostora za automatizaciju.
Jedina mana biblioteke je što ne može da radi sa distribuiranim podacima, to jest podacima koji se nalaze na više uređaja ili servera. Svi moraju biti na uređaju na kom radimo.
Kako izgleda okvir podataka u pandasu?
Biblioteka pandas radi samo sa podacima prikazanim u obliku tabele. Dakle mora da ima redove i kolone, s tom razlikom što prva kolona sadrži indekse. Indeks je uglavnom redni broj, ali ne mora da bude tako. Kolona i indeks daju jedinstvenu adresu svakog podatka.
Kako pravimo prazan okvir podataka?
Vidimo koliko su indeksi i kolone bitni.
Kako uvozimo niz podataka?
Prvi red su indeksi, a na prvom mestu drugog reda stoji nula, jer nemamo ime kolone.
Stoga je dodajemo.
Kako pravimo okvir podataka sa više kolona?
Okvir podataka možemo da napravimo i iz rečnika
Prilično zgodno jer odmah dobijemo imena kolona. Ne moramo naknadno da ih dodajemo.
Okvir podataka iz serije podataka
Pandas radi i sa vrstom podataka koje se zovu Series. To su jednodimenzionalni nizovi koji mogu sa sadrže bilo koji tip podatka. I oni mogu da se pretvore u okvir podataka.