Osobama vičnim programiranju više odgovara da podatke iz Excelovih sveski analiziraju putem koda, ne iz samog Excela. Lakše je da napišemo sopstvenu funkciju umesto da balansiramo postojećim. Nekada se to radilo pomoću VBA jezika, ali njega sada malo ko zna. Svi prelaze na Pajton.
Koji paketi sa dobri za rad sa Excelom?
pandas
Najbrže rešenje ako izvlačite podatke iz Excela ili ih u njega upisujete.
Pomoću funkcije read_excel podatke izvlačimo u tabelarnom obliku, baš onako kako i izgledaju u Excelu. Obratno, to_excel piše podatke u Excel.
Za uvoz podataka treb a da navedemo ime sveske (sheet-a). Tabela koja u Excelu izgleda ovako.
Nakon uvoza izgleda ovako:
Funkcija read_excel ima veliki broj parametara za prilagođeni uvoz. Na primer, možemo da preskočimo određen broj redova.
Ili da uvezemo tačno određene kolone.
Imajte u vidu da pandas lepo čita samo one podatke koji su sređeni. U slučaju da postoje prazne ćelije između vrednosti, krajnji rezultat je haotičan.
Na primer, tabela koja izgleda ovako (vidite da imamo viška x i y).
Nakon uvoza u Pajton izgledaće ovako.
openpyxl
Paket je dosta moćniji, ali i složeniji. Podacima i tabelama pristupamo tačno na osnovu njihove adrese. Radi sa xlsx, xlsm, xltx i xltm datotekama. Njime čitamo, ali i menjamo Excel datoteke, radimo sa grafikonima, stilovima, formatiranjem i raščlanjivanjem.
Mogući nedostatak je to što je može biti spor kada rukujemo sa velikim datotekama.