Svi mislimo da nam je ovaj pojam jasan, ali ne možemo precizno da ga objasnimo. Danas ćemo mi probati.
Rudarenje podataka bi prostim rečima moglo da se kaže i kopanje po podacima. Traganje za nekim otkrićem ili zaključkom u okeanu informacija.
Zamislite da se nalazite u biblioteci među stotinama polica sa kuvarima, a tražite recept za pitu sa mesom kojom nameravate da zadivite goste. Nemoguće je da ručno prelistate svaku knjigu, pronađete recept za pitu i razmislite da li bi vam odgovarao. Zato na scenu stupa rudarenje podataka. Pomoću posebnih alata i modela pregledaćemo sve knjige, recepte, njihove sastojke i ocene prethodnih čitalaca i naći ćemo upravo taj jedan savršen recept.
Upravo tako rudarenje podataka deluje i u drugim oblastima.
Nalik detektivima stručnjaci za analizu podataka mogu da razotkriju veze između pojava koje nikada ne bi pretpostavili. I na osnovu toga dolaze do dragocenih zaključaka za svoje poslodavce. Na primer, mogu da predvide vreme i mesto kada će neki korisnik da naruči hranu preko aplikacija. Ili da, na osnovu nečijeg stanja ili ponašanja naslute bolest koju ima. Primene su raznorazne.
Postoji nekoliko faza u rudarenju podataka. Podaci se najpre prikupljaju i skladište kako bi mogli da se lakše obrađuju. Potom se vrši modeliranje. Koriste se napredni algoritmi za otkrivanje obrazaca i uzročnosti. U sledećem koraku prave se modeli za predviđanje i donošenje odluka.
Naposletku je bitno kazati da postoje i loše strane.
U savršenom slučaju, svako treba da zna kako se njegovi podaci koriste i privatnost mora da bude zagarantovana.
Ipak ovo često nije slučaj, samim tim i zbog toga što ne znamo koji sve zaključci mogu da izrone iz podataka. Iz nečega bezazlenog može se stvoriti prilika da zaradimo dosta novca. Stoga rudarenje podataka predstavlja mač sa dve oštrice.