Regularni izrazi su obrasci koji sadrže obične karaktere (slova i brojeve) i specijalne karaktere (kao što su simboli * i $). Koriste se kada želimo da pronađemo, zamenimo ili izvučemo podatke koji zadovoljavaju taj obrazac. Takođe se koriste kada potvrđujemo polja za unos lozinki ili adresa e-pošte, kada je potrebno da unos prati određen format.
Modul u Pajtonu koji omogućava primenu regularnih izraza u Pajtonu je re, premda postoji i noviji paket regex. Modul re je verovatno već instaliran, treba samo da ga pozovete.
Regularni izraz može da bude u izvornom obliku, ili da ima prefiks r i bude pod navodnicima. R je oznaka za raw string (čisti tekst).
Funkcije koje rade sa regularnim izrazima
re.findall( ) Traži sva moguća podudaranja regularnog izraza i vraća ih poređane u listi.
re.search( ) Traži prvo podudaranja i vraća objekat koji ga predstavlja
re.match( ) Slična kao search, ali vraća rezultat samo ako je ono što tražimo na početku liste.
re.split( ) Razdvaja niz na tačkama gde je izraz koji tražimo prisutan.
re.sub( ) Zamenjuje izraz koji tražimo drugom reči ili karakterom.
Metakarakteri sa specijalnom namenom
Veliki je broj karaktera koji se koriste kako bi zamenili druge karaktere. Predstavićemo samo neke od njih, a ceo spisak imate ovde.
. (tačka) Zamenjuje bilo koji karakter, ali samo jedan karakter.
[] uglaste zagrade. Koriste se za podudaranje sa bilo kojim znakom u zagradi.
*Zvezdica. Ovaj metakarakter zamenjuje nijedan ili više obrazaca pretrage. Drugim rečima, ono što tražimo može da se uopšte ne pojavljuje ili da se pojavljuje više puta.
\ Obrnuta kosa crta Praćenja određenim znakom ima različito značenje
- \d Zamenjuje broj (0–9)
- \D Zamenjuje bilo koji karakter koji nije broj.
- \w Alfanumerički karakter, malo slovo, veliko, slovo ili broj.
- \W Zamenjuje karakter koji nije alfanumerički.
- \s Zamenjuje prazan karakter (razmak)
- \S Zamenjuje bilo koji karakter koji nije razmak.
+ Plus Zamenjuje jedan ili više obrazaca pretrage.