Süntaks

Tabel annab lühiülevaate regulaaravaldise süntaksist. Täpsemalt võib vaadata näiteks siit

Muster

info

Näide

Tekst (kust otsitakse)

Leiab

Ei leia

täht ise

info

„abc“

„abc“

„aba“

.

suvaline sümbol

„a.bc“

„a#bc“

„abc“

^

algus

„^abc“

„abcde“

„dabc“

$

lõpp

„abc$“

„dabc“

„abcd“

?

0 või üks kord

„ab?c“

„ac“

„abc“

„abbc“

*

0 või rohkem

„ab*c“

„ac“

„abc“

„abbc“

„ccbbaa“

+

1 või rohkem

„ab+c“

„abc“

„abbc“

„accbcc“

„ac“

{m}

kordub m korda

„ab{2}c“

„aabbcc“

„abbc“

„abc“

„abbbc“

{m, n}

kordub m kuni n korda

„ab{2,3}c“

„abbcc“

„abbbcc“

„aabbbbcc“

„abc“

{m,}

kordub m kuni ükskõik kui

palju korda

„ab{2,}c”

“abbc”

“abbbbbc”

„abc“

„ac“

\

escape

Et kasutada regex erisümboleid

otseses tähenduses, näiteks,

et „.“ tähistaks punkti,

mitte suvalist tähte

„ab\.c“

„ab.c“

„ab#c“

[..]

sobiv hulk

hulk, millest otsida

„[ab]cd“

„acd“

„bcd“

„ccdc“

„cd“

[..-..]

sobiv vahemik

hulk, millest otsida

„[a-d]ef“

„aef“

„def“

„ef“

„abc“

[..\-]

miinus hulgas

„[a\-d]ef“

„def“

„-ef“

„ef-“

„cef“

(..)

grupeerimine

„(ab)?cd“

„cd“, „acde“

„abcde“, „abbcd“

„ab“

„abc“

|

või

„(ab|cd)+ef“

„abefg“, „cdefg“

„ababef“, „cdcdef“

„acef“, „efg“

„aef“, „def“

\1, \2

1., 2. sulu kattumine

„(.+) \1“

„a a“, „11 12“,

„55 55“,

„aa“, „11 21“

\w

w nagu ‚word‘. Tähed, numbrid,

alakriips

„\w+“

„abc“ „1a“

„.,~@“, „ „

\W

\w vastand. Sama mis

[^a-zA-Z0-9_]

„\W+“

“.”, “@”, “ “

“h”, “ot”

\s

s nagu ‚space‘. Tühik, tabu-

laator, reavahetus, alakriips

„a\sb“

„a b“ „a\tb“

„ab“, „ab“

\S

\s vastand

„a\Sb“

„ab“ „a_b“

„a b“, „a\tb“

\d

d nagu ‚digit‘. Numbrid

„\d+i“

„23i“

„i7“

\D

\d vastand

„\D+i“

“i”, “.”, “ “

“27”, “2i”

\b

b ehk ‚boundary‘. Sõna peab

lõppema eeltoodud otsingu-

mustriga.

„d\b”

„add“

„adidas“

\B

\b vastand

„d\B“

„abc“

„word“

[^..]

ei kuulu hulka

„[^ab]+c“

„ccc“, „dec“

„abc“, „bbc“

(?=…)

positiivne lookahead

„ab(?=cd)“

„abcd“, „abcda“

„abdd“, „abc“

(?!…)

negatiivne lookahead

„ab(?!cd)“

„abc“, „abcccc“

„oabcd“, „abcdd“

(?<=…)

posiitvne lookbehind

„(?<=cd)ok“

„cdok“, „ccdok“

„cddok“

(?<!…)

negatiivne lookbehind

„(?<!cd)ok“

„cddok“, „ok“, „dok“

„cdok“, „ccdok“