Regularne wurazy
Hačrunjež wobsteji hornjoserbšćina kaž kóžda rěč z tysacow wšelakich słowow, namakamy přiwšěm tójšto regularnych wospjetowanjow. Tak kónča wšitke formy kaž čitajće, chwatajće, dawajće na ‑ajće. Njeby móžno było, wšitke tute formy w korpusu namakać, hdyž by so pytanje za kóždy werb dyrbjało jednotliwje přewjesć. W tajkich padach su regularne wurazy wulka pomoc. Jich wužiwanje so w slědowacej tabulce wujasni.
| wuraz | wujasnjenje | wuznam | přikład | namaka (na př.) |
|---|---|---|---|---|
. |
Dypk naruna kóždežkuli znamješko. | někajke znamješko | .uby |
luby, zuby, ruby… |
[ ] |
W róžkojtymaj spinkomaj definuje so wuběr pytanych znamješkow, z kotrychž dyrbi so jedne namakać. | někajke w nimaj stejace znamješko | [dTR]om |
dom, Tom, Rom |
[ - ] |
W róžkojtymaj spinkomaj móže so tež interwal definować. Tole stanje so z pomocu wjazawki. | interwal pismikow abo ličbow | [a-z] |
někajki pismik wot a do z (bjez diakritiskich znamješkow) |
[a-zčćěłńóřšžź] |
kóždy hsb. pismik | |||
[0-9] |
0, 1, 2, 3, 4, 5, 6, 7, 8, 9 | |||
[j-m]už |
juž, kuž, luž, muž (jeli tajke formy w korpusu eksistuja) | |||
[^ ] |
Třěška (cirkumfleks) wuzamkuje znamješka, kotrež steja w róžkojtymaj spinkomaj. | žene z tutych znamješkow | [^dl]uby |
zuby, ruby atd., ale nic duby, luby |
[^0-9] |
kóždežkuli znamješko, kotrež njeje cyfra | |||
( | ) |
W jednorymaj spinkomaj steji lisćina alternatiwnych wurazow abo znamješkow, kotrež su přez padorunu smužku wot so dźělene. | alternatiwy | (D|d)om |
Dom, dom |
([Ss]|[Tt])am |
Sam, sam, Tam, tam | |||
\ |
Nawopačna nakósna smužka (backslash) před znamješkami, kotrež maja w regularnych wurazach specielny woznam (na př. ?*+()[]{}. a tež blackslash sam), wuskutkuje, zo so tute znamješka jako normalne tekstowe jednotki interpretuja. |
specielny woznam znamješka ignorować | \.\.\.\? |
...? |
awtor\*ki |
awtor*ki | |||
[j\-m]už |
juž, -už, muž (jeli tajke formy w korpusu eksistuja) | |||
\\ |
nawopačnu nakósnu smužku \ | |||
| Nawopačna nakósna smužka (backslash) před znamješkami, kotrež w regularnych wurazach specielny woznam nimaja (na př. jednore pismiki a ličby), wuskutkuje, zo tute znamješka specielny woznam dóstanu. | znamješku specielny woznam dać | \d |
cyfru (jendź. „digit“)
0, 1, 2, 3, 4, 5, 6, 7, 8, 9 |
|
\D |
něsto nimo cyfry | |||
\w |
pismik wot a do z (jendź. „word character“) | |||
\W |
něsto nimo pismika wot a do z | |||
\s |
prózdne znamješko kaž prózdnota, tabulator, łamanje rjadka (jendź. „white space“) | |||
\S |
něsto nimo prózdneho znamješka | |||
| wospjetowanja (kwantifikatory) | ||||
? |
Před prašakom stejace znamješko nul- abo jónkróć wustupuje. | 0 abo 1 króć | za? |
z, za |
* |
Před hwěžku (asteriskom) stejace znamješko nul- abo wjace króc wustupuje. | 0 abo wjace króć | hm* |
h, hm, hmm, hmmm… |
+ |
Před znamješkom plus stejace znamješko znajmjeńša jónu wustupuje. | 1 abo wjace króć | hm+ |
hm, hmm, hmmm… |
{n} |
W kwaklatymaj spinkomaj zapisana ličba n podawa, kak husto dyrbi wuraz abo znamješko před spinkomaj wustupować. | n króć | dom.{2} |
domom, domoj, domčk… |
{m,n} |
W kwaklatymaj spinkomaj zapisanej a přez koma wot so dźělenej ličbje m a n podawatej, kak husto wuraz abo znamješko před spinkomaj dyrbi minimalnje a smě maksimalnje wustupować. | m do n króć | .{3,7} |
kóždy znamješkowy slěd, kotryž wobsteji z třoch do sydom znamješkow, na př. kóžde słowo, kótrež ma tři do sydom pismikow |
hm{2,4} |
hmm, hmmm, hmmmm | |||
Někotre přikłady za pytanje
dom.*- namaka wšitke słowa, kiž započinaja z dom-, na př. dom, domašk, domoj, domowina atd.
dom[auy]*- namaka dom, doma, domu, domy
dom[auy]+- namaka doma, domu, domy
ru[kc][aieu]- namaka ruka, ruki, ruce, ruku (ale tež: ruci, rucu atd.)
ru(ka|ki|ce|ku|komaj|kow)- namaka ruka, ruki, ruce, ruku, rukomaj, rukow (ale nic: ruk, rukom, rukam, rukami atd.)
.+ami.+- namaka wšitke słowa, kiž maja srjedźa (ale nic na spočatku abo kóncu) -ami-, na př. ramik, dynamika, pyramida atd.
[zſ]a(s|ſſ|ß)o- namaka zaso, ſaſſo, ſaßo (ale tež: zaſſo, zaßo, ſaso)
.*a[rŕ]ski- namaka wšitke słowa, kiž kónča na -arski abo -aŕski, na př. chěžkarski, khěžkaŕski atd.
.*arskemu- namaka wšitke słowa, kiž kónča na -arskemu, na př. pjekarskemu, lěkarskemu, koparskemu atd.
.*arske[hm][ou]- namaka wšitke słowa, kiž kónča na -arskeho, -arskemu, ale tež -arskehu, -arskemo
.*ow(eho|emu|oh|om)- namaka wšitke słowa, kiž kónča na -oweho, -owemu, -owoh, -owom