정규 표현식은 특정한 규칙을 가진 문자열 집합을 표한하는 데 사용하는 형식 언어이다.
^ | 문자열의 시작 |
$ | 문자열의 종료 |
. | 줄바꿈을 제외한 임의의 한 문자 |
[abc] | []사이에 있는 임의의 한 문자, abc 중 하나 |
[^abc] | []사이의 있는 문자를 제외한 다른 문자, abc를 제외한 다른 글자 |
[a-zA-Z] | a 부터 z까지의 소문자 알파벳 이거나 A 부터 Z까지의 대문자 알파벳 중의 하나 |
[a-d[m-p]] | a 부터 d까지, 또는 m 부터 p까지 중에 하나 [a-dm-p] |
[a-z&&[def]] | d, e, f 중의 하나 (교집합) |
{} | 횟수나 범위 |
re* | 앞의 표현식이 0회 이상 |
re+ | 앞의 표현식의 1회 이상 |
re? | 앞의 표현식이 0회 또는 1회 |
re{n} | 앞의 표현식이 n번 |
re{n, m} | 앞의 표현식이 최소 n회 최대 m회 |
a|b | a or b |
\w | 단어와 일치 |
\W | 비 단어와 일치 |
\s | 공백 문자와 일치, ( [\t \n \r \f] 와 동일 ) |
\S | 비 공백 문자와 일치 |
\d | 숫자와 일치, [0-9]와 일치 |
\D | 숫자가 아닌 모든 문자와 일치 |