본문 바로가기
개발/기본) 기본기

기본기) 정규표현식 RegExp-(Regular Expression)

by 테샤르 2019. 11. 6.

정규표현식 RegExp-(Regular Expression)

 

 

정규 표현식 또는 정규식은 특정한 규칙을 가진 문자열을 표현하는데 사용하는 형식 언어이다.

정규 표현식은 문자열을 검사하는데 많이 사용한다.

 

반응형

 

정규 표현식의 기본 문법은 여러가지가 있는데 대표적인것들은 다음과 같다.

 

1. 패턴 그대로의 검색

2. 메타 문자 및 한정된 검색

3. 그룹으로의 검색

 

문자 의미
^
문자열의 시작. [...] 내에서 쓰이면 “일치하지 않는“의 의미가 된다.

^http는 문자열의 맨 처음에 http가 온 경우에 매치한다. (중간에 http가 나타난 경우는 매치하지 않음)
$ 문자열의 끝 them$은 문자열이 them으로 끝난 경우에 them에 매치한다.
\b 단어의 경계. 공백, 탭, 컴마, 대시 등이 올 수 있다.
\bplay\b는 play 의 양 끝에 단어 경계가 오는 경우에만 play에 매치한다. 따라서 “playground”의 play에는 매치하지 않는다.
\B
\b가 아닌 것. 정규식 메타문자에서는 대소문자가 바뀌면 반대의 의미를 지니는 것들이 있다.

\bplay\B는 play뒤에 단어 경계가 아닌 것이 왔을 때 play에 매치한다. 따라서 play에는 매치하지 않지만 playground, playball의 play에는 매치한다.
\s 공백문자 공백, 탭에 매치한다.
\S 공백문자가 아닌것
\d 숫자. [0-9]와 같다.
\D 숫자가 아닌 것. [^0-9]와 같다.
\w 단어를 만들 수 있는 글자. 알파벳 대소문자, 숫자, 언더스코어가 포함된다.
\W not \w . 위의 것이 아닌 글자들이 해당된다.
\n 개행문자. 캐리지리턴은 \r에 매치한다. 그외에 탭 문자는 \t 에 매치
\ 이스케이프용 문자. 정규식 상의 특별한 의미가 있는 기호들을 문자 그대로 사용할 때 쓴다. \., \*, \$, \( 등과 같이 메타 문자를 리터럴하게 매치할 때 사용.
. 임의의 문자 1개에 대응한다.

 

 

정규 표현식은 문자열을 처리하는 과정에서 많이 사용하기 때문에 알고 있는게 좋다.

 

반응형

댓글