[JS] 정규 표현식
정규표현식
문자열에서 특정 문자 조합을 찾기 위한 패턴
정규식 만드는 법
1. 정규 표현식 리터럴 : 슬래시(/)패턴으로 감싸는 방식
const regex = /pattern/flags;
- 스크립트를 불러올 때 컴파일 되므로, 실행 도중에 바뀌지 않는 패턴일 때 사용하는 것이 좋음.
- 일반적인 방법이며, 리터럴을 사용하면 정규 표현식 객체가ㅏ 생성된다.
2. RegExp 객체의 생성자 호출 : RegExp 객체의 생성자를 호출하여 만드는 방식
const regex = new RegExp('pattern',flags);
- 런타임에 컴파일 되기 때문에 실행 도중에 바뀔 수 있는 패턴이나, 사용자 입력에 따라서 유동적으로 바뀔 수 있을 때 활용하는 것이 좋음.
플래그
- 검색 모드
- 정규 표현식의 옵션이므로 선택적으로 사용이 가능하다.
- 순서와 상관없이 하나 이상의 플래그를 동시에 설정할 수 있다.
- 플래그를 사용하지 않는 경우에는 문자열 내 검색 대상이 1개 이상이더라도 첫번째 조건 대상만을 검색하고 종료하게 된다.
🚩 대표적인 플래그
i (ignore case) : 대소문자를 구별하지 않고 검색한다.
g (global) : 문자열 내의 모든 패턴을 검색한다. (문자열에서 한개만 찾는 것이 아닌 해당하는 모든 것을 찾아줌)
m (multi line) : 문자열의 행이 바뀌더라도 검색은 계속한다.
s (single line) : \n까지 포함한 문자
Pattern 만드는 법
[Groups and Ranges]
1. | - or
const regex = /red|blue/flags
- red 도는 blue인 문자열을 가진 패턴
2. () - 그룹
const regex = /on(1|2)/flags
- on뒤에 1이나 2가 오는 문자열을 매치시겠다.
3. [] - 문자셋
const regex = /on[123456789]/flags
const regex = /on[1-9]/flags
- 만약 그룹에서 1,2 둘 중에 하나가 아니라 1 ~ 10까지인 경우
4. [^] - 부정 문자셋
const regex = /^[1-9]/flags
- 1~9까지 빼고 매치시키는 경우
Quantifiers
1. ? - zero or one : 특정 문자 뒤에 두게 되면 있는 것, 없는 것 둘다 매치 시킨다.
const regex = /ones?/flags
- 이렇게 두었다면 s 가 있는 것, 없는 것 둘다 매치가 된다.
- 즉, one과 ones 두개가 매치 된다.
2. * - zero or more
const regex = /ones*/flags
- one, ones, oness, onesssssss 이런것들이 매치
3. + - one or more : 없는것은 매치하지 않으며 그 문자는 반드시 하나 이상
const regex = /ones+/flags
- one은 매치키지 않는다.
4. {n} - n번 반복 : 뚜렷한 개수를 잡아내고 싶은 경우
const regex = /ones{3}/flags
- onesss
const regex = /(abc){3}/flags
- abcabcabc
5. {min, max} - 최대 최소
const regex = /ones{3,5}/flags
- onesss, onessss, onesssss 만을 매치시킨다.
const regex = /ones{3,}/flags
- 최대를 비워둔다면, 3번 이상 들어간 것을 매치
- 최소를 비워둔다면 그 반대
Boundary-type
1. \b - 단어 경계
const regex = /\bch/flags
- 단어 기준으로 ch로 시작하는 단어만을 매치시킨다.
- /b를 뒤에 두면, 끝나는 것을 매치
2. \B - 단어 경계 제외
const regex = /\Bch/flags
- \b를 제외한것을 매치
- string = cheese cheeses check is checking
3. (^) - 문장의 시작 : 문장 기준으로 매치
const regex = /^is/flags;
cheese cheeses check is checking
checking cheese cheeses is check
cheese cheeses check is checking
is check cheese cheeses checking
4. $ - 문장의 끝
Character classes (특정 문자)
1. (\) - 특수 문자가 아닌 문자
const regex = /right\?/flags;
- right? 라는 문자를 찾고 싶을 때
2. (.) - All
const regex = /./flags;
- 전부 다 매치
(\d) - 모든 숫자
(\D) - 모든 숫자 제외
(\w) - 모든 문자 : 특수문자를 제외한 영어, 한글, 숫자
(\W) - 모든 문자 제외 : 문자에 해당하는 것을 제외한 모든 것
(\s) - 모든 공백
(\S) - 모든 공백 제외