본문으로 건너뛰기

정규식

정규식은 프로그래밍에서 특정한 규칙을 가진 문자열의 집합을 뜻합니다.

정규식 없이 영어에서 모든 알파벳의 문자를 만들고 싶다면 'abcdef...' 하나하나 다 코드 안에 쳐야합니다.

하지만 정규식을 사용하면 아주 간단합니다.

정규식은 모듈이어서 먼저 가지고 와야 합니다.

import re #영어로 Regular Expression입니다. (re)

문자의 값 맞히기

re.match() 메서드를 사용하면 어떤 두 문자에서 동일한 시작 부분을 알 수 있습니다.

문자의 값 찾기

match()는 문자의 시작 부분을 알 수 있지만 re.search() 메서드를 사용한다면 전체 값에서의 같은 부분을 계산할 수 있습니다.

정규식 문자

정규식을 진짜로 사용하기 위해서는 다음과 같은 문자를 이용해야 합니다.

  1. [a-b]
  2. [abc]: a, b, 또는 c
  3. [^abc]: a, b, c 제외
  4. .: 임의의 알파벳: "h."는 ha, hb, hc, ... hz 다입니다
  5. ^: 단어 중 다음 패턴으로 시작하는지: "^hello": hello로 시작하는 단어가 있는지
  6. $: 단어 중 다음 패턴으로 끝나는지: "$hello": hello로 끝나는 단어가 있는지