정규식
정규식은 프로그래밍에서 특정한 규칙을 가진 문자열의 집합을 뜻합니다.
정규식 없이 영어에서 모든 알파벳의 문자를 만들고 싶다면 'abcdef...' 하나하나 다 코드 안에 쳐야합니다.
하지만 정규식을 사용하면 아주 간단합니다.
정규식은 모듈이어서 먼저 가지고 와야 합니다.
import re #영어로 Regular Expression입니다. (re)
문자의 값 맞히기
re.match()
메서드를 사용하면 어떤 두 문자에서 동일한 시작 부분을 알 수 있습니다.
문자의 값 찾기
match()
는 문자의 시작 부분을 알 수 있지만 re.search()
메서드를 사용한다면 전체 값에서의 같은 부분을 계산할 수 있습니다.
정규식 문자
정규식을 진짜로 사용하기 위해서는 다음과 같은 문자를 이용해야 합니다.
[a-b]
[abc]
: a, b, 또는 c[^abc]
: a, b, c 제외.
: 임의의 알파벳:"h."
는 ha, hb, hc, ... hz 다입니다^
: 단어 중 다음 패턴으로 시작하는지:"^hello"
: hello로 시작하는 단어가 있는지$
: 단어 중 다음 패턴으로 끝나는지:"$hello"
: hello로 끝나는 단어가 있는지