포직스(POSIX) 문자 클래스
Programming/RegEx 2013. 5. 12. 18:14 |포직스는 줄여 쓰기를 나타내는 또 다른 형태인데, 전부는 아니지만 많은 정규 표현식 구현에서 지원한다.
POSIX 문자 클래스
POSIX 문자
[:alnum:] | [A-Za-z0-9] 알파벳 문자와 숫자로 이루어진 문자열 |
[:alpha:] | [A-Za-z] 알파벳 문자 |
[:blank:] | [ /x09] 스페이스와 탭(\t ]와 같다) |
[:digit:] | [0-9] 숫자 |
[:graph:] | [!-~] 공백이 아닌 문자 (스페이스, 제어 문자들을 제외한 문자) |
[:lower:] | [a-z] 소문자 |
[:print:] | [-~] [:graph:] 와 유사하지만 스페이스 문자를 포함 |
[:punct:] | [!-/:-@[-{-~] 문장 부호 문자([:alnum:]이나 [:cntrl:]가 포함되지 않은 모든 문자 |
[:space:] | [ \t\v\f] 모든 공백 문자(newline 줄바꿈, 스페이스, 탭) |
[:cntrl:] | 컨트롤 제어 문자 (아스키 0번부터 31, 127번) |
[:upper:] | [A-Z] 대문자 |
[:xdigit:] | [0-9a-fA-F] 16진수에서 사용할 수 있는 숫자 |
※ POSIX
이식 가능 운영체제 인터페이스(portable operating system interface), 또는 포직스는 서로 다른 유닉스 os의 공통 api 를 정리하여, 이식성이 높은 유닉스 응용 프로그램을 개발하려는 목적으로 IEEE가 책정한 애플리케이션 인터페이스 규격이다.
RegEx: [[:xdigit:]]\+
여기서 사용한 정규 표현식이 [[로 시작해서 ]] 로 끝남을 유의하자. 이는 포직스 클래스를 사용할 때 매우 중요하고 필수적이다. 포직스 클래스는 [:로 시작해 :] 로 끝나기 때문에 우리가 사용하는 포직스 문법은 :xdigit: 가 아니라 [:xdigit:] 이다.
따라서 바깥에 있는 대괄호는 집합을 정의하고, 안에 있는 대괄호는 포직스 클래스 자체를 나타내는 부분이다.
'Programming > RegEx' 카테고리의 다른 글
구간 지정 (0) | 2013.05.12 |
---|---|
반복 찾기(+, *) 와 '?' 메타 문자 (0) | 2013.05.12 |
메타 문자 사용 (0) | 2013.05.06 |
문자 집합으로 찾기 (0) | 2013.05.06 |
정규 표현식(Regualr Expression) (0) | 2013.05.05 |